Google AI 검색이 콘텐츠를 읽는 방식 실증 분석

5 hours ago 2

SEO 전문가 Dan Petrovic(DEJAN)이 Google Gemini API의 원시 데이터를 분석해 Google AI 검색(Gemini 기반) 이 웹페이지에서 어떤 문장을 답변 근거(grounding snippet)로 뽑아내는지 처음으로 실증적으로 밝혔습니다.

주요 발견 포인트:

  • 질문 → query fanout으로 여러 하위 쿼리로 분해
  • 각 하위 쿼리별로 5~20개 페이지 선정 → 문장 단위로 쿼리 관련도 점수 매김
  • 가장 중요한 기준 = 문장의 의미적 유사도 (쿼리와 무관한 섹션은 통째로 무시)
  • 도입부(첫 문단) 는 관련도 낮아도 거의 무조건 추출됨 → 강한 lead bias 존재
  • 목차, 헤더, 코드 조각 등 구조적 요소도 일반 문장처럼 취급되어 점수 부여됨
  • 선택된 문장들은 …으로 연결되어 스니펫(snippet) 구성 → 최종 답변 생성 시 인용 근거로 사용

결론적으로 Google AI 검색은 AI의 자유로운 해석이 아니라 문장 수준의 정밀한 관련도 점수화 + 선별 과정을 거칩니다.
핵심 메시지를 도입부에 강하게 배치하고, 문장 하나하나가 쿼리와 의미적으로 밀접해야 AI 답변에 인용될 확률이 높아진다는 실질적인 인사이트를 줍니다.

Petrovic은 이 메커니즘을 모방한 데모 툴도 공개했습니다.

https://aisparkup.com/posts/9618

Read Entire Article