무슨 일이 일어났나

Google이 공식 블로그에서 Gemini API File Search멀티모달로 확장했다고 밝혔어. 2026년 5월 5일 업데이트는 3가지야.

  • 이미지와 텍스트를 같은 인덱스에서 처리
  • 쿼리 시점 메타데이터 필터링
  • 페이지 단위 인용 반환

멀티모달 처리는 Gemini 임베딩 2가 맡아.

왜 이게 일어났나

RAG를 직접 만든 팀은 이미지가 섞인 PDF·슬라이드를 인덱싱할 때 OCR이나 별도 비전 모델을 붙여야 했어. 이번 업데이트는 그 전처리 부담을 API 쪽으로 줄일 수 있는지 시험하게 하고, department: Legal 같은 라벨로 검색 범위를 좁히게 해.

어떤 의미인가

실무 의미는 “문서 RAG에 이미지 처리를 따로 둘 것인가”를 다시 보는 데 있어. 페이지 인용은 답변 근거를 감사할 때 유용하고, 메타데이터 필터는 부서·문서 유형별 검색 노이즈를 줄이는 데 쓸 수 있어.

주의할 점

자체 발표라 OpenAI File Search나 Anthropic Files API와의 독립 벤치마크는 없어. 이미지 포맷·해상도 한계, 토큰 비용, 지연 시간은 도입 전에 자체 평가 셋으로 다시 측정해야 해.