무슨 일이 일어났나
Google이 공식 블로그에서 Gemini API File Search를 멀티모달로 확장했다고 밝혔어. 2026년 5월 5일 업데이트는 3가지야.
- 이미지와 텍스트를 같은 인덱스에서 처리
- 쿼리 시점 메타데이터 필터링
- 페이지 단위 인용 반환
왜 이게 일어났나
RAG를 직접 만든 팀은 이미지가 섞인 PDF·슬라이드를 인덱싱할 때 OCR이나 별도 비전 모델을 붙여야 했어. 이번 업데이트는 그 전처리 부담을 API 쪽으로 줄일 수 있는지 시험하게 하고, department: Legal 같은 라벨로 검색 범위를 좁히게 해.
어떤 의미인가
실무 의미는 “문서 RAG에 이미지 처리를 따로 둘 것인가”를 다시 보는 데 있어. 페이지 인용은 답변 근거를 감사할 때 유용하고, 메타데이터 필터는 부서·문서 유형별 검색 노이즈를 줄이는 데 쓸 수 있어.
주의할 점
자체 발표라 OpenAI File Search나 Anthropic Files API와의 독립 벤치마크는 없어. 이미지 포맷·해상도 한계, 토큰 비용, 지연 시간은 도입 전에 자체 평가 셋으로 다시 측정해야 해.