이 용어는 어디까지 신뢰할 수 있나요?

Gemini API File Search는 Gemini API에서 파일을 올려 검색 가능한 store로 만들고, 모델 응답이 그 파일 내용을 근거로 쓰게 해 주는 RAG 도구야. 새 Gemini 모델명이 아니라, 문서와 이미지를 API 호출 흐름에 붙이는 검색 계층이라고 보면 돼.

2026년 5월 5일 Google 발표에서 이 도구는 세 가지가 크게 바뀌었어.

멀티모달 검색: 텍스트와 이미지를 같은 검색 흐름에서 다룰 수 있어.
커스텀 메타데이터: department: Legal 같은 키-값을 붙여 질의 범위를 좁힐 수 있어.
페이지 단위 인용: PDF 같은 문서에서 어느 페이지를 근거로 썼는지 보여 줄 수 있어.

실제로 무엇을 하나

사용 흐름은 비교적 단순해. 개발자가 file search store를 만들고, PDF나 이미지가 섞인 자료를 올리면 Gemini API가 그 자료를 인덱싱해. 그다음 generate_content 호출에 File Search tool을 붙이면 모델이 store에서 관련 조각을 찾아 답변에 넣어. 검색된 조각은 grounding_metadata로 따라오고, 페이지가 있는 문서에서는 page_number, 이미지 조각에서는 media_id 같은 근거 정보도 받을 수 있어.

여기서 중요한 변화는 검색 대상이 텍스트 파일만이 아니라는 점이야. 다만 Gemini Embedding 2의 입력 한도와 File Search가 지금 받아 주는 파일 형식은 분리해서 읽어야 해.

임베딩 모델 범위: Gemini Embedding 2 소개 글은 한 호출에서 최대 8,192 text tokens, 6 images, 120 seconds video, 180 seconds audio, 6 pages of PDFs를 다룬다고 설명해.
File Search 범위: 공식 문서는 텍스트 임베딩과 이미지/멀티모달 임베딩을 지원한다고 적지만, audio와 video 형식은 현재 지원하지 않는다고 따로 제한해.

그래서 이 페이지에서 말하는 멀티모달 검색은 제품 카탈로그 이미지, 연구 보고서의 도표, 설계 문서의 이미지, 보험 청구 사진처럼 텍스트와 이미지 자료가 섞인 검색 흐름으로 좁혀 보는 게 맞아.

커스텀 메타데이터도 실무에서는 꽤 중요해. store 하나에 모든 파일을 넣어 두면 질문마다 엉뚱한 자료가 섞이기 쉬운데, 업로드할 때 category, season, price_tier 같은 값을 붙이면 질의 시점에 필요한 범위만 좁혀 검색할 수 있어. 이건 벡터 데이터베이스에서 필터를 같이 쓰는 감각과 비슷하지만, Gemini API 안에서는 store와 tool 호출 형태로 드러난다는 차이가 있어.

왜 중요한가

이 항목이 중요한 이유는 RAG 구축에서 귀찮은 부분을 Gemini API 쪽 기능으로 많이 넘기기 때문이야. 원래는 파일 업로드, 문서 분할, 임베딩 생성, 벡터 저장소, 검색, 인용 표시를 따로 이어 붙여야 했어. File Search는 이 중 store 관리와 검색, 근거 메타데이터 반환을 API 기능으로 묶어 줘서 작은 팀이 멀티모달 문서 검색을 더 빨리 시험하게 해 줘.

특히 페이지 단위 인용은 “답이 그럴듯한가”보다 “어디를 보고 말했는가”를 확인하게 해 줘. 사내 규정, 법무 문서, 연구 보고서, 제품 매뉴얼처럼 출처 확인이 중요한 업무에서는 이 차이가 커. 답변 아래에 파일명만 띄우는 것과 37쪽 근처를 바로 보여 주는 건 사용자 신뢰가 꽤 다르거든.

또 하나는 모델 비교를 덜 헷갈리게 해 준다는 점이야. 검색 품질이 좋아졌다는 말이 항상 생성 모델 자체의 성능 향상을 뜻하지는 않아. 이 기능 맥락에서는 임베딩 모델, 메타데이터 필터, store 설계, 인용 반환 방식이 같이 바뀐 결과일 수 있어. 그래서 기사에서 이 이름이 보이면 “모델이 바뀐 건지, 검색 계층이 바뀐 건지”부터 갈라 보는 게 좋아.

주의해서 볼 점

File Search를 붙였다고 Grounding이 자동으로 완벽해지는 건 아니야. 잘못된 파일을 올리거나, 문서를 너무 크게 묶거나, 메타데이터를 대충 붙이면 검색 결과도 흔들려. 페이지 번호와 media_id는 검증을 돕는 힌트이지, 원문 자체가 맞는지까지 보장하는 장치는 아니야.

제한과 과금은 이렇게 나눠 보면 빨라.

파일 크기: 공식 문서 기준 문서 하나는 최대 100 MB야.
store 총량: 프로젝트의 File Search store 총량은 Free 1 GB, Tier 1 10 GB, Tier 2 100 GB, Tier 3 1 TB로 갈려.
권장 크기: store 하나는 20 GB 아래로 두는 걸 권장하고, 실제 store 크기는 입력 파일과 생성된 임베딩을 합쳐 보통 입력 데이터의 약 3배로 계산된다고 적혀 있어.
파일 형식: audio와 video 파일 형식은 현재 지원하지 않아. 이미지 쪽도 PNG와 JPEG, 4K x 4K 이하 같은 조건을 확인해야 해.
비용: 저장소와 질의 시점의 임베딩은 무료지만, 인덱싱할 때의 임베딩 비용과 검색된 문서 토큰의 컨텍스트 토큰 비용은 따로 봐야 해.
도구 조합: Live API에서는 지원하지 않고, 현재 Grounding with Google Search나 URL Context 같은 다른 tool과 함께 쓸 수 없다는 제한도 있어.

사용자 화면에 바로 적용하기 전에 이 제약부터 확인하는 편이 안전해.

이 항목을 참조하는 위키

포맷 v3 가이드 wiki 3.2.0

팩트 체크

통과 · 2026-05-07 KST

검증 생성: AI + 편집 검토 · 2026-05-07 상태: 통과

통과 원문 대조 검증 출처 4

발표 글과 개발자 문서를 대조해서 이 기능을 모델명이 아니라 Gemini API 안의 검색 도구로 잡았어.

독자 문제 대조: 이 페이지는 이 이름을 새 모델 계열이 아니라, Gemini API 앱에 파일 기반 근거 검색을 붙이는 도구로 읽게 만드는 데 초점을 뒀어.
Google Blog의 2026년 5월 5일 글은 File Search 업데이트를 멀티모달 지원, 커스텀 메타데이터, 페이지 단위 인용 3가지로 설명해.
같은 글은 이 검색 도구가 Gemini Embedding 2를 바탕으로 이미지와 텍스트를 함께 처리한다고 설명해.
Google AI for Developers 쪽 자료는 file search store와 document 업로드, citation, page number, media citation을 다루는 API 기능으로 설명해.

통과 교차 검증 검증 출처 4

발표 글, 임베딩 글, 개발자 가이드, 참조 문서를 서로 맞대서 기능 범위가 과장되지 않았는지 봤어.

비교 기준: 발표 글은 기능 변화, 임베딩 글은 멀티모달 입력 조건, DEV 글은 SDK 사용 흐름, API 문서는 제한과 과금을 맡아.
DEV 가이드는 file search store 생성, 문서 업로드, 문서 목록 조회, 삭제, 메타데이터 필터를 코드 흐름으로 보여 줘서 본문의 store 중심 설명과 맞아.
Google AI 문서는 `grounding_metadata`에서 인용 정보를 보고, PDF 같은 페이지 문서에서는 `page_number`를 얻을 수 있다고 적어.
개발자 블로그는 텍스트, 이미지, 영상, 오디오, 문서를 하나의 임베딩 공간에 매핑한다고 설명해서 멀티모달 검색 설명과 같은 축에 있어.

통과 수치 검증 검증 출처 3

본문에 넣은 날짜, 입력 한도, 저장소 한도, 과금 조건을 숫자별로 다시 확인했어.

Google Blog 글의 게시일은 2026년 5월 5일이고, 이 페이지도 해당 업데이트를 그 날짜의 File Search 확장으로 제한해 적었어.
임베딩 모델 소개 글은 한 호출에서 최대 8,192 text tokens, 6 images, 120 seconds video, 180 seconds audio, 6 pages of PDFs를 처리한다고 적어.
File Search 문서 쪽은 audio와 video 형식을 현재 지원하지 않는다고 따로 제한해. 그래서 임베딩 모델 한도와 이 도구의 파일 지원 범위를 분리했어.
File Search 참조 문서는 문서 하나당 최대 100 MB, 프로젝트 store 총량을 Free 1 GB, Tier 1 10 GB, Tier 2 100 GB, Tier 3 1 TB로 적어.
같은 문서는 store 하나를 20 GB 아래로 두는 걸 권장하고, store 크기는 입력과 생성된 임베딩을 합쳐 보통 입력 데이터의 약 3배로 계산된다고 적어.
가격 안내는 인덱싱 시 임베딩 비용이 들고, 저장소와 질의 시 임베딩은 무료지만, 검색된 문서 토큰은 일반 context token으로 과금된다고 적어.

통과 비판 검토 검증 출처 4

이 도구를 만능 벡터 DB, 무료 RAG, 또는 사실성 보증 장치처럼 읽는 오해를 일부러 걸러 봤어.

File Search는 검색 인프라를 대신 맡아 주지만, 문서 분할, 메타데이터 설계, 검색 질의 품질이 나쁘면 RAG 답변도 그대로 흔들려.
Gemini Embedding 2가 영상과 오디오 입력을 다룰 수 있다는 말만 보고, 이 도구가 audio/video 파일 검색까지 지원한다고 읽으면 범위를 과장하게 돼.
저장소가 무료라고 전체 흐름이 무료인 건 아니야. 가격 섹션은 인덱싱 임베딩과 검색된 문서 토큰 비용을 따로 적어.
제한 섹션은 Live API에서 File Search를 지원하지 않고, 현재 Grounding with Google Search나 URL Context 같은 다른 도구와 함께 쓸 수 없다고 적어.
페이지 번호와 media_id 인용은 검증성을 높이는 신호지만, 잘못 업로드한 자료나 낡은 문서의 진실 여부까지 보장하는 장치는 아니야.

이 도구의 핵심은 모델이 더 똑똑해졌다는 말보다, Gemini API 앱 안에서 파일 검색과 근거 표시를 관리형 기능으로 넘길 수 있다는 데 있어.
멀티모달 검색을 쓰려면 이미지가 검색되는지보다 어떤 파일을 어떤 메타데이터로 넣고, 결과 인용을 제품 화면에서 어떻게 보여 줄지 먼저 정해야 해.

출처: Google Blog - Multimodal File Search update , Google Developers Blog - Gemini Embedding 2 , DEV - Multimodal RAG developer guide , File Search | Gemini API | Google AI for Developers

Gemini API File Search(제미니 API 파일 검색)

전체 AI 기술 맵에서의 위치

한 줄 정의

실제로 무엇을 하나

왜 중요한가

주의해서 볼 점

관련 용어

이 항목을 참조하는 위키