한 줄 정의
이 항목은 Google이 Gemini API와 Vertex AI로 제공하는 임베딩 모델 계열을 가리켜. 001은 텍스트 전용이고, 2 버전은 텍스트, 이미지, 비디오, 오디오, PDF를 같은 벡터 공간에 놓는 멀티모달 버전이야.
이 이름에서 봐야 할 건 “Gemini가 답을 써 주는가”가 아니라 “검색 후보를 고르는 벡터를 어떤 입력에서 만들 수 있는가”야. Gemini 계열 안에서도 생성 모델과 임베딩 모델은 맡는 일이 달라. 생성 모델은 문장을 만들고, 임베딩 모델은 문서나 이미지가 질의와 얼마나 가까운지 비교할 수 있게 숫자 벡터를 만들어.
이 모델로 무엇을 할 수 있나
기본 흐름은 질의와 문서를 같은 계열 모델에 넣고, 나온 벡터끼리 거리를 재는 방식이야. 예를 들어 사내 정책 문서 5만 개를 조각내서 001로 인덱싱하면, “출장비 영수증은 며칠 안에 내야 해?” 같은 질문과 가까운 조각을 먼저 꺼낼 수 있어. 그 다음 단계에서 RAG나 생성 모델이 그 조각을 읽고 답을 만들어.
버전이 바뀌면 입력 범위도 달라져. 001은 2025년 일반 제공된 텍스트 전용 모델이고 최대 입력은 2,048 토큰이야. 출력은 기본 3,072차원이며 1,536이나 768차원으로 줄여 저장량과 검색 비용을 낮출 수 있어.
2는 같은 계열의 멀티모달 버전이야. 공식 발표 기준으로 텍스트 8,192 토큰, 이미지 6장, 비디오 120초, PDF 6페이지 같은 입력을 다루고, 모델 페이지는 출력 차원 범위를 128~3,072로 둬. 텍스트만 있는 FAQ 검색이면 001로 충분할 수 있지만, 슬라이드 이미지, 상품 사진, 녹화 영상, PDF가 한 검색 인덱스에 섞이면 2를 검토하게 돼.
도입 전에는 이 네 가지를 먼저 적어 두면 좋아.
- 검색 대상: 텍스트만 있는지, 이미지·PDF·영상이 섞이는지 확인해.
- 벡터 차원: 3,072, 1,536, 768처럼 저장량과 품질을 같이 바꿀 값을 정해.
- 평가 지표: recall@k, ndcg, 지연 시간, 인덱스 크기를 자체 데이터로 재.
- 운영 경로: 직접 벡터 DB를 쓸지, 관리형 검색을 쓸지 나눠.
왜 중요한가
검색 품질 문제를 생성 모델만 바꿔서 해결하려고 하면 자주 헛돌아. 답변 모델이 좋아도 앞단 검색이 엉뚱한 문서를 가져오면 결과가 흔들려. Gemini Embedding은 그 앞단에서 “무엇을 읽힐지”를 고르는 모델 계열이라서, 저장소 설계와 같이 봐야 해.
두 번째로 중요한 건 비용이야. 3,072차원 벡터는 768차원 벡터보다 저장량과 유사도 계산 비용이 커. API 가격도 버전마다 달라. Gemini API 가격표 기준으로 001 paid tier는 1M 입력 토큰당 $0.15이고 batch는 $0.075야. 2는 텍스트, 이미지, 오디오, 비디오 입력 가격이 따로 잡혀 있어. 멀티모달 검색이 필요하지 않다면 이름이 더 새롭다는 이유만으로 갈아탈 일이 아닐 수 있어.
세 번째는 제품 경계야. 2026년 5월 Google은 Gemini API File Search가 멀티모달 검색, custom metadata, page-level citation을 지원한다고 발표했어. 이건 2가 실제 RAG 도구 안에 들어간다는 신호지만, 관리형 검색 자체와 임베딩 모델은 같은 말이 아니야. 직접 벡터 DB를 운영할지, 관리형 검색을 쓸지, 원문 인용까지 제품 요구사항인지 따로 나눠 봐야 해.
주의해서 볼 점
흔한 실수는 이 계열 이름을 하나의 고정 모델처럼 부르는 거야. 001과 2는 입력 범위, 가격, 멀티모달 지원이 달라. 기존 인덱스를 새 버전으로 바꾸면 전체 문서를 다시 임베딩하고 검색 품질을 다시 재야 해. 벡터 공간이 달라지면 같은 문장도 같은 위치에 놓인다고 가정할 수 없어.
벤치마크도 조심해서 읽어야 해. Google은 001의 MTEB Multilingual 성과와 2의 여러 cross-modal benchmark를 제시하지만, 사내 문서 검색에서는 데이터 모양이 달라. 최소한 recall@k, ndcg, 지연 시간, 인덱스 크기를 직접 재야 해. “state-of-the-art”라는 말보다 내 데이터에서 10개 후보 안에 정답 문서가 들어오는지가 더 중요해.
마지막으로, 멀티모달 임베딩은 OCR이나 원문 검증을 완전히 없애는 장치가 아니야. 이미지와 텍스트를 같은 검색 공간에 놓는 데는 유리하지만, 계약서 몇 페이지 몇 줄에서 나온 주장인지 보여줘야 하는 업무라면 page citation, 원문 텍스트 추출, 접근 권한 필터까지 같이 설계해야 해.
같이 보면 좋은 모델
- Gemini는 이 계열이 속한 Google 모델 브랜드야. 생성형 답변 모델이 아니라 임베딩 전용 모델이라는 점을 분리해서 봐야 해.
- 2 버전은 이 계열의 멀티모달 버전이야. 이미지, 오디오, 비디오, PDF까지 검색 후보로 올릴 때 같이 보면 좋아.
같이 보면 좋은 항목
- Gemini API는 실제 사용 경로야. 모델 코드, 가격표, Files API, Batch API, File Search 같은 운영 조건은 여기서 갈려.
- Embedding은 출력 형식을 이해하게 해 줘. 벡터가 바뀌면 기존 인덱스와 검색 점수도 같이 바뀔 수 있어.
- RAG는 이 계열이 실제 답변 시스템 앞단에서 어디에 붙는지 보여 줘. 임베딩만 좋아져도 청킹과 재랭킹이 나쁘면 답은 흔들릴 수 있어.
- Vector Database는 나온 벡터를 저장하고 검색하는 쪽이야. 차원 수와 인덱스 설정이 비용과 지연 시간에 바로 닿아.