한 줄 정의

Weaviate는 데이터 객체와 그 객체의 벡터 표현을 같이 저장하고 검색하는 벡터 데이터베이스야. 키워드 검색을 조금 보강한 정도가 아니라 의미 검색과 필터링을 함께 다루는 검색 엔진 층이라고 보면 돼.

어떻게 작동하나

문서나 상품, 사용자 기록을 넣을 때 메타데이터와 임베딩을 함께 인덱싱해 두고 질의가 오면 유사도 검색과 필터를 조합해서 후보를 좁혀. 이렇게 뽑힌 결과를 RAG 파이프라인이나 추천 시스템에 넘기면 모델이 바깥 지식을 더 안정적으로 끌어다 쓸 수 있어.

왜 중요한가

요즘 AI 앱 품질은 모델 자체보다 retrieval 품질에서 크게 갈리는 경우가 많아. Weaviate 같은 도구를 이해하면 검색 레이어를 어떻게 설계하느냐가 답변 품질과 운영 복잡도를 얼마나 바꾸는지 한 번에 읽을 수 있어.

주의해서 볼 점

Weaviate를 붙인다고 검색 품질이 자동으로 좋아지진 않아. 임베딩 모델 선택, 청크 분할, 스키마, 메타데이터 품질이 별로면 결과도 흔들리고 작은 프로젝트라면 더 단순한 저장소가 오히려 맞을 수도 있어.

관련 용어

  • pinecone은 관리형 벡터 DB 쪽 감각이 더 강해. 직접 운영할지 서비스형으로 갈지 비교할 때 같이 보면 좋아.
  • chroma는 더 가볍게 붙여 보는 개발 경험에 가까워. 프로토타입 단계와 운영 단계 차이를 볼 때 대비가 잘 돼.
  • qdrant는 비슷한 층위의 벡터 검색 엔진이라 API와 필터링, 운영 감각 차이를 비교하기 좋아.
  • rag는 Weaviate 같은 저장 계층이 실제 응답 흐름 어디에 들어가는지 보여 줘. retrieval과 생성 모델을 한 줄로 연결해서 이해하는 데 도움이 돼.