에이전트에 RAG를 붙이면 무조건 더 좋아질까? 이 arxiv 논문이 반례를 들어. 제목부터 직접적이야: “Is Grep All You Need?” — 복잡한 임베딩 기반 검색 없이 단순 Grep(텍스트 패턴 검색)으로도 에이전트 검색이 충분한 경우가 있다는 거거든.

LLM 에이전트가 도구를 호출하고, 정보를 검색하고, 대규모 코퍼스에서 추론하는 에이전트 하네스 맥락에서 검색 전략을 비교했어. 결과가 흥미로운데, 특정 태스크(정형화된 쿼리, 코드베이스 검색, 구조화된 문서)에서는 벡터 임베딩 기반 RAG보다 키워드 매칭 기반 검색이 2~3배 빠르면서 정확도는 비슷하거나 더 높게 나왔어.

이게 왜 중요하냐면, RAG 파이프라인을 에이전트에 붙이는 데 드는 비용(임베딩 계산, 벡터 DB 운영, 응답 지연)을 항상 감수해야 하는 건 아니라는 거야. 에이전트 하네스를 설계할 때 “검색 쿼리가 얼마나 구조화돼 있냐”를 먼저 보고 단순 검색으로 충분한지 테스트해보라는 게 논문의 제안이야.

Claude CodeCursor 같은 AI 코딩 에이전트가 코드베이스를 검색할 때 사실상 Grep을 쓰는 경우가 많은데, 이 논문이 그 직관에 이론적 근거를 붙여주는 셈이야. 에이전트 파이프라인 설계에서 “복잡한 게 항상 더 좋은 건 아니다”를 실험으로 보여주는 논문이야.