무슨 일이 일어났나

구글에서 데이터 검색을 오래 판 연구자들(Alon Halevy, Natasha Noy 포함)이 새 논문에서 질문을 하나 던졌어. 자율 에이전트가 데이터를 찾을 때, 사람이 정리해둔 시맨틱 메타데이터가 아직도 필요하냐는 거야. 시맨틱 메타데이터는 웹페이지에 “이건 데이터셋이고 이름은 뭐고 출처는 어디”라고 기계가 읽게 붙이는 표준 태그(schema.org 같은 것)를 말해. LLM이 똑똑해졌으니 그냥 웹을 뒤져서 알아서 찾으면 되지 않냐는 게 반대편 주장이고. 2026년 5월 27일 arXiv에 올라왔어.

실험이 보여준 것

에이전트 둘을 같은 기준으로 붙여서 비교했어. 평가LLM이 심판을 보는 방식이고, 잣대는 FAIR 원칙 — 찾기 쉽고, 접근 가능하고, 호환되고, 재사용 가능한가야.

  • 시맨틱 에이전트 (schema.org 메타데이터가 붙은 데이터셋 9천만 개 사용): FAIR 데이터셋 검색에서 정밀도가 65.7% 더 높았어. 메타데이터가 풍부한 등록소에서는 44.9% 더 높았고.
  • 베이스라인 에이전트 (웹 문서 수십억 개를 그냥 검색): 질문은 40% 더 많이 답했는데 정확도가 낮았어. 결과의 20.1%가 설명 위주 페이지, 8.5%가 포털 첫 화면 같은 거였거든.

에이전트 만드는 사람한테 무슨 의미인가

정리하면 정확하게 실행해야 하는 작업일수록 구조화된 데이터 생태계가 아직 필수라는 거야. 반대로 넓게 훑는 탐색 작업이면 비구조화 웹 검색이 더 많이 긁어와. 에이전트한테 데이터를 물려줄 때 schema.org 같은 메타데이터를 미리 붙여둘지, 아니면 웹 검색에 맡길지 — 작업 성격에 따라 갈린다는 얘기야.

주의해서 볼 점

아직 arXiv 프리프린트라 동료 평가는 안 거쳤어. 65.7%, 44.9% 같은 수치도 연구진이 자기 실험 설정에서 잰 자가 보고 값이고, 독립적으로 재현된 건 아직 없어. LLM을 심판으로 쓰는 평가 자체도 심판 모델 편향을 탈 수 있어서, 숫자는 방향성으로 보는 게 맞아.