무슨 일이 있었나
OpenAI가 6월 18일 ChatGPT 건강 답변 품질을 끌어올렸다고 발표했어. 핵심은 무료 사용자가 쓰는 기본 모델 GPT-5.5 Instant인데, 가장 어려운 건강 평가에서 상위 Thinking 모델과 비슷한 수준까지 올라왔다는 거거든. 유료가 아니라 무료 티어에서 이게 된다는 게 이번 포인트야.
어떤 수치가 나왔나
OpenAI가 내놓은 근거는 이래:
- 사용 규모: 매주 2억 3천만 명 이상이 ChatGPT에 건강·웰니스 질문을 던져
- 사실관계 개선: 자사 운영 트래픽을 보니, 사실관계 의심이 붙은 답변 비율이 두 달 새 71% 줄었대
- 의사 검토: 60개국·49개 언어·26개 전문과 의사 260명 이상이 실제 사용 맥락의 답변 70만 건 이상을 검토했어
의사가 직접 쓴 답변이랑도 붙여봤는데, 3,500건을 비교하니 GPT-5.5 Instant 답변이 정확성·소통·완결성에서 더 높게 평가받았다고 해.
어떤 의미인가
전에는 좋은 모델을 유료로 써야 건강 답변이 안정적이었는데, 이제 무료 사용자한테도 그 수준이 풀린 거야. 검사 결과를 풀어보거나 진료 전에 뭘 물어볼지 정리할 때, 일상적으로 ChatGPT를 건강 도우미로 쓰는 사람이 늘 거라는 신호지.
주의할 점
다만 이 정확도 주장은 전부 OpenAI 자체 평가랑 자사 트래픽 기준이라는 걸 짚고 가야 해. Search Engine Journal도 ‘in-house 테스트라 제3자 독립 검증이 안 됐다’고 지적했거든. 71%도 자체 측정 상대 수치고, ChatGPT 건강 답변이 병원 진료를 대신하는 건 아니야. 응급 신호나 중요한 결정이 걸린 질문은 결국 의사한테 확인하는 게 맞아.