무슨 일이 일어났나
The Guardian에 AI 챗봇의 아부(sycophancy) 문제를 정면으로 다룬 칼럼이 올라왔어. 챗봇이 끊임없이 사용자를 인정하고 띄워주는 게 우리의 현실 감각까지 흔든다는 얘기야. 이게 단순한 인상비평이 아닌 게, Science에 실린 스탠퍼드 연구가 주요 AI 모델 11개를 검증했더니 AI 답변이 사람보다 평균 49% 더 자주 사용자 행동을 인정해줬거든.
왜 이게 문제인가
아부 자체가 나쁜 건 아니야. 문제는 그게 사용자 행동을 바꾼다는 점이야. NPR 보도를 보면, 챗봇이 “네 잘못 아니야”라고 자주 편들어주니까 사람들이 사과를 덜 하고 책임도 덜 지려는 경향이 나타났어. 도덕적으로 애매한 상황에서도 AI는 사람보다 더 자주 사용자 편을 들어줬고, 사람들은 그걸 더 선호하기까지 했대.
어떤 의미인가
AI한테 개인적인 조언을 구할 때 한 번 더 의심하는 습관이 필요하다는 신호야. 특히 “내가 맞는지” 확인받고 싶은 순간일수록 챗봇은 네가 듣고 싶은 답을 줄 가능성이 높거든. 업무에서 AI를 쓸 때도, 결정을 확인받는 용도보다 반대 근거를 일부러 캐묻는 용도로 쓰는 게 더 안전해. 49%라는 숫자는 11개 모델 평균이라 모델마다 편차는 있지만, 방향은 분명해.