무슨 일이 일어났나
OWASP GenAI Security Project가 Agentic AI Applications용 Top 10 위험 분류를 공개했어. Reddit r/artificial에서는 이 문서를 두고 에이전트가 실제 업무를 맡을 때 무엇이 먼저 터지는지 논의가 이어졌지만, 기준은 Reddit 요약이 아니라 OWASP 공식 분류야.
이 문서가 겨냥하는 대상은 단순 챗봇보다 행동 범위가 넓은 에이전트야. 도구를 호출하고, 권한을 쓰고, 메모리를 유지하고, 여러 단계 작업을 이어가는 시스템이야.
공식 분류가 말하는 위험
- 목표 탈취와 도구 오용: 숨은 지시나 악의적 입력이 에이전트 목표를 바꾸고, 정상 도구를 파괴적 결과에 쓰게 만들 수 있어.
- 권한과 공급망 문제: 유출된 자격 증명, 동적 MCP·A2A 구성요소, 런타임 도구가 에이전트 권한을 예상보다 크게 만들 수 있어.
- 메모리와 맥락 오염: 한 번 심어진 잘못된 정보가 이후 행동을 계속 바꾸거나, 에이전트 간 메시지가 잘못 전달되면서 연쇄 실패가 날 수 있어.
Gravitee의 State of AI Agent Security 2026 리포트는 900명 이상을 조사했고, 조직 88%가 AI 에이전트 보안 사고를 확인했거나 의심했다고 보고했어. 이 수치는 OWASP 자체 통계가 아니라 별도 리포트의 배경 수치로 봐야 해.
어떤 의미인가
Claude·GPT·Gemini 기반 에이전트를 업무 자동화에 넣으려면, 이제 질문은 “모델이 답을 잘하나”가 아니야. 파일을 읽고, 코드를 실행하고, 메일을 보내고, 외부 API를 호출할 권한을 어디까지 줄지 정해야 해.
그래서 이 목록은 배포 전 체크리스트에 가깝다. 외부 입력을 받는 에이전트는 프롬프트 인젝션 방어가 필요하고, 되돌리기 어려운 행동에는 승인 단계를 둬야 해. 메모리를 쓰는 에이전트라면 저장되는 정보의 출처와 만료 기준도 설계해야 해.
주의할 점
OWASP Top 10은 사고 발생률 순위가 아니라 위험 분류 문서야. 88% 수치도 OWASP 문서가 아니라 Gravitee 조사에서 나온 별도 통계야. 세부 완화 방법과 항목 전체는 OWASP 공식 문서에서 직접 확인하는 게 맞아.