한 줄 정의
Mythos는 보통 Anthropic의 Mythos Preview를 짧게 부르는 이름이야. 새로 공개된 Claude 챗봇이라기보다, 에이전틱 코딩과 추론 능력이 보안 취약점 탐지에서 특히 강하게 확인돼서 Glasswing 협력 안에서 제한 접근으로 다루는 모델 문맥을 가리켜.
그래서 기사에서 Mythos가 나오면 “성능이 얼마나 좋나”보다 “누가 어떤 방어 목적에서 접근하나”를 먼저 봐야 해. Anthropic은 Claude Mythos Preview를 일반 목적의 미공개 프론티어 모델로 설명하면서도, 일반 공개 계획은 없다고 선을 그었어.
어떻게 작동하나
공개된 흐름은 보안 연구용 에이전트 작업에 가까워. Anthropic 레드팀은 인터넷과 분리된 컨테이너에 코드와 실행 환경을 놓고, Claude Code에서 Mythos Preview에게 취약점을 찾게 했다고 설명해. 모델은 코드를 읽고, 의심 경로를 세우고, 실제 실행과 디버깅으로 가설을 확인한 뒤, 문제가 맞으면 재현 정보와 버그 보고서를 내는 식으로 움직여.
이 과정이 위험한 이유는 단순 코드 리뷰가 아니라 악용 가능성까지 추론할 수 있기 때문이야. Anthropic 레드팀 글은 이 모델이 주요 운영체제와 웹브라우저에서 수천 개의 제로데이 취약점을 찾았다고 말했고, 공개 가능한 예시로 27년 된 OpenBSD 취약점, 16년 된 FFmpeg 취약점, Linux 커널 취약점 체인을 들었어. 다만 많은 취약점은 아직 패치 전이라, 공개 글도 세부 절차를 일부러 감춰.
Glasswing은 이 능력을 방어자에게 먼저 배치하려는 운영 방식이야. Anthropic Glasswing 발표는 파트너와 지원책을 같이 묶어 공개했어.
- 파트너 예시: AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, NVIDIA, Palo Alto Networks.
- 접근 확장: 40개 넘는 핵심 소프트웨어 조직.
- 지원 규모: 최대 1억 달러 사용 크레딧과 400만 달러 오픈소스 보안 기부.
왜 중요한가
Mythos가 중요한 이유는 “코딩 모델이 더 좋아졌다”보다 더 좁아. 보안 취약점을 찾고 고치는 능력은 방어자에게 유용하지만, 같은 능력이 공격자에게 넘어가면 패치되지 않은 코드의 공격 표면도 빨리 넓어져. 그래서 이 이름은 모델 성능표보다 가드레일, 접근 심사, 책임 있는 취약점 공개 절차를 같이 부르는 신호에 가까워.
숫자도 그 맥락에서 봐야 해. Anthropic 표의 핵심 값은 이렇게 나뉘어.
- CyberGym 취약점 재현: Mythos Preview 83.1%, 비교 대상인 Claude Opus 4.6은 66.6%.
- SWE-bench Pro: 77.8%.
- Terminal-Bench 2.0: 82.0%.
- SWE-bench Verified: 93.9%.
하지만 이 점수는 “아무 보안 일을 맡겨도 된다”는 결론이 아니야. 일부 평가는 내부 구현, 토큰 예산, 암기 여부를 걸러 보는 평가 절차 같은 단서가 붙어 있고, 실제 운영에서는 사람이 분류하고 확인하는 절차와 공개 책임이 남아.
비용도 공개 모델처럼 읽으면 안 돼. 1억 달러 크레딧 뒤 참가자 가격은 입력 100만 토큰당 25달러, 출력 100만 토큰당 125달러로 공지됐어. 이건 일반 사용자가 앱에서 바로 고르는 가격표가 아니라, 승인된 참가자가 아래 채널에서 쓰는 조건이야.
- Claude API.
- Amazon Bedrock.
- Google Cloud Vertex AI.
- Microsoft Foundry.
주의해서 볼 점
Mythos와 Mythos Preview는 글에서 거의 같은 대상을 가리킬 때가 많지만, 정확히는 Mythos Preview가 공개된 공식 이름이야. “마이토스급”처럼 쓰이면 앞으로 나올 비슷한 능력의 모델군이나 안전장치 논의까지 포함할 수 있어서, 문장 안에서 모델명인지 능력층인지 먼저 나눠 봐야 해.
Trusted Access나 GPT-5.4-Cyber와 비교하면 차이가 더 선명해져. Anthropic 방식은 일반 공개하지 않은 고위험 프리뷰와 Glasswing 협력을 앞에 두고, OpenAI 방식은 방어 목적 사용자 검증 프로그램 안에서 특수 모델 접근권을 넓혀. 둘 다 AI 보안 모델을 말하지만, 실제로 확인할 항목은 성능보다 접근 조건, 금지 행위, 로그와 검증 책임이야.
또 한 가지는 출처 성격이야. 지금 공개된 강한 숫자는 주로 Anthropic 자가 보고와 파트너 보도에서 나와. Guardian과 TechCrunch는 위험 때문에 대중 공개를 피했다는 큰 맥락을 확인해 주지만, 세부 능력 검증의 대부분은 Anthropic 레드팀 글과 Glasswing 발표에 기대고 있어. 그래서 Mythos를 “검증된 공개 보안 도구”로 읽기보다, 제한 접근이 필요할 만큼 방어와 공격에 모두 쓰일 수 있는 위험이 커진 사례로 읽는 편이 안전해.