이 용어는 어디까지 신뢰할 수 있나요?

Mythos Preview는 Anthropic이 일반 공개하지 않은 Claude 계열의 프론티어 모델이야. 새 챗봇 이름이라기보다, agentic coding과 추론 능력이 보안 취약점 탐지에서 너무 강하게 드러나서 Project Glasswing 안에서만 제한적으로 쓰는 프리뷰로 보면 돼.

그래서 이 이름을 볼 때 첫 질문은 “성능이 얼마나 좋나”보다 “누가 어떤 방어 목적에서 접근할 수 있나”야. Anthropic은 Mythos Preview를 일반 목적의 unreleased frontier model이라고 설명하면서도, 일반 공개 계획은 없다고 선을 그었어.

이 모델로 무엇을 할 수 있나

공개된 사용 장면은 소프트웨어 보안 쪽이야. Anthropic은 이 모델을 아래 같은 방어 작업에 붙인다고 설명해.

소스 코드 스캔: 큰 코드베이스를 읽고 취약한 경로를 추론해.
바이너리 블랙박스 테스트: 소스가 없는 프로그램의 약점이나 악용 가능성을 살펴.
엔드포인트 보안 점검: 운영체제와 브라우저처럼 노출면이 큰 기반 소프트웨어를 확인해.
침투 테스트 보조: 승인된 환경에서 취약점 재현과 triage를 빠르게 해.

Anthropic 레드팀 글은 주요 운영체제와 웹브라우저에서 제로데이 취약점을 찾고, 오래된 OpenBSD 버그와 FreeBSD NFS 원격 코드 실행 취약점까지 다뤘다고 설명해.

실제 사례도 하나 있어. Mozilla 글 기준으로 Firefox 팀은 Claude Mythos Preview 초기 버전을 Firefox에 적용했고, Firefox 150 릴리스에서 이 평가로 찾은 271개 취약점을 고쳤어. 비교 대상으로 나온 이전 협업은 Claude Opus 4.6으로 Firefox 148에서 22개 보안 민감 버그를 고친 사례였으니, 여기서 핵심은 단순 자동 완성보다 코드 이해와 보안 추론을 길게 묶는 능력이야.

왜 중요한가

이 프리뷰가 중요한 이유는 “더 센 코딩 모델”이라는 말만으로는 부족해서야. Anthropic은 launch partners와 추가 40개 넘는 핵심 소프트웨어 조직에 접근을 열고, 최대 1억 달러 사용 크레딧과 400만 달러 오픈소스 보안 기부를 붙였어. 이건 모델 출시라기보다, 방어자에게 먼저 능력을 주고 공격자가 따라오기 전에 패치 시간을 벌려는 배포 전략에 가까워.

평가 숫자도 기사에서 자주 붙어. Anthropic 표에서 마이토스는 SWE-bench Pro 77.8%, Terminal-Bench 2.0 82.0%, SWE-bench Verified 93.9%를 보였어. 다만 이 숫자는 “모든 보안 일을 맡겨도 된다”는 결론이 아니야. 일부 평가는 memorization screen, 내부 구현, 토큰 예산 같은 조건이 붙어 있어서, 실무에서는 내 코드베이스와 공개 책임 절차에서 다시 봐야 해.

비용도 접근권과 같이 읽어야 해. 1억 달러 크레딧은 연구 프리뷰를 상당 기간 덮기 위한 약속이고, 그 뒤 참가자용 rate는 입력 100만 토큰당 25달러와 출력 100만 토큰당 125달러야. 이건 일반 사용자가 Claude 앱에서 바로 고르는 가격표가 아니라, 승인된 참가자가 Claude API, Bedrock, Vertex AI, Microsoft Foundry 같은 채널에서 쓰는 조건이야.

같이 보면 좋은 모델

GPT-5.4-Cyber와 같이 보면 차이가 빨리 보여. 마이토스 쪽은 Anthropic이 일반 공개하지 않은 고위험 프리뷰에 가깝고, GPT-5.4-Cyber는 OpenAI가 Trusted Access for Cyber 안에서 방어 목적 사용자에게 열어 둔 제한 접근 모델이야. 둘 다 “사이버 보안에 AI를 쓴다”는 말 아래 있지만, 실제 판단은 성능보다 접근 심사, 금지 행위, 취약점 공개 절차에서 갈려.

Claude Opus 4.6도 기준선으로 봐야 해. Mozilla 사례처럼 이전 세대 모델이 찾은 22개 버그와 마이토스의 271개 결과를 비교하면 발전 폭은 커 보이지만, 그 숫자를 그대로 일반 제품 성능으로 옮기면 안 돼. 이 프리뷰는 공개 모델 ID, 가격표, 가중치, 로컬 실행 경로가 없는 모델이라서, 도입 검토보다는 보안팀의 red-teaming과 책임 있는 취약점 공개 체계를 다시 설계하게 만드는 신호로 읽는 편이 맞아.

이 항목을 참조하는 위키

포맷 v3 가이드 wiki 3.2.0

팩트 체크

통과 · 2026-05-07 KST

검증 생성: AI + 편집 검토 · 2026-05-07 상태: 통과

통과 원문 대조 검증 출처 3

Anthropic 공식 발표와 레드팀 글에서 이 모델을 일반 공개 모델이 아니라 제한 접근 프리뷰로 확인했어.

독자 문제 대조: 이 이름을 새 Claude 공개 API 모델로 읽을지, 방어적 보안 파트너에게만 열리는 고위험 프리뷰로 읽을지 먼저 가르게 했어.
공식 발표는 Claude Mythos Preview를 Anthropic의 일반 목적 unreleased frontier model로 설명하고, 방어 목적 제한 접근으로 묶어.
Anthropic 레드팀 글은 2026년 4월 7일 이 프리뷰를 새 general-purpose language model로 부르고, 컴퓨터 보안 작업에서 특히 강하다고 설명해.
Bloomberg 보도는 OpenAI의 GPT-5.4-Cyber 제한 배포를 Mythos와의 경쟁 문맥으로 다뤄서, 이 항목을 사이버 보안 특화 모델 경쟁 안에서 읽는 축이 맞아.

통과 교차 검증 검증 출처 5

공식 발표, 레드팀 기술 설명, Mozilla 사례, TechCrunch 보도, OpenAI TAC 문서를 맞대서 접근 제한과 실제 사용 장면을 분리했어.

비교 기준: Anthropic 공식 글은 접근 프로그램과 파트너 범위를, 레드팀 글은 능력 평가를, Mozilla는 실제 소프트웨어 패치 사례를, OpenAI와 Bloomberg는 경쟁 배포 방식을 보여 줘.
TechCrunch는 12개 파트너 조직과 40개 조직 접근 문맥을 보도했고, Anthropic 공식 글은 launch partners와 over 40 additional organizations를 따로 적어 같은 큰 구조를 확인해 줘.
Mozilla는 Firefox 150에서 이 모델이 찾은 271개 취약점을 고쳤다고 적고, 이전 Opus 4.6 협업은 Firefox 148의 22개 보안 민감 버그였다고 설명해.
OpenAI TAC 문서는 방어 목적의 고위험 사이버 작업에서 신원 확인과 사용 목적 검증을 거치는 접근 방식을 설명해서, 마이토스 제한 배포를 업계 공통 문제로 읽게 해 줘.

통과 수치 검증 검증 출처 4

본문과 profile에 넣은 날짜, 파트너 수, 크레딧, 취약점 수, 평가 점수는 공개 출처별로 따로 확인했어.

공개 날짜는 2026년 4월 7일이야. Anthropic 레드팀 글과 TechCrunch 보도가 같은 날짜의 발표를 다뤄.
공식 글은 AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, NVIDIA, Palo Alto Networks 등 launch partners를 적고, 추가로 40개 넘는 조직에 접근을 확장했다고 설명해.
Anthropic은 이 모델의 사용 크레딧 최대 1억 달러와 오픈소스 보안 단체 직접 기부 400만 달러를 약속했어. 기부는 Linux Foundation 경유 250만 달러와 Apache Software Foundation 150만 달러로 나뉘어.
크레딧 이후 참가자 가격은 입력 100만 토큰당 25달러, 출력 100만 토큰당 125달러야. 접근 채널은 Claude API, Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry로 공지됐어.
Mozilla 글은 Firefox 150에서 271개 취약점을 고쳤고, 이전 Opus 4.6 스캔은 Firefox 148에서 22개 버그 수정으로 이어졌다고 적어.
Anthropic 공식 평가표는 SWE-bench Pro 77.8%, Terminal-Bench 2.0 82.0%, SWE-bench Verified 93.9%를 이 프리뷰의 점수로 제시하지만, 일부 평가에는 memorization screen과 내부 구현 단서가 붙어 있어.

통과 비판 검토 검증 출처 5

Anthropic 자가 보고와 실제 독립 검증을 섞지 않도록, 위험과 한계를 본문에 같이 남겼어.

Anthropic 수치와 평가는 대부분 자사 발표와 레드팀 글에서 나와. 그래서 본문은 독립 벤치마크로 확정하지 않고 제한 공개 판단의 근거로만 썼어.
Mozilla 사례의 271개는 강한 신호지만, Mozilla도 인간 엘리트 연구자가 찾을 수 없던 새로운 종류의 버그를 봤다고 말하진 않았어. 속도와 규모의 변화로 좁혀 읽는 게 맞아.
레드팀 글은 발견한 취약점의 99% 넘는 부분이 아직 패치되지 않았다고 밝히므로, 구체적 익스플로잇 절차를 설명하는 쪽으로 본문을 밀면 위험해.
일반 공개, 가중치 공개, 공개 가격, 일반 API 모델 ID는 확인되지 않았어. 그래서 모델 profile도 비공개 항목을 비공개로 남겼어.

이 모델은 성능 자랑보다 배포 경계가 더 중요한 사례야.
방어에 도움이 되는 능력과 공격에 악용될 수 있는 능력이 같은 뿌리에서 나와서 접근 조건을 같이 읽어야 해.

출처: Anthropic - Project Glasswing , Anthropic Frontier Red Team - Assessing Claude Mythos Preview , Mozilla - The zero-days are numbered , TechCrunch - Anthropic debuts Mythos preview , Bloomberg - OpenAI Releases Cyber Model to Limited Group in Race With Mythos , OpenAI - Introducing Trusted Access for Cyber , dnyuz - OpenAI Cybersecurity Model and Strategy

Mythos Preview (마이토스 프리뷰)

모델 프로필

상위 모델

전체 AI 기술 맵에서의 위치

한 줄 정의

이 모델로 무엇을 할 수 있나

왜 중요한가

같이 보면 좋은 모델

관련 용어

이 항목을 참조하는 위키