이 용어는 어디까지 신뢰할 수 있나요?

Mythos는 보통 Anthropic의 Mythos Preview를 짧게 부르는 이름이야. 새로 공개된 Claude 챗봇이라기보다, 에이전틱 코딩과 추론 능력이 보안 취약점 탐지에서 특히 강하게 확인돼서 Glasswing 협력 안에서 제한 접근으로 다루는 모델 문맥을 가리켜.

그래서 기사에서 Mythos가 나오면 “성능이 얼마나 좋나”보다 “누가 어떤 방어 목적에서 접근하나”를 먼저 봐야 해. Anthropic은 Claude Mythos Preview를 일반 목적의 미공개 프론티어 모델로 설명하면서도, 일반 공개 계획은 없다고 선을 그었어.

어떻게 작동하나

공개된 흐름은 보안 연구용 에이전트 작업에 가까워. Anthropic 레드팀은 인터넷과 분리된 컨테이너에 코드와 실행 환경을 놓고, Claude Code에서 Mythos Preview에게 취약점을 찾게 했다고 설명해. 모델은 코드를 읽고, 의심 경로를 세우고, 실제 실행과 디버깅으로 가설을 확인한 뒤, 문제가 맞으면 재현 정보와 버그 보고서를 내는 식으로 움직여.

이 과정이 위험한 이유는 단순 코드 리뷰가 아니라 악용 가능성까지 추론할 수 있기 때문이야. Anthropic 레드팀 글은 이 모델이 주요 운영체제와 웹브라우저에서 수천 개의 제로데이 취약점을 찾았다고 말했고, 공개 가능한 예시로 27년 된 OpenBSD 취약점, 16년 된 FFmpeg 취약점, Linux 커널 취약점 체인을 들었어. 다만 많은 취약점은 아직 패치 전이라, 공개 글도 세부 절차를 일부러 감춰.

Glasswing은 이 능력을 방어자에게 먼저 배치하려는 운영 방식이야. Anthropic Glasswing 발표는 파트너와 지원책을 같이 묶어 공개했어.

파트너 예시: AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, NVIDIA, Palo Alto Networks.
접근 확장: 40개 넘는 핵심 소프트웨어 조직.
지원 규모: 최대 1억 달러 사용 크레딧과 400만 달러 오픈소스 보안 기부.

왜 중요한가

Mythos가 중요한 이유는 “코딩 모델이 더 좋아졌다”보다 더 좁아. 보안 취약점을 찾고 고치는 능력은 방어자에게 유용하지만, 같은 능력이 공격자에게 넘어가면 패치되지 않은 코드의 공격 표면도 빨리 넓어져. 그래서 이 이름은 모델 성능표보다 가드레일, 접근 심사, 책임 있는 취약점 공개 절차를 같이 부르는 신호에 가까워.

숫자도 그 맥락에서 봐야 해. Anthropic 표의 핵심 값은 이렇게 나뉘어.

CyberGym 취약점 재현: Mythos Preview 83.1%, 비교 대상인 Claude Opus 4.6은 66.6%.
SWE-bench Pro: 77.8%.
Terminal-Bench 2.0: 82.0%.
SWE-bench Verified: 93.9%.

하지만 이 점수는 “아무 보안 일을 맡겨도 된다”는 결론이 아니야. 일부 평가는 내부 구현, 토큰 예산, 암기 여부를 걸러 보는 평가 절차 같은 단서가 붙어 있고, 실제 운영에서는 사람이 분류하고 확인하는 절차와 공개 책임이 남아.

비용도 공개 모델처럼 읽으면 안 돼. 1억 달러 크레딧 뒤 참가자 가격은 입력 100만 토큰당 25달러, 출력 100만 토큰당 125달러로 공지됐어. 이건 일반 사용자가 앱에서 바로 고르는 가격표가 아니라, 승인된 참가자가 아래 채널에서 쓰는 조건이야.

주의해서 볼 점

Mythos와 Mythos Preview는 글에서 거의 같은 대상을 가리킬 때가 많지만, 정확히는 Mythos Preview가 공개된 공식 이름이야. “마이토스급”처럼 쓰이면 앞으로 나올 비슷한 능력의 모델군이나 안전장치 논의까지 포함할 수 있어서, 문장 안에서 모델명인지 능력층인지 먼저 나눠 봐야 해.

Trusted Access나 GPT-5.4-Cyber와 비교하면 차이가 더 선명해져. Anthropic 방식은 일반 공개하지 않은 고위험 프리뷰와 Glasswing 협력을 앞에 두고, OpenAI 방식은 방어 목적 사용자 검증 프로그램 안에서 특수 모델 접근권을 넓혀. 둘 다 AI 보안 모델을 말하지만, 실제로 확인할 항목은 성능보다 접근 조건, 금지 행위, 로그와 검증 책임이야.

또 한 가지는 출처 성격이야. 지금 공개된 강한 숫자는 주로 Anthropic 자가 보고와 파트너 보도에서 나와. Guardian과 TechCrunch는 위험 때문에 대중 공개를 피했다는 큰 맥락을 확인해 주지만, 세부 능력 검증의 대부분은 Anthropic 레드팀 글과 Glasswing 발표에 기대고 있어. 그래서 Mythos를 “검증된 공개 보안 도구”로 읽기보다, 제한 접근이 필요할 만큼 방어와 공격에 모두 쓰일 수 있는 위험이 커진 사례로 읽는 편이 안전해.

이 항목을 참조하는 위키

📰 관련 기사 (4)

미국, Anthropic Fable 5·Mythos 5를 수출통제로 전 세계 차단2026-06-14🔥92점 · 출처 4
NSA, 국방부 블랙리스트 무시하고 Anthropic Mythos 몰래 쓰고 있었다2026-04-21🔥78점 · 출처 5
Anthropic, Mythos 5를 100곳 넘는 미국 기관에 다시 열었어2026-06-28🔥78점 · 출처 3
백악관, 연방 기관에 Anthropic Mythos 접근 권한 준비 중2026-04-17⚡55점 · 출처 4

포맷 v3 가이드 wiki 3.2.0

팩트 체크

통과 · 2026-05-07 KST

검증 생성: AI + 편집 검토 · 2026-05-07 상태: 통과

통과 원문 대조 검증 출처 2

Anthropic 공식 발표와 레드팀 글을 맞춰, Mythos를 공개 모델명이 아니라 제한 접근 보안 프리뷰 문맥으로 좁혔어.

독자 문제 대조: Mythos를 새 Claude 앱 모델로 읽을지, 보안 문맥에서 줄여 부르는 프리뷰 이름으로 읽을지 먼저 가르게 했어.
Anthropic Glasswing 글은 이 프리뷰를 일반 목적의 미공개 프론티어 모델로 설명하면서, 일반 공개보다 방어 목적 파트너 접근을 앞에 둬.
레드팀 글은 2026년 4월 7일 그 모델을 새 일반 목적 언어 모델로 부르지만, 컴퓨터 보안 작업에서 특히 강한 능력이 드러났다고 설명해.
본문은 Mythos라는 짧은 이름을 모델 단독보다 Glasswing 협력, 취약점 공개, 접근 통제와 함께 읽게 맞췄어.

통과 교차 검증 검증 출처 4

공식 출처와 TechCrunch, Guardian 보도를 비교해 접근 제한과 보도에서 짧게 부르는 표현이 같은 방향인지 봤어.

비교 기준: Anthropic은 모델과 프로젝트 구조를, 레드팀 글은 능력 평가를, TechCrunch와 Guardian은 일반 공개를 막은 이유와 파트너 접근을 보여 주는지 나눠 봤어.
TechCrunch는 Mythos가 Glasswing 프로젝트 안에서 12개 파트너 조직과 추가 접근 조직에 쓰인다고 보도했고, Anthropic 글도 초기 파트너와 40개 넘는 추가 조직을 말해.
Guardian은 Anthropic이 이 모델을 대중에게 공개하지 않고 보안 전문가와 오픈소스 커뮤니티 방어자에게 먼저 쓰게 했다는 점을 반복해.
두 보도 모두 Mythos를 성능 홍보보다 사이버 보안 위험과 방어 목적 제한 배포로 다뤄서, 본문 판단과 어긋나지 않았어.

통과 수치 검증 검증 출처 3

본문 숫자는 날짜, 접근 규모, 크레딧, 취약점 사례, 평가 점수처럼 출처가 직접 제시한 값만 썼어.

발표일은 2026년 4월 7일이야. Anthropic 레드팀 글과 TechCrunch 보도가 같은 날의 발표를 다뤄.
Anthropic 글은 40개 넘는 추가 조직, 최대 1억 달러 사용 크레딧, 오픈소스 보안 단체 400만 달러 기부를 적고 있어.
같은 글은 연구 프리뷰 뒤 참가자 가격을 입력 100만 토큰당 25달러, 출력 100만 토큰당 125달러로 제시해. 일반 공개 가격표로 쓰면 안 돼.
공식 글의 예시는 27년 된 OpenBSD 취약점, 16년 된 FFmpeg 취약점, [Linux](/ko/wiki/linux/) 커널 취약점 체인이고, CyberGym 점수는 이 프리뷰 83.1%, Opus 4.6 66.6%야.
레드팀 글은 Opus 4.6의 Firefox 147 JavaScript shell 공격 재현 성공이 수백 번 중 2번이었고, 이 프리뷰 재실험은 실제 작동한 공격 재현 181번과 레지스터 제어 29번이었다고 적어.

통과 비판 검토 검증 출처 4

자가 보고 수치, 미패치 취약점, 일반 공개 여부를 분리해서 과장과 위험한 세부 묘사를 줄였어.

Anthropic 수치는 대부분 자사 발표와 레드팀 글에서 나와. 그래서 본문은 독립 공개 벤치마크처럼 단정하지 않고, 제한 배포 판단의 근거로만 썼어.
레드팀 글은 발견 취약점의 99% 넘는 부분이 아직 패치되지 않았다고 밝혀. 그래서 본문은 익스플로잇 절차나 재현 세부사항을 설명하지 않았어.
일반 공개 계획, 가중치 공개, 로컬 실행 경로, 공개 API 모델 ID는 확인되지 않았어. 본문도 Mythos를 즉시 도입 가능한 공개 모델처럼 쓰지 않았어.
Guardian과 TechCrunch는 위험 때문에 공개를 제한했다는 배경을 보여 주지만, 실제 접근 조건과 가격은 Anthropic 공식 글 기준으로만 남겼어.

Mythos는 성능보다 배포 경계가 먼저 보이는 이름이야.
방어에 쓸 수 있는 능력과 공격에 악용될 수 있는 능력이 같은 기술에서 나오기 때문에 접근 통제를 같이 읽어야 해.

출처: Anthropic - Project Glasswing , Anthropic Frontier Red Team - Mythos Preview assessment , TechCrunch - Anthropic debuts Mythos preview , The Guardian - Anthropic keeps latest AI tool out of public's hands

Mythos (마이토스)

전체 AI 기술 맵에서의 위치

한 줄 정의

어떻게 작동하나

왜 중요한가

주의해서 볼 점

관련 용어

이 항목을 참조하는 위키

📰 관련 기사 (4)