이 뉴스의 요약은 어떻게 만들어졌나요?

원문 링크를 바탕으로 핵심 요약을 만들고 fact-check 및 신호 점검을 거쳐 게재됩니다.

팩트체크 기준은 무엇인가요?

근거 링크, 수치 점검, 문맥 정합성, 최신성으로 조합해 상태를 표시해.

Anthropic이 Claude를 제품별로 어떻게 가두는지 공개했어

Anthropic이 Claude.ai, Claude Code, Cowork 세 제품에서 Claude를 격리하는 샌드박싱 방식을 문서로 공개했어. 제품마다 gVisor, Seatbelt·Bubblewrap, 가상머신으로 격리 강도를 다르게 쓰고, 자격증명은 샌드박스 안에 절대 넣지 않는다는 원칙을 세웠어.

Anthropic이 Claude를 제품마다 어떻게 가두는지를 엔지니어링 문서로 공개했어. 샌드박싱 제품은 문서가 부실한 경우가 많아서 얼마나 믿어도 되는지 알기 어렵다는 게 Simon Willison의 평소 불만이었는데, 이번 글은 그가 “훌륭하다”고 할 만큼 자세했어.

핵심은 제품 3개에서 격리 강도를 다르게 쓴다는 거야. 웹에서 쓰는 Claude.ai는 gVisor라는 격리 계층을 써. 내 컴퓨터에서 도는 Claude Code는 macOS에선 Seatbelt, 리눅스에선 Bubblewrap으로 프로세스를 가둬. 자율성이 가장 큰 Cowork는 아예 전체 가상머신을 띄워 — macOS는 Apple Virtualization, 윈도우는 HCS를 써. 위험이 클수록 격리도 무겁게 가는 구조야.

원칙도 하나 분명히 했어. 자격증명을 샌드박스 안에 절대 넣지 않는 거야. 키가 격리 환경 안에 있으면 모델이 실수로든 공격으로든 그걸 빼낼 수 있거든. Anthropic은 프로세스 샌드박스, 가상머신, 파일시스템 경계, 외부 통신(egress) 제어 4개를 섞어서 막아. 글에는 과거에 놓쳤던 위험 사례도 솔직하게 들어 있어 — 예를 들면 api.anthropic.com/v1/files를 통한 유출 경로 같은 거.

실무에서 보면 이건 AI 에이전트한테 코드 실행이나 파일 접근을 맡길 때 어느 수준 격리가 필요한지 가르는 기준이 돼. 자체 발표 문서라 실제 견고함은 외부 감사로 따로 봐야 하지만, 격리 설계를 이만큼 공개한 건 드물어. Simon은 이 글을 보고 Anthropic이 오픈소스로 푼 샌드박스 런타임 도구를 다시 들여다볼 만하다고 했어.

태그

#anthropic#claude#claude-code#agent#security

포맷 v3 가이드 news 3.4.1

팩트 체크

통과 · 2026-05-31 KST

검증 생성: AI + 편집 검토 · 2026-05-31 상태: 통과

통과 원문 대조

Simon Willison 글이 가리킨 Anthropic 원문을 직접 찾아 격리 방식을 대조했어.

Claude.ai는 gVisor로 격리: Anthropic 엔지니어링 글 확인.
Claude Code 로컬은 macOS Seatbelt, Linux Bubblewrap 사용: Anthropic 글 확인.
Cowork는 Apple Virtualization(macOS), HCS(Windows)로 전체 가상머신 격리: Anthropic 글 확인.
자격증명은 샌드박스 안에 넣지 않는다는 원칙: Anthropic 글의 credential exfiltration 방지 설명 확인.
evidence: https://www.anthropic.com/engineering/how-we-contain-claude — Claude Code는 macOS Seatbelt, Linux Bubblewrap으로 로컬 격리된다고 원문에서 확인했어.

통과 교차 검증 검증 출처 2

Simon Willison의 요약(인용 출처)과 Anthropic 엔지니어링 원문(독립 1차 출처)을 따로 대조했어.

1차 출처 교차검증: Simon Willison 글이 인용한 Anthropic 공식 엔지니어링 글(anthropic.com/engineering/how-we-contain-claude)을 직접 열어 제품별 격리 도구를 확인했어.
Simon은 요약·논평자라 그의 글만으로 pass 주지 않았고, 원문에서 gVisor·Seatbelt·Bubblewrap·VM 매핑을 따로 봤어.
교차 출처에서 제품 범위(Claude.ai, Claude Code, Cowork)가 같은지 확인했어.

통과 수치 검증

본문에 나온 격리 계층 수와 제품 수를 원문에서 확인했어.

제품 3개(Claude.ai, Claude Code, Cowork): Anthropic 글에서 각각 다른 격리 방식으로 분리해 설명한 걸 확인.
격리 도구 4종류(gVisor, Seatbelt, Bubblewrap, 가상머신): Anthropic 글에서 직접 나열 확인.
egress 위험 사례(api.anthropic.com/v1/files 유출 경로): Anthropic 글에서 과거 놓쳤던 위험으로 직접 언급.

통과 비판 검토

샌드박싱이 만능이 아니라는 점과 자체 발표라는 한계를 짚었어.

Anthropic 자체 문서라 격리가 실제로 얼마나 견고한지는 외부 감사로 따로 검증해야 해. 글에도 과거에 놓친 위험 사례가 있다고 적혀 있어.
샌드박싱은 코드 실행 위험을 줄이지만 프롬프트 인젝션 같은 모델 자체 공격을 다 막진 못해. 격리와 별개 문제야.
제품별 격리 강도가 달라서 Claude Code 로컬 실행은 Cowork의 전체 VM보다 격리가 약해. 어디서 뭘 돌리는지에 따라 위험이 달라져.

Anthropic 자체 발표 문서라 독립 보안 감사 필요.

출처: Simon Willison — How we contain Claude across products , Anthropic Engineering — How we contain Claude