이 용어는 어디까지 신뢰할 수 있나요?

Claude Managed Agents는 Anthropic API 위에서 Claude를 장기 실행 AI Agent로 돌리게 해 주는 관리형 에이전트 실행 프레임워크야. 모델 하나를 새로 부르는 이름이 아니라, 에이전트 루프, 클라우드 컨테이너, 도구 실행, 세션 이벤트, 로그를 Anthropic 쪽 인프라에 올리는 방식에 가까워.

그래서 이 이름이 나오면 “Claude가 더 똑똑해졌다”보다 “누가 에이전트 런타임을 운영하나”를 먼저 봐야 해. Messages API로 직접 agent loop를 짜는 경우에는 앱 서버가 상태, 도구 실행, 샌드박스, 재시도를 많이 떠안는다. 이 서비스는 그중 큰 덩어리를 관리형 환경으로 넘기는 선택지야.

실제로 무엇을 하나

공식 문서는 Managed Agents를 agent, environment, session, events 네 개 개념으로 설명해. Agent는 모델, 시스템 프롬프트, 도구, MCP 서버, skill을 묶은 설정이고, environment는 패키지와 네트워크 규칙이 들어간 클라우드 컨테이너 템플릿이야. Session은 그 둘을 붙여 실제 작업을 실행하는 인스턴스고, events는 사용자 메시지, 도구 결과, 상태 업데이트가 오가는 기록이야.

실행 흐름도 이 네 개를 따라가. 개발자는 agent를 만들고, Python이나 Node.js 같은 패키지가 깔린 environment를 만들고, session을 시작한 다음 event stream으로 진행 상황을 받는다. Claude는 컨테이너 안에서 파일을 읽고 쓰고, bash 명령을 실행하고, 웹을 검색하거나 가져오고, 코드 실행을 할 수 있어. 이때 결과는 단발 응답이 아니라 agent event, session event, span event처럼 추적 가능한 흐름으로 남아.

중간 개입도 구조 안에 들어가 있어. 사용자는 user.interrupt로 실행 중인 작업을 끊고 방향을 바꿀 수 있고, permission policy가 걸린 도구 호출에는 user.tool_confirmation으로 허용이나 거부를 보낼 수 있어. idle session은 대화 기록을 유지하고 컨테이너 상태도 checkpoint로 남기지만, 공식 이벤트 문서는 컨테이너 checkpoint 보존 기간을 마지막 활동 뒤 30일로 둔다고 설명해.

왜 중요한가

이 기능이 중요한 이유는 에이전트 만들기의 무게중심이 모델 호출에서 운영 인프라로 넘어가기 때문이야. 사내 리포지토리 분석, 고객지원 조사, 여러 문서에서 근거를 모으는 리서치, 긴 코드 수정처럼 몇 분에서 몇 시간 이어지는 작업은 프롬프트 한 번보다 세션 상태와 도구 권한이 더 중요해진다.

비용도 모델 가격표 하나로 끝나지 않아. 공식 가격 문서는 Managed Agents를 토큰 사용량과 agent session 실행 시간 두 축으로 과금한다고 적어. 표준 모델 토큰 가격이 붙고, 실행 중인 세션은 시간당 0.08달러야. session 안에서 웹 검색이 돌면 1,000회당 10달러 web search 비용도 따로 붙는다. idle, rescheduling, terminated 상태 시간은 실행 시간에 들어가지 않는다고 해도, 긴 에이전트 작업은 입력 토큰, 출력 토큰, Prompt Caching 읽기, 도구 호출을 같이 재야 해.

2026년 5월 6일 업데이트도 이 방향을 보여 줘. Anthropic은 outcomes에서 별도 grader가 성공 기준을 평가하고 agent가 다시 시도하는 구조를 설명했고, 내부 테스트에서 task success가 표준 prompting loop보다 최대 10점 높았다고 적었어. 같은 글은 docx 생성 +8.4%, pptx 생성 +10.1%라는 내부 벤치마크도 제시해. 이 숫자는 독립 벤치마크가 아니라 Anthropic 발표값이지만, Managed Agents가 단순 호스팅보다 평가와 재시도 루프까지 제품화하려는 쪽임은 분명해.

주의해서 볼 점

첫째, 이 항목을 Anthropic Claude 모델 family처럼 읽으면 틀려. Agent 안에서 어떤 Claude 모델을 쓸지는 따로 고르지만, 핵심은 모델 가중치나 Context Window가 아니라 agent loop와 runtime이야. 새 Claude 버전이 나오면 agent 설정에 영향을 줄 수는 있어도, 관리형 agent API 자체는 모델명보다 운영 프레임워크에 가까워.

둘째, 직접 Claude API 기능이라는 점을 봐야 해. 공식 API overview와 가격 문서는 이 기능을 직접 Claude API 경로로 설명하고, 제3자 플랫폼 가격이 적용되지 않는다고 적어. Amazon Bedrock이나 Vertex AI에서 Claude 모델을 쓸 수 있다는 말과 관리형 agent session을 그대로 쓸 수 있다는 말은 다른 얘기야.

셋째, 베타와 research preview 상태가 섞여 있어. 기본 Managed Agents endpoint는 managed-agents-2026-04-01 beta header를 요구하고, memory는 2026년 4월 23일 public beta로 발표됐어. 반면 dreaming은 2026년 5월 6일 research preview로 소개됐고, outcomes와 multiagent orchestration도 문서별로 접근 신청이나 preview 조건이 붙을 수 있어. 제품 소개 문장보다 실제 API 문서의 현재 header와 접근 조건을 봐야 해.

넷째, 관리형이라고 해서 보안 검토가 사라지는 건 아니야. Claude가 파일을 읽고 명령을 실행하고 외부 도구를 호출할 수 있다면, 어떤 네트워크를 열지, 어떤 secret을 넘기지 않을지, 어떤 도구 호출은 사람이 승인해야 하는지 정해야 해. session trace와 console observability는 문제를 보는 도구이지, 권한 설계를 대신하는 장치는 아니야.

Claude Managed Agents(클로드 매니지드 에이전트)

전체 AI 기술 맵에서의 위치

한 줄 정의

실제로 무엇을 하나

왜 중요한가

주의해서 볼 점

관련 용어

관련 용어