무슨 일이 일어났나
DeepSeek-V4가 100만 개 토큰 컨텍스트와 최대 384,000개 토큰 출력을 지원하는 오픈웨이트 모델로 나왔어. HuggingFace 블로그에서 실제 에이전트 작업 테스트 결과를 공유했는데, 멀티 툴 호출에서 혼동 없이 100개 이상 연속 작업을 처리했다는 보고가 올라왔어. “지금까지 테스트한 오픈웨이트 모델 중 복잡한 툴 정의에서 헷갈리지 않은 몇 안 되는 모델”이라는 평이야.
왜 이게 일어났나
에이전트 AI를 실제로 쓰려면 컨텍스트가 길고, 여러 툴을 순서대로 호출할 때 상태를 잃지 않아야 해. 기존 오픈웨이트 모델들은 툴 호출이 복잡해지면 중간에 헷갈리는 경우가 많았어. V4는 아키텍처 수준에서 이 부분을 건드렸다는 게 커뮤니티에서 주목받는 이유야 — 벤치마크 숫자보다 실제 에이전트 시나리오에서의 동작이 기준이 된 거야.
어떤 의미인가
바이브코딩이나 AI 업무자동화를 직접 구성하는 입장이라면, 에이전트 루프에 오픈웨이트 모델을 넣을 때 고려할 옵션이 하나 생긴 거야. 100만 토큰 컨텍스트는 긴 코드베이스나 문서 전체를 한 번에 넣어도 잘리지 않는다는 의미고, 384K 출력은 긴 응답이 중간에 끊기지 않는다는 거야. 로컬 실행이니까 API 비용 없이 돌릴 수 있어 — 하드웨어 요건은 있지만.