한 줄 정의

K2.5는 Moonshot AI가 만든 Kimi K2.5 모델 버전을 줄여 부르는 말이야. 독립 회사명도 아니고, Kimi K2 전체 계열을 통째로 부르는 말도 아니야. 기사에서 “Kimi K2.5”, “K2.5”, “kimi-k2.5”가 섞여 나오면 2026년 1월 27일 공개된 멀티모달 오픈 모델 버전으로 읽는 게 먼저야.

이 이름이 커진 이유는 두 가지야. 하나는 Cursor Composer 2의 기반 모델 보도고, 다른 하나는 OpenRouter 사용량 기사에서 Kimi K2.5가 중국 모델의 토큰 호출 증가 사례로 잡힌 일이야. 그래서 K2.5가 보이면 “모델 자체 설명인지, Cursor가 그 모델을 제품에 사용했다는 이야기인지, OpenRouter 안의 호출량 이야기인지”부터 나눠야 해.

이 모델로 무엇을 할 수 있나

Kimi 공식 설명을 기준으로 보면 K2.5는 텍스트만 다루는 채팅 모델보다 작업 범위가 넓어. 이미지와 비디오를 읽고, 화면이나 디자인 참조를 프런트엔드 코드로 바꾸고, 문서·슬라이드·시트·웹사이트·리서치 결과물을 만든다고 안내돼. Kimi 웹과 앱에서는 Instant, Thinking, Agent, Agent Swarm 모드로 나뉘고, 개발팀은 API나 Kimi Code에서 호출할 수 있어.

기술 블로그가 특히 미는 작업은 agentic-coding과 병렬 에이전트 실행이야. K2.5는 시각·텍스트 혼합 토큰 약 15조 개로 이어 학습됐고, 복잡한 작업에서 최대 100개 서브 에이전트와 최대 1,500번의 도구 호출을 조율한다고 설명돼. 같은 문서의 실험 주석은 별도 표기가 없으면 256K 토큰 맥락으로 평가했다고 적어. 그러니까 K2.5를 볼 때는 단답 모델보다 “긴 입력을 읽고 도구를 여러 번 호출하는 작업 모델”에 가깝게 보는 편이 맞아.

기사에서는 Cursor 사례가 더 눈에 띄어. Fortune과 Xinhua는 Composer 2의 기반 모델을 Kimi K2.5로 다뤘어. 여기서 중요한 건 “Cursor가 곧 K2.5”라는 뜻이 아니라, 상용 코딩 제품이 외부 오픈 모델을 기반으로 다시 훈련하거나 제품 안에 통합하는 흐름이 뚜렷해졌다는 점이야. 비교할 때는 접근 경로, 가중치 공개 여부, 라이선스, 가격, 실제 작업 종류를 따로 봐야 해.

왜 중요한가

K2.5는 중국 모델 경쟁을 볼 때 가격표보다 실제 호출량을 같이 보게 해 줘. OpenRouter 사용량 기사는 2026년 3월 16~22일 주간 중국 모델이 7.36조 토큰을 처리했고, 상위 10개 모델 토큰 사용량 중 약 61%가 중국 모델이었다고 적었어. 같은 표에서 Kimi K2.5는 1.21조 토큰으로 잡혀. 이건 전 세계 전체 사용량이 아니라 OpenRouter 안의 관측값이지만, 개발자가 실제로 어떤 모델을 호출하는지 보는 힌트로는 강해.

또 하나는 비용과 에이전트 작업의 결합이야. 같은 OpenRouter 기사에서는 MiniMax M2.5, Kimi K2.5, GLM-5 같은 중국 모델을 가격·효율·에이전트 수요와 함께 설명했고, Xinhua는 중국의 일평균 토큰 호출이 2024년 초 1000억에서 2026년 3월 140조로 늘었다고 보도했어. K2.5는 그 흐름 속에서 “값싼 API” 하나가 아니라 코딩, 시각 입력, 병렬 에이전트 실행까지 묶은 모델 사례로 등장해.

그래서 K2.5를 읽을 때는 DeepSeek처럼 중국 오픈 모델 일반론으로만 보지 않는 게 좋아. K2.5는 Moonshot AIKimi 제품군, Cursor 같은 코딩 도구, OpenRouter 같은 라우팅 플랫폼이 만나는 모델 버전이야. 성능표 하나보다 “어느 제품에서 기반 모델로 쓰였고, 어떤 호출량을 만들었나”가 더 중요한 이름이야.

같이 보면 좋은 모델

이름어떻게 읽나확인할 점
Kimi K2Moonshot AI의 K2 계열 이름K2.5가 이 계열에서 나온 버전인지, 그냥 K2 전체를 말하는지 먼저 가른다.
K2.52026년 1월 공개된 Kimi K2.5 버전시각 입력, 코딩, Agent Swarm, Cursor 기반 모델 보도, OpenRouter 호출량을 함께 본다.
K2.6뒤에 나온 Kimi K2.6 줄임말GGUF, 최신 K2.6 가격, 300개 서브 에이전트 같은 이야기를 K2.5로 잘못 끌고 오지 않는다.
GLM-5같은 기사에서 함께 비교되는 중국 모델OpenRouter 토큰 사용량과 가격 경쟁을 볼 때 Kimi K2.5의 비교군으로 둔다.
MiniMax토큰 경제 기사에서 같이 언급되는 중국 모델 회사·모델 축매출, 해외 사용량, 가격 경쟁 문맥을 Kimi K2.5와 나눠 본다.

주의해서 볼 점

  • K2.5와 K2.6을 섞으면 바로 이상해져. 글에서 GGUF, 최신 K2.6 API 가격, 300개 서브 에이전트 같은 이야기가 나오면 K2.5 문서인지 K2.6 문서인지 먼저 확인해야 해.
  • Thinking 모드가 있다고 해서 chain-of-thought 공개를 뜻하는 건 아니야. Kimi 제품 모드의 Thinking은 사용자가 고르는 작업 방식이고, 모델의 내부 추론 과정을 그대로 보여 준다는 뜻으로 읽으면 안 돼.
  • OpenRouter 수치는 시장 전체가 아니라 관측 창구 하나야. Kimi K2.5가 1.21조 토큰을 기록했다는 말은 OpenRouter 안에서 큰 호출량을 만들었다는 뜻이지, 모든 API 시장에서 같은 비중이라는 뜻은 아니야.