한 줄 정의
Kimi K2는 Moonshot AI가 만든 에이전트 지향 MoE 언어모델 계열이야. 그냥 말을 잘하는 챗봇보다 코드 작성, 툴 호출, 여러 단계 작업 실행에 맞춘 모델이라고 보면 감이 빨리 와. 지금 Kimi 플랫폼에서 kimi-k2라고 부를 때는 보통 0905 계열 API를 가리킨다고 봐도 돼.
이 모델로 무엇을 할 수 있나
실무에서는 코딩 에이전트 백엔드, 리팩터링, 긴 저장소 읽기, 문서 기반 자동화에 많이 붙여. Moonshot AI는 이 계열을 OpenAI 호환 Chat Completions와 Anthropic 호환 API로 제공하고 있어서 기존 앱에 붙이기 쉬운 편이야. 공식 플랫폼 표기 기준으로 kimi-k2는 입력 1M 토큰당 0.60달러, 출력 1M 토큰당 2.50달러로 과금되고, 공개 웨이트 쪽은 Hugging Face에서 받아 vLLM이나 SGLang 같은 엔진에 올려 볼 수도 있어.
왜 중요한가
Kimi K2가 중요한 이유는 Moonshot AI가 에이전트 코딩 쪽 경쟁을 오픈 웨이트와 클라우드 API 둘 다로 밀었다는 점이야. 공개 웨이트 기준 Kimi K2는 총 1T 파라미터에 토큰당 32B 활성 구조라서, 성능 숫자만이 아니라 배포 경로와 비용 구조까지 같이 기사에 붙어 나와. 또 0711의 128K에서 0905의 256K로 컨텍스트를 늘리면서 긴 작업 흐름과 프런트엔드 코드 품질을 함께 밀어, 이 라인이 단순 채팅 모델보다 개발자용 실행 엔진 쪽 전략에 가깝다는 신호로 읽을 수 있어.
같이 보면 좋은 모델
chain-of-thought는 모델 자체보다 추론 과정을 어떻게 다루는지 보는 말이라서, Kimi K2의 일반형과 thinking 계열 차이를 읽을 때 같이 보면 좋아.o1은 OpenAI의 초기 추론형 라인업이라서, Kimi K2가 코딩 에이전트와 툴 호출에 더 강하게 포지셔닝된다는 점이 또렷해져.o3는 더 최신 OpenAI 추론 모델 축이라서, Kimi K2를 폐쇄형 API 모델과 비교할 때 기준점이 돼.gpt-oss는 오픈 웨이트와 로컬 배포 문맥을 비교하기 좋고, Kimi K2의 modified MIT 공개 전략이 왜 자주 같이 언급되는지도 보게 해.