한 줄 정의

DeepSeek V2.5는 DeepSeek가 2024년 9월 5일 공개한 버전이야. 핵심은 DeepSeek-V2-0628과 DeepSeek-Coder-V2-0724를 한 모델로 합쳐서, 일반 대화와 코딩을 따로 고르지 않아도 되게 만든 통합형 공개 모델 가중치라는 점이야.

출시 시점엔 web과 API에서 모두 쓸 수 있었고, API에선 deepseek-chatdeepseek-coder가 같은 V2.5를 가리켰어. 그래서 2024년 하반기 문서에서 v2.5가 보이면 그냥 버전 숫자가 아니라 DeepSeek의 채팅+코딩 통합 모델을 말하는 경우가 많아.

이 모델로 무엇을 할 수 있나

V2.5는 글쓰기, 질의응답, 코드 생성, 코드 수정처럼 일반 대화와 코딩이 같이 섞이는 일을 한 모델로 처리하려고 나온 버전이야. 모델 카드에선 Function Calling, JSON 출력, FIM completion 예시를 따로 보여줘. 그래서 챗봇처럼 길게 대답하는 일만 하는 모델이라기보다, 구조화된 출력이나 코드 편집 워크플로에도 바로 붙일 수 있는 버전으로 보는 게 맞아.

평가 수치는 벤치마크 문맥으로 따로 보는 게 좋아.

  • ArenaHard: 68.3 -> 76.3
  • AlpacaEval 2.0 LC win rate: 46.61 -> 50.52
  • MT-Bench: 8.84 -> 9.02
  • HumanEval: 89
  • LiveCodeBench: 41

로컬 실행 쪽 감각도 중요해. Hugging Face 카드 기준으로 BF16 추론에는 80GB GPU 8장이 필요하고, 카드 하단엔 236B params가 보여. 공개 모델이긴 하지만 가볍게 노트북에 올리는 급은 아니라는 뜻이야.

왜 중요한가

V2.5가 중요한 이유는 DeepSeek Chat 문맥을 읽을 때 기준점이 되기 때문이야. 2024년 9월 5일엔 chat 별칭과 coder 별칭이 둘 다 V2.5를 가리켰지만, 2024년 12월 26일엔 chat 쪽 별칭이 V3로 올라갔어. 그래서 예전 튜토리얼, 로그, 블로그를 읽을 때 날짜를 빼고 모델명을 보면 금방 헷갈려.

또 2024년 12월 10일엔 DeepSeek-V2.5-1210이 한 번 더 나왔고, 공식 공지는 그 시점에서 V2.5 시리즈가 마감됐다고 적어. 그러니까 v2.5라는 말이 나와도 9월 출시본을 말하는지, 12월 1210 체크포인트까지 묶어서 말하는지부터 나눠서 보는 게 맞아.

주의해서 볼 것

  • v2.5는 DeepSeek 문맥 없이 쓰이면 너무 추상적이야. 이 페이지에선 DeepSeek V2.5를 뜻하지만, 문서 안에서 회사명이나 모델명이 빠져 있으면 먼저 원문 날짜를 봐야 해.
  • chat 별칭은 시점 의존 별칭이야. 2024년 9월에는 V2.5였고, 2024년 12월 26일엔 V3, 지금은 또 다른 버전으로 바뀌어 있어서 현재 모델명처럼 고정해서 읽으면 안 돼.
  • reasoning 별칭 가격이나 reasoning 정보는 2025년 1월 20일 R1 릴리스 문맥이야. V2.5 설명에 그대로 붙이면 버전과 날짜가 섞여.
  • 공개 가중치라는 말과 라이선스 문장은 따로 읽는 게 안전해. 공식 공지는 Hugging Face 공개를 알리고, 모델 카드는 상업적 사용을 지원한다고 적지만, 코드 저장소의 MIT와 모델 사용 조건이 완전히 같은 뜻은 아니야.

같이 보면 좋은 모델

기사에서 특히 자주 헷갈리는 비교선만 짚어 보면 둘이 남아.

  • DeepSeek Chat: 비교 기준은 기능이 아니라 날짜야. 2024년 가을 문서에선 V2.5를 가리킬 수 있지만, 같은 이름이 계속 다른 버전으로 갈아탔기 때문에 예전 로그를 읽을 때만 직접 비교가 필요해.
  • DeepSeek R1: 비교 기준은 모델 성격이야. V2.5는 채팅+코딩 통합 모델이고, R1은 reasoning 중심 공개 모델이라서 둘을 붙여 보면 “범용 작업 통합”과 “추론 특화”가 어디서 갈라지는지 바로 보여.