한 줄 정의

V4 Preview는 DeepSeek V4를 처음 공개할 때 붙은 출시 표기야. API에서 그대로 넣는 모델 이름은 아니고, 실제 호출은 deepseek-v4-prodeepseek-v4-flash로 갈라져.

그래서 이 말을 보면 먼저 세 가지를 나눠 봐야 해. 하나는 2026년 4월 24일의 preview 발표, 하나는 Pro와 Flash라는 실제 모델 선택지, 하나는 기존 chat/reasoner 호환 이름이 당분간 V4-Flash 쪽으로 이어지는 라우팅이야.

어떻게 작동하나

DeepSeek 문서 기준으로 V4 Preview는 API 주소를 갈아엎는 변화가 아니야. OpenAI 형식이면 https://api.deepseek.com, Anthropic 형식이면 https://api.deepseek.com/anthropic을 그대로 쓰고, modeldeepseek-v4-prodeepseek-v4-flash로 바꾸는 쪽에 가까워.

Pro와 Flash는 같은 V4 묶음 안에서도 역할이 달라. Pro는 1.6T total / 49B active parameters로 더 큰 선택지고, Flash는 284B total / 13B active parameters로 더 작고 빠른 선택지야. 둘 다 1M context와 최대 384K output을 내세우지만, 긴 입력을 매번 꽉 채우면 토큰 비용과 지연 시간이 같이 올라가.

예를 들어 오래된 코드에서 DeepSeek Reasoner가 보이면 “R1을 부르는 코드인가?”보다 “지금 날짜에 어떤 V4 모드로 이어지나?”를 먼저 봐야 해. 문서에는 legacy chat/reasoner 이름이 2026년 7월 24일 15:59 UTC 뒤에 중단되고, 그 전까지는 각각 V4-Flash의 non-thinking mode와 thinking mode로 이어진다고 적혀 있어.

왜 중요한가

Preview라는 단어는 가볍게 보이지만, 여기서는 비용과 마이그레이션 판단을 바로 흔들어. v4-preview라는 모델명이 있다고 생각하고 붙이면 호출 자체가 틀어지고, 반대로 기존 Reasoner 이름이 영원히 R1 계열이라고 생각해도 로그 해석이 틀어져.

Chat Completions를 쓰는 팀이면 더 직접적이야. 문서상 V4 모델은 OpenAI ChatCompletions와 Anthropic 인터페이스를 모두 지원하고, thinking mode와 non-thinking mode를 모두 제공해. 에이전트가 코드 수정, 검색, 문서 생성처럼 실패 비용이 큰 작업을 맡는다면 Pro와 Flash를 단순 가격표만 보고 고르기 어렵고, thinking mode까지 같이 실험해야 해.

컨텍스트도 마찬가지야. V4 Preview는 1M context를 강하게 내세우지만, 어텐션토큰 처리 비용이 사라지는 건 아니야. 긴 로그나 문서를 한 번에 넣을 수 있다는 말과, 매 요청에서 그렇게 넣어도 된다는 말은 달라. 캐시가 맞는 입력과 매번 새로 들어가는 입력을 나눠 보지 않으면 가격표를 잘못 읽기 쉬워.

실무에서 먼저 확인할 것

  • 호출 이름: 코드에 v4-preview 같은 임의 이름이 들어갔는지 보고, 실제 모델명을 deepseek-v4-prodeepseek-v4-flash로 고쳐야 해.
  • legacy 라우팅: 기존 chat/reasoner 이름을 계속 쓰는 서비스라면 2026-07-24 15:59 UTC 전에 새 모델명으로 바꿀 일정을 잡아야 해.
  • 모드 선택: 단순 채팅, 요약, 긴 RAG 입력은 Flash부터 계산하고, 실패 비용이 큰 코딩 에이전트나 복잡한 추론은 Pro와 thinking mode를 따로 비교해 봐야 해.
  • 비용 기준: 2026-05-07 확인 시점의 DeepSeek 공식 가격표만 기준으로 보면 Flash가 입력 cache hit $0.0028/1M, cache miss $0.14/1M, 출력 $0.28/1M 토큰이야. Pro 할인 가격은 입력 cache hit $0.003625/1M, cache miss $0.435/1M, 출력 $0.87/1M 토큰이고 2026-05-31 15:59 UTC 뒤에는 바뀔 수 있어.
  • 근거 범위: 성능 문구는 DeepSeek 공식 발표의 벤더 주장으로 보고, 실제 도입 전에는 자신의 로그, 도구 호출, 오류 복구 비용으로 다시 비교하는 게 맞아.