이 용어는 어디까지 신뢰할 수 있나요?

각 용어는 최신 공개 자료 기반으로 정리되며, 출처와 검증 기록을 바탕으로 점진적으로 업데이트됩니다.

V4 Preview (V4 프리뷰)

다른 이름: v4 previewV4 PreviewDeepSeek V4 PreviewDeepSeek-V4 Preview

V4 Preview는 DeepSeek가 2026년 4월 24일 공개한 DeepSeek-V4의 preview 출시 표기야. API 모델명은 `v4-preview`가 아니라 `deepseek-v4-pro`나 `deepseek-v4-flash`로 갈라 봐야 해.

한 줄 정의

V4 Preview는 DeepSeek V4를 처음 공개할 때 붙은 출시 표기야. API에서 그대로 넣는 모델 이름은 아니고, 실제 호출은 deepseek-v4-pro나 deepseek-v4-flash로 갈라져.

그래서 이 말을 보면 먼저 세 가지를 나눠 봐야 해. 하나는 2026년 4월 24일의 preview 발표, 하나는 Pro와 Flash라는 실제 모델 선택지, 하나는 기존 chat/reasoner 호환 이름이 당분간 V4-Flash 쪽으로 이어지는 라우팅이야.

어떻게 작동하나

DeepSeek 문서 기준으로 V4 Preview는 API 주소를 갈아엎는 변화가 아니야. OpenAI 형식이면 https://api.deepseek.com, Anthropic 형식이면 https://api.deepseek.com/anthropic을 그대로 쓰고, model만 deepseek-v4-pro나 deepseek-v4-flash로 바꾸는 쪽에 가까워.

Pro와 Flash는 같은 V4 묶음 안에서도 역할이 달라. Pro는 1.6T total / 49B active parameters로 더 큰 선택지고, Flash는 284B total / 13B active parameters로 더 작고 빠른 선택지야. 둘 다 1M context와 최대 384K output을 내세우지만, 긴 입력을 매번 꽉 채우면 토큰 비용과 지연 시간이 같이 올라가.

예를 들어 오래된 코드에서 DeepSeek Reasoner가 보이면 “R1을 부르는 코드인가?”보다 “지금 날짜에 어떤 V4 모드로 이어지나?”를 먼저 봐야 해. 문서에는 legacy chat/reasoner 이름이 2026년 7월 24일 15:59 UTC 뒤에 중단되고, 그 전까지는 각각 V4-Flash의 non-thinking mode와 thinking mode로 이어진다고 적혀 있어.

왜 중요한가

Preview라는 단어는 가볍게 보이지만, 여기서는 비용과 마이그레이션 판단을 바로 흔들어. v4-preview라는 모델명이 있다고 생각하고 붙이면 호출 자체가 틀어지고, 반대로 기존 Reasoner 이름이 영원히 R1 계열이라고 생각해도 로그 해석이 틀어져.

Chat Completions를 쓰는 팀이면 더 직접적이야. 문서상 V4 모델은 OpenAI ChatCompletions와 Anthropic 인터페이스를 모두 지원하고, thinking mode와 non-thinking mode를 모두 제공해. 에이전트가 코드 수정, 검색, 문서 생성처럼 실패 비용이 큰 작업을 맡는다면 Pro와 Flash를 단순 가격표만 보고 고르기 어렵고, thinking mode까지 같이 실험해야 해.

긴 컨텍스트도 마찬가지야. V4 Preview는 1M context를 강하게 내세우지만, 어텐션과 토큰 처리 비용이 사라지는 건 아니야. 긴 로그나 문서를 한 번에 넣을 수 있다는 말과, 매 요청에서 그렇게 넣어도 된다는 말은 달라. 캐시가 맞는 입력과 매번 새로 들어가는 입력을 나눠 보지 않으면 가격표를 잘못 읽기 쉬워.

실무에서 먼저 확인할 것

호출 이름: 코드에 v4-preview 같은 임의 이름이 들어갔는지 보고, 실제 모델명을 deepseek-v4-pro나 deepseek-v4-flash로 고쳐야 해.
legacy 라우팅: 기존 chat/reasoner 이름을 계속 쓰는 서비스라면 2026-07-24 15:59 UTC 전에 새 모델명으로 바꿀 일정을 잡아야 해.
모드 선택: 단순 채팅, 요약, 긴 RAG 입력은 Flash부터 계산하고, 실패 비용이 큰 코딩 에이전트나 복잡한 추론은 Pro와 thinking mode를 따로 비교해 봐야 해.
비용 기준: 2026-05-07 확인 시점의 DeepSeek 공식 가격표만 기준으로 보면 Flash가 입력 cache hit $0.0028/1M, cache miss $0.14/1M, 출력 $0.28/1M 토큰이야. Pro 할인 가격은 입력 cache hit $0.003625/1M, cache miss $0.435/1M, 출력 $0.87/1M 토큰이고 2026-05-31 15:59 UTC 뒤에는 바뀔 수 있어.
근거 범위: 성능 문구는 DeepSeek 공식 발표의 벤더 주장으로 보고, 실제 도입 전에는 자신의 로그, 도구 호출, 오류 복구 비용으로 다시 비교하는 게 맞아.

관련 용어

포맷 v3 가이드 wiki 3.2.0

팩트 체크

통과 · 2026-05-07 KST

검증 생성: AI + 편집 검토 · 2026-05-07 상태: 통과

통과 원문 대조 검증 출처 6

공식 V4 공지와 변경 로그를 기준으로, V4 Preview를 API 모델명 하나가 아니라 DeepSeek-V4 출시 단계로 맞춰 봤어.

독자 문제 대조: `v4-preview`를 그대로 모델 파라미터에 넣는 문제가 아니라, preview 공지에서 Pro와 Flash를 어떻게 고르는지 먼저 보게 했어.
DeepSeek 공지는 2026-04-24 V4 Preview를 공개하면서 `deepseek-v4-pro`와 `deepseek-v4-flash`, 1M context, open weights를 같이 내세워.
변경 로그는 같은 날짜에 OpenAI ChatCompletions와 Anthropic 인터페이스를 모두 지원하고, base_url은 그대로 두고 model만 새 이름으로 바꾸라고 적어.
R1 출처는 비교용으로만 썼어. 2025-01-20의 Reasoner 이름은 R1 호출용이었고, V4 발표 뒤에는 V4-Flash thinking 쪽 호환 이름으로 봐야 해.

통과 교차 검증 검증 출처 6

공식 문서 넷과 독립 출처 둘을 나눠 봤어. 모델 분리와 1M context는 외부 출처로도 맞고, 가격은 DeepSeek 공식 가격표 기준으로만 제한했어.

비교 기준: release note는 발표 범위, changelog는 API 라우팅, quick start는 실제 호출 이름, pricing은 공식 비용 조건, Artificial Analysis와 Simon Willison 글은 독립 확인을 맡겼어.
Quick Start 문서는 새 V4 모델 둘과 폐기 예정인 legacy chat/reasoner 이름을 같은 표에 보여줘.
가격표는 두 V4 모델이 1M context와 최대 384K output을 공유하고, JSON Output, Tool Calls, Chat Prefix Completion을 지원한다고 적어.
Artificial Analysis는 V4 Pro/Flash, 1.6T/49B와 284B/13B, 1M context, hybrid thinking/non-thinking 구성을 독립적으로 다시 적고 자체 벤치마크까지 붙였어.
Simon Willison도 두 preview 모델, 1M-token context, MIT license, Pro/Flash 규모를 별도 글에서 다시 확인해.

통과 수치 검증 검증 출처 5

날짜, 모델 규모, context 길이는 여러 출처로 맞췄고, 가격 숫자는 2026-05-07 DeepSeek 공식 pricing 기준으로만 잡았어.

V4 Preview 공개일은 2026-04-24이고, 변경 로그의 DeepSeek-V4 항목도 같은 날짜로 잡혀 있어.
공식 공지는 V4-Pro를 1.6T total / 49B active, V4-Flash를 284B total / 13B active로 나눠 적어.
가격표는 두 모델 모두 context length 1M, max output 384K로 잡고 있어.
2026-05-07 확인 시점의 DeepSeek 공식 가격표는 Flash를 cache hit input $0.0028/1M, cache miss input $0.14/1M, output $0.28/1M로 적어.
같은 공식 가격표는 Pro 할인 가격을 cache hit input $0.003625/1M, cache miss input $0.435/1M, output $0.87/1M로 적고, 할인 기한을 2026-05-31 15:59 UTC로 잡아.
DeepSeek pricing 문서는 가격 변동 가능성을 직접 적고 있어서, 본문 가격은 장기 고정값이 아니라 확인 시점의 공식 가격표로만 읽어야 해.

통과 비판 검토 검증 출처 6

preview라는 말이 주는 오해를 줄이려고, 모델명·출시 단계·legacy 라우팅·가격의 경계를 따로 세웠어.

`V4 Preview`는 발표 이름이야. 실제 API 호출에는 `deepseek-v4-pro`나 `deepseek-v4-flash`를 넣어야 하고, `v4-preview`라는 모델명을 만든 듯 쓰면 안 맞아.
공식 문서의 성능 문구는 벤더 발표라서 그대로 최종 성능 보증처럼 읽지 않았고, 실무 판단은 Pro/Flash, thinking mode, 실패 비용으로 나눠 보게 했어.
R1과 V4를 같은 계열의 연속 출시로만 묶으면 위험해. R1은 671B total / 37B active 공개 reasoning 모델이고, V4 Preview는 Pro/Flash 두 모델과 1M context API 전환을 같이 묶은 발표야.
가격 문서는 변동 가능성을 직접 적고 있어서, 본문에서도 장기 비용을 고정 숫자로 박아 두지 않고 확인 시점을 붙였어.

가장 큰 오해는 Reasoner 이름이 계속 R1만 가리킨다고 보는 쪽이야. V4 발표 뒤에는 호환 라우팅 때문에 날짜를 같이 봐야 해.
`Preview`라는 단어만 보고 실험용이라서 API에 못 붙는다고 읽어도 안 맞아. 공식 문서는 같은 날 API 사용 가능과 모델명을 함께 냈어.

출처: DeepSeek V4 Preview Release | DeepSeek API Docs , DeepSeek API Docs - Change Log , DeepSeek API Docs - Models & Pricing , DeepSeek API Docs - Your First API Call , deepseek-ai/DeepSeek-R1 , DeepSeek-R1 Release | DeepSeek API Docs , Artificial Analysis - DeepSeek V4 Pro and V4 Flash , Simon Willison - DeepSeek V4