이 용어는 어디까지 신뢰할 수 있나요?

각 용어는 최신 공개 자료 기반으로 정리되며, 출처와 검증 기록을 바탕으로 점진적으로 업데이트됩니다.

Chat Completions(챗 컴플리션스)

다른 이름: chat completionsChat Completionschat.completions

챗 컴플리션스는 대화형 LLM 호출 인터페이스 이름이야. DeepSeek 같은 OpenAI 호환 API에서는 `/chat/completions` 엔드포인트를 뜻하고, `messages` 배열을 보내 답변, 스트리밍, JSON 출력, tool calls 같은 결과를 받는 경로로 읽는 편이 정확해.

전체 AI 기술 맵에서의 위치

응용 (Application)

프로젝트 (Project)

데이터셋 (Dataset)

기법 (Technique)

프레임워크 (Framework)

모델 (Model)

개념 (Concept)

Agents SDK(에이전트 SDK)AI Studio (AI 스튜디오)Aider(에이더)Alibaba Cloud API(알리바바 클라우드 API)Alibaba Cloud Model Studio(알리바바 클라우드 모델 스튜디오)Amazon Bedrock(아마존 베드록)Anthropic API(앤트로픽 API)App Store(앱 스토어)Batch API(배치 API)BentoML(벤토엠엘)Chat (대화형 AI 인터페이스)Chat Completions(챗 컴플리션스)ChatGPT(챗지피티)Chroma(크로마)Claude Code(클로드 코드)Claude Code Remote Control(클로드 코드 리모트 컨트롤)Claude Cowork(클로드 코워크)Claude Desktop(클로드 데스크톱)claude remote-control(클로드 리모트 컨트롤 명령)claude --version (버전 조회)claude.ai(클로드 웹 앱)Cline(클라인)CloudTrail(클라우드트레일)Codex(코덱스)Codex CLI(코덱스 CLI)ComfyUI(컴피유아이)Continue(컨티뉴)GitHub Copilot (깃허브 코파일럿)Cursor(커서)DeepSeek API(딥시크 API)DGX B200(디지엑스 B200)DGX Spark(디지엑스 스파크)Docker(도커)Excel(엑셀)FAISS (페이스)Gemini API(제미니 API)Gemini API File Search(제미니 API 파일 검색)Gemini Developer API(제미니 디벨로퍼 API)Gemini Enterprise Agent Platform(제미니 엔터프라이즈 에이전트 플랫폼)GitHub (깃허브)Gmail(지메일)Google AI Studio(구글 AI 스튜디오)Google Calendar(구글 캘린더)Google Docs(구글 문서)Google Drive(구글 드라이브)Google Search(구글 검색)Google Sheets(구글 시트)H100 (엔비디아 호퍼 GPU)Hugging Face(허깅 페이스)Jetson Thor(젯슨 토르)Kimi API(키미 API)Kimi Code(키미 코드)Kimi.com(키미닷컴)KTransformers (케이트랜스포머스)Live API(라이브 API)llama-cli (로컬 LLM CLI)llama.cpp(로컬 LLM 런타임)llama-server(로컬 LLM 서빙 서버)llama.cpp (로컬 LLM 추론 엔진)LM Studio(엘엠 스튜디오)LocalLLaMA (로컬라마)Microsoft Foundry(마이크로소프트 파운드리)MiMo Code (미모 코드)MLflow(엠엘플로우)Modal(모달)Model Garden(모델 가든)Model Studio(모델 스튜디오)Model Studio API(모델 스튜디오 API)ModelScope(모델스코프)n8n(엔에잇엔)Ollama(올라마)OpenAI API(오픈에이아이 API)OpenAI Chat Completion(오픈AI 챗 컴플리션)OpenAI SDK(오픈에이아이 SDK)OpenClaw(오픈클로)OpenRouter(오픈라우터)Perplexity (퍼플렉시티)Pinecone (파인콘)Qdrant (큐드런트)Qwen API(큐원 API)Qwen Code(큐원 코드)Qwen Studio(큐원 스튜디오)Raspberry Pi (라즈베리 파이)Replicate(레플리케이트)Responses API(리스폰스 API)SGLang(에스지랭)Studio(스튜디오)Supabase(수파베이스)Tokenizer(토크나이저)Triton Inference Server(트리톤 추론 서버)Vector Database (벡터 데이터베이스)vLLM(브이엘엘엠)VS Code(비주얼 스튜디오 코드)Weaviate(위비에이트)Weights & Biases(웨이츠 앤 바이어시스)Windsurf(윈드서프)

Activepieces (액티브피시스)agent-skills Agentic AQUA (에이전틱 아쿠아)AgentTrust Apache Airflow (아파치 에어플로)Cairn (케언)DeepGEMM(딥시크 CUDA 커널 라이브러리)Engram(엔그램)HyperFrames (하이퍼프레임스)LightRAG (라이트RAG)Manifest (매니페스트)mcp-mydisease (MyDisease.info MCP 서버)mcp-xray (Jira Xray MCP 서버)NautilusTrader (노틸러스 트레이더)NostalgiaForInfinity (노스탤지아 포 인피니티)opencodex(오픈코덱스)OpenMemory (오픈메모리)PocketBase (포켓베이스)Microsoft Qlib (마이크로소프트 Qlib)Savvly MCP (세이블리 MCP 서버)Tmax(티맥스)whisper.cpp (위스퍼.cpp)yfinance (와이파이낸스)

Nemotron-Personas-Korea (네모트론 페르소나스 코리아)PII-Masking-300k(피아이아이 마스킹 300K)

Agentic AI (에이전틱 AI)Agentic Coding(에이전틱 코딩)benchmark (벤치마크)Chain-of-Thought(연쇄 추론 유도)DeepSeek Sparse Attention (딥시크 스파스 어텐션)Distillation (지식 증류)Eval(평가)Fine-tuning (파인튜닝)Function Calling(함수 호출)Grounding (그라운딩)Guardrail(가드레일)--kv-cache-dtype bfloat16 (BF16 KV 캐시 저장 형식 플래그)Prompt Caching(프롬프트 캐싱)Prompt Engineering(프롬프트 엔지니어링)Quantization (양자화)RAG (검색 증강 생성)reasoning.effort (리즈닝 이포트)Red Teaming (레드 팀잉)RLHF(인간 피드백 기반 강화학습)Speech to Text(음성 인식)Synthetic Data(합성 데이터)Text to Speech(음성 합성)Tool Use(도구 사용)Training(학습)Vibe Coding(바이브 코딩)

Agent Platform(에이전트 플랫폼)Agent Runtime(에이전트 런타임)AutoGen(오토젠)Claude Managed Agents(클로드 매니지드 에이전트)CrewAI (크루에이아이)DeepSpeed(딥스피드)GGUF(GGUF 모델 파일 형식)Gradio (그라디오)JAX (잭스)Kubeflow(쿠브플로우)LangChain (랭체인)LangGraph(랭그래프)LlamaIndex (라마인덱스)llm-server(로컬 llama.cpp 서빙 자동화 프레임워크)MCP (모델 컨텍스트 프로토콜)MCP server (MCP 서버)MLX(엠엘엑스)ONNX(오닉스)PyTorch(파이토치)Ray(레이)Runtime(런타임)Streamlit(스트림릿)TensorFlow (텐서플로)TensorRT Edge-LLM(텐서RT 엣지 LLM)Transformer Engine(트랜스포머 엔진)Vercel AI SDK(버셀 AI SDK)x402 (에이전트 micropayment 프로토콜)

Alibaba Qwen (알리바바 큐원)Anthropic Claude(앤트로픽 클로드)ChatGPT-5.2 Instant (챗지피티 5.2 인스턴트)ChatGPT-5.2 Pro (챗지피티 5.2 프로)Claude(클로드)Claude Fable 5(클로드 페이블 5)Claude Opus(클로드 오퍼스)Claude Opus 4.5(클로드 오퍼스 4.5)Claude Opus 4.6(클로드 오퍼스 4.6)Claude Opus 4.7(클로드 오퍼스 4.7)Claude Opus 4.6(클로드 오퍼스 4.6)Claude Sonnet (클로드 소넷)Claude Sonnet 4.5(클로드 소네트 4.5)DALL-E (달리)DeepSeek (딥시크)deepseek-chat (딥시크 챗)DeepSeek R1(딥시크 R1)DeepSeek Reasoner (딥시크 리저너)DeepSeek-V3.2-Speciale (딥시크 V3.2-Speciale)DeepSeek V4 (딥시크 V4)FLUX.1 (플럭스 원)Gemini(제미니)Gemini 2.5 (제미나이 2.5)Gemini 2.5 Flash (제미나이 2.5 플래시)Gemini 2.5 Pro (제미나이 2.5 프로)Gemini Embedding(제미니 임베딩)Gemini Embedding 2(제미니 임베딩 2)Gemini Omni(제미니 옴니)Gemma (젬마)Gemma 3(젬마 3)Gemma 4(젬마 4)Gemma-4-26B-A4B-NVFP4(젬마 4 26B A4B NVFP4)GLM (지엘엠)GLM 5(지엘엠 5)GLM 5.1(지엘엠 5.1)GPT-2 (지피티-2)GPT-3 (지피티-3)GPT-3.5 (지피티-3.5)GPT-4 (지피티-4)GPT-4.1 (지피티 4.1)GPT-4o(지피티-4o)gpt-4o-mini (지피티-4o 미니)gpt-4o-mini-2024-07-18 스냅샷 GPT-5 (지피티-5)GPT-5.5 Instant (지피티 5.5 인스턴트)GPT-5-Codex (지피티 5 코덱스)GPT-5.1 (지피티 5.1)gpt-5.1-chat-latest (지피티 5.1 챗 레이티스트)GPT-5.1 Codex (지피티 5.1 코덱스)GPT-5.1 Codex mini (지피티 5.1 코덱스 미니)gpt-5.2 gpt-5.2-2025-12-11 (GPT-5.2 고정 스냅샷)gpt-5.2-chat-latest (지피티 5.2 챗 레이티스트)GPT-5.2 Pro (지피티 5.2 프로)GPT-5.2 Pro 2025-12-11 스냅샷 (지피티 5.2 프로 고정 버전)GPT-5.2 Thinking (지피티 5.2 씽킹)GPT-5.3 (지피티 5.3)gpt-5.3-chat-latest (지피티 5.3 챗 레이티스트)GPT-5.3 Instant (GPT-5.3 인스턴트)GPT-5.4 (지피티 5.4)gpt-5.4-2026-03-05 (GPT-5.4 고정 스냅샷)GPT-5.4 API (지피티 5.4 API)GPT-5.4-Cyber (지피티 5.4 사이버)GPT-5.4 Mini (지피티 5.4 미니)GPT-5.4 Pro (지피티 5.4 프로)GPT-5.4 Thinking (지피티 5.4 씽킹)GPT-5.5 (지피티 5.5)GPT-5.5 Instant (지피티 5.5 인스턴트)GPT-5.5 Pro (GPT-5.5 프로)GPT-5.5 Thinking (지피티 5.5 씽킹)GPT Image(지피티 이미지)gpt-image-2 (지피티 이미지 2)gpt-oss(지피티 오에스에스)GPT-OSS 20B(오픈 웨이트 모델)GPT-Rosalind(지피티-로절린드)Grok (그록)Imagen (이마젠)K2.5 (키미 K2.5)Kimi(키미)Kimi K2 (키미 K2)Kimi K2.6 (키미 K2.6)Llama (라마)Lyria (리리아)M2.7(엠투점칠)MiMo-V2.5-ASR (샤오미 음성인식 모델)MiniMax M2.7(미니맥스 M2.7)Mistral(미스트랄 모델 계열)Mistral AI (미스트랄 AI)Mixtral(믹스트랄)model="deepseek-reasoner" (딥시크 리저너 모델값)Mythos Preview (마이토스 프리뷰)Nano Banana(나노 바나나)Nemotron 3 Nano Omni (네모트론 3 나노 옴니)Nemotron OCR v2 (네모트론 OCR v2)o1(OpenAI 추론 모델)o3 (오쓰리)Phi (파이)Privacy Filter(프라이버시 필터)Qwen (큐원)큐웬 3.5(Qwen 3.5)Qwen3 (큐원3)Qwen3-14B (큐원3 14B)Qwen3-14B-GGUF (큐원3 14B GGUF)Qwen3-30B-A3B (큐웬3 30B A3B)Qwen3.5-122B-A10B (122B MoE 대체형)Qwen3.5-27B (큐웬3.5-27B)Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled (쿠엔3.5-27B 클로드 4.6 오퍼스 리즈닝 디스틸드)Qwen3.5-35B-A3B (큐원 3.5-35B-A3B)Qwen3.5-9B (큐원 3.5-9B)Qwen3.5-9B BF16 (큐원 3.5-9B BF16)Qwen3.6 (큐원 3.6)Qwen3.6-27B (큐원 3.6-27B)Qwen3.6 27B FP8 (큐원 3.6 27B FP8)Qwen3.6-35B-A3B (큐원 3.6-35B-A3B)Sora (소라)Stable Diffusion(스테이블 디퓨전)DeepSeek V2.5 (딥시크 V2.5)DeepSeek V3.2 (딥시크 V3.2)V3.2-Speciale (딥시크 V3.2-Speciale)V4-Flash (딥시크 V4-Flash)V4 Pro (딥시크 V4 프로)Veo (비오)Whisper (위스퍼)

24GB GPU(24GB VRAM 카드)A3B (활성 파라미터 3B 표기)A4B(활성 파라미터 4B)A4B MoE(A4B 전문가 혼합 표기)A4B NVFP4(A4B 엔브이FP4)AI Agent (AI 에이전트)Google Cloud Agent Gateway (에이전트 게이트웨이)Agent Identity(에이전트 신원)Agent Observability(에이전트 관측성)AI Mode (AI 모드)Alignment(정렬)안드로이드(Android)Anthropic(앤트로픽)API (애플리케이션 프로그래밍 인터페이스)Apple Silicon (애플 실리콘)Attention (어텐션)AWS Bedrock(AWS 베드록)Bedrock(베드록)BF16 (브레인 플로팅 포인트 16)BF16 KV (BF16 키-값 캐시)Blackwell (NVIDIA GPU 아키텍처)BrowseComp(브라우즈컴프)chat-latest (챗 레이티스트)ChatGPT Instant (챗지피티 인스턴트)CLI(명령줄 인터페이스)Cloud (클라우드)Coding Agent(코딩 에이전트)Context(컨텍스트)Context Window(컨텍스트 윈도우)CUDA(쿠다)CUDA 12.9(쿠다 12.9)dataset(데이터셋)Deep Research (딥 리서치)Developer Tools(개발자 도구)DFlash (디플래시)Diffusion Model(확산 모델)E2B (이투비)E4B (이포비)Embedding (임베딩)Enterprise(엔터프라이즈)Enterprise AI(엔터프라이즈 AI)F1 96(에프원 96 표기)F32 (32비트 부동소수점)File Search(파일 검색)FIM completion(중간 채우기 완성)Flash(플래시)FP16 (반정밀도 부동소수점)FP4 (4비트 부동소수점 포맷)FP4 Indexer(FP4 인덱서)FP8 (8비트 부동소수점 포맷)FP8 E4M3(8비트 E4M3 포맷)FP8 KV (FP8 키-값 캐시)FP8 양자화 가중치 FP8 Tensor Core(FP8 텐서 코어)Gated DeltaNet(게이티드 델타넷)GDDR7(그래픽 DRAM 7세대)GDDR7 ECC(오류 수정 GDDR7 메모리)Gemini Intelligence (제미니 인텔리전스)GPQA Diamond (지피큐에이 다이아몬드)GPT (생성형 사전학습 트랜스포머)GPU (그래픽 처리 장치)GPU VRAM(GPU 전용 비디오 메모리)GUI(그래픽 사용자 인터페이스)Hallucination (환각)HTTP API(HTTP 호출 인터페이스)Hugging Face Hub(허깅 페이스 허브)HumanEval(휴먼이밸)IDE (통합 개발 환경)Image Generation(이미지 생성)Inference (추론)Instant(인스턴트)INT4 (4비트 정수 정밀도)INT8 (8비트 정수 정밀도)K2.6 (키미 K2.6 줄임말)KV Cache (KV 캐시)Language Model (언어 모델)Linux(리눅스)LiveCodeBench(라이브코드벤치)LLM (거대 언어 모델)Local LLM (로컬 LLM)Long Context (긴 문맥)M5 Max(M5 맥스)M5 Max 64GB(M5 맥스 64GB)Mac(맥)Managed Agents(관리형 에이전트)Mega MoE(메가 MoE)Memory(메모리)Mixture of Experts(전문가 혼합)MMLU(엠엠엘유)MMLU Pro(엠엠엘유 프로)모델 Multimodal AI(멀티모달 AI)Mythos (마이토스)Nano Omni (나노 옴니)Nemotron(네모트론)NL2Repo 39.8(엔엘투레포 39.8)Nous Research (누스 리서치)NVFP4 (NVIDIA FP4 포맷)NVIDIA GPU(엔비디아 GPU)NVLink(엔비디아 GPU 인터커넥트)OAuth(권한 위임)OCR (광학 문자 인식)On-device AI(온디바이스)Open-weight(오픈 웨이트)openai-agents>=0.14.0(오픈AI 에이전트 SDK 0.14.0 이상)OpenAI-compatible(OpenAI 호환)p95(95번째 백분위 지연시간)Personal Intelligence(퍼스널 인텔리전스)PrivateLink(프라이빗링크)Project Glasswing (프로젝트 글래스윙)PyPI (파이썬 패키지 인덱스)Python (파이썬)Q8 KV (Q8 키-값 캐시)Qwen3.6-35B-A3B Benchmarks (큐웬3.6 벤치마크)RAM (시스템 메모리)Reasoning Model (추론 모델)reasoning content(추론 내용)Reasoning Model (추론 모델)RTX PRO (엔비디아 전문가용 GPU 계열)SaaS(서비스형 소프트웨어)Search (검색)Small Language Model(소형 언어 모델)SWE-bench(깃허브 이슈 해결 벤치마크)SWE-Bench Pro(소프트웨어 엔지니어링 에이전트 벤치마크)SWE-bench Verified (스위벤치 베리파이드)SWE Multilingual(다국어 소프트웨어 엔지니어링 벤치마크 표기)SWE-Pro(에스더블유이 프로 표기)SwiGLU(스위글루)Tensor Core(텐서 코어)Terminal-Bench (터미널 벤치)Terminal-Bench 2.0(터미널 벤치 2.0)Thinking (씽킹)tok/s(초당 토큰)Token (토큰)Token Plan(토큰 플랜)TPU(텐서 처리 장치)Transformer (트랜스포머)Trusted Access (신뢰 기반 접근)TypeScript(타입스크립트)Vertex AI (버텍스 AI)VIBE-Pro(바이브 프로)Video Generation(영상 생성)Vision-Language Model (비전-언어 모델)VRAM(비디오 메모리)Model Weights(웨이트)Windows(윈도우)Word(워드 문서)Xiaomi MiMo(샤오미 미모)YaRN (야른)

한 줄 정의

Chat Completions(챗 컴플리션스)는 대화형 API 호출 인터페이스 이름이야. DeepSeek 문맥에서는 /chat/completions 엔드포인트를 뜻하고, 앱이나 서버가 messages 배열과 모델 값을 보내면 답변, 스트리밍, JSON 출력, 도구 사용 결과를 받는 경로라고 보면 돼.

중요한 건 이 이름이 모델 자체가 아니라는 점이야. 예를 들어 deepseek-chat과 DeepSeek Reasoner는 이 인터페이스 위에서 고르는 모델 별칭이고, 챗 컴플리션스는 그 별칭을 실어 보내는 호출 방식이야.

실제로 무엇을 하나

이 인터페이스는 멀티턴 대화, 구조화된 출력, 도구 호출처럼 대화형 작업을 한 경로로 묶어 줘. DeepSeek의 2026년 5월 3일 기준 공식 참조는 messages를 필수 입력으로 두고, system, user, assistant, tool 역할을 한 요청 안에서 함께 받는다고 설명해. stream=true를 켜면 서버가 SSE로 조각 응답을 보내고 data: [DONE]으로 끝내며, 완료 뒤에는 usage.prompt_cache_hit_tokens, prompt_cache_miss_tokens, completion_tokens 같은 사용량 필드를 돌려줘. 여기서 토큰은 과금과 길이 계산에 쓰는 기본 단위야.

실무에서 자주 쓰는 장면은 두 가지야. 첫째, 여러 번 오가는 챗봇이나 업무 도우미야. DeepSeek 가이드는 이 API가 상태 비저장형이라서, 2번째 질문을 보낼 때는 1번째 답변까지 messages에 다시 붙여 보내야 한다고 적어. 둘째, 에이전트 흐름이야. 2024년 7월 25일 공지 기준으로 여기에 JSON Output, Function Calling, Chat Prefix Completion이 붙었고, JSON 출력은 response_format={"type":"json_object"}처럼 강제할 수 있어. 그래서 검색, 크롤링, 내부 도구 실행처럼 모델 바깥 함수를 끼우는 자동화 경로에서 자주 쓰여.

왜 중요한가

이 용어가 중요한 이유는 문서와 로그를 읽을 때 층위를 바로 가르게 해 주기 때문이야. “챗 컴플리션스를 쓴다”는 말은 특정 모델 성능을 뜻하는 게 아니라, 대화형 메시지 포맷과 응답 계약을 따르는 호출 방식을 뜻해. 여기에 어떤 모델을 태우는지는 날짜와 제품 정책에 따라 달라질 수 있어.

DeepSeek 사례가 그 차이를 잘 보여줘. 2025년 1월 20일 R1 출시 공지는 같은 대화형 호출 경로에서 reasoning 별칭으로 DeepSeek R1을 호출하라고 안내했어. 그 뒤 변경 로그는 chat 별칭과 reasoning 별칭이 비추론 모드와 사고 모드(thinking mode)를 나누는 호환 이름으로 계속 이어졌다고 적어. 즉, 인터페이스는 유지돼도 실제 뒤에 붙는 모델은 바뀔 수 있다는 뜻이야.

주의해서 볼 점

첫째, 이 경로는 상태 저장형 서비스가 아니야. 대화 기록을 서버가 대신 오래 보관한다고 생각하면 바로 설계가 틀어져. DeepSeek 가이드대로 이전 질문과 답변을 매번 messages에 다시 넣는 쪽이 기본이야.

둘째, 대화형 경로와 /completions를 섞으면 안 돼. DeepSeek는 2024년 7월 25일에 전자를 role이 있는 메시지 대화용으로, 후자를 중간 채우기 완성 베타(FIM completion beta)용으로 나눠 소개했어. 전자는 system, user, assistant, tool 역할을 다루고, 후자는 코드나 문장 중간 채우기처럼 completion 자체에 더 가까워.

셋째, reasoning 모델을 붙일 때는 일반 채팅보다 후속 처리 규칙이 더 까다로워질 수 있어. 공식 참조는 스트리밍 조각에 reasoning_content가 들어올 수 있다고 적고, R1 릴리스 공지는 같은 포맷에서 reasoning 모델을 따로 가격 책정했어. 그래서 이 인터페이스를 그냥 “채팅 응답 한 번 받는 API” 정도로만 보면, tool call 이후 메시지 재구성이나 로그 설계에서 실수가 나기 쉬워.

이 항목을 참조하는 위키

포맷 v3 가이드 wiki 3.2.0

팩트 체크

통과 · 2026-05-03 KST

검증 생성: AI + 편집 검토 · 2026-05-03 상태: 통과

통과 원문 대조

이 용어를 모델 이름이 아니라 대화형 API 인터페이스로 정의한 축이 공식 문서와 맞아.

독자 문제 대조: 첫 문단에서 이 용어를 모델이 아니라 대화형 호출 경계로 못 박았어.
레퍼런스 문서는 이 경로가 `messages`와 `model`을 받아 `chat.completion` 객체를 돌려주는 방식이라고 설명해.
멀티턴 가이드는 서버가 문맥을 저장하지 않으니 이전 대화 이력을 매번 다시 보내야 한다고 적어.
2024-07-25 공지는 여기에 JSON Output, Function Calling, Chat Prefix Completion을 붙였다고 설명해.

이 페이지의 핵심은 성능 비교가 아니라 인터페이스 경계와 운영 방식이야.

통과 교차 검증 검증 출처 8

이 항목은 DeepSeek 벤더 문서만 다시 읽지 않고, OpenAI 공식 Chat Completions 문서와 Responses 비교 문서까지 겹쳐서 이 용어가 정말 메시지 기반 호출 포맷을 뜻하는지 다시 확인했어.

비교 기준: OpenAI 문서는 용어의 원형을, Responses 비교 문서는 현재 위상을, DeepSeek 문서는 실제 호환 구현과 모델 라우팅 방식을 보여줘.
OpenAI 공식 문서는 이 용어를 '메시지 목록으로 대화 응답을 만드는 엔드포인트'로 설명하고, POST `/v1/chat/completions` 경로를 직접 제시해.
OpenAI의 Responses 비교 문서는 이 인터페이스가 여전히 지원되지만 새 프로젝트에는 Responses를 권장한다고 적어. 그래서 이 말이 특정 모델명이 아니라 API 이름이라는 해석이 맞아.
DeepSeek의 참조, 멀티턴 가이드, 변경 로그를 같이 보면 같은 메시지 포맷 위에 chat 별칭과 reasoning 별칭이 올라가고, 상태 비저장형 운영과 tool message 구조도 유지된다는 점이 확인돼.

이 경로는 모델 세대보다 오래 남는 호환 인터페이스고, 실제 모델은 날짜에 따라 바뀔 수 있어.

통과 수치 검증

본문에서 실제 판단 기준으로 쓰는 날짜와 한도 숫자만 다시 맞췄어.

이 항목의 공식 첫 근거 시점은 2024-07-25야. DeepSeek 공지가 그날 대화형 경로 기능 확장을 처음 묶어서 소개해.
2024-07-25 공지는 여기에 8K `max_tokens` beta, JSON Output, Function Calling, Chat Prefix Completion이 붙었다고 적어.
2026-05-03 기준 API 참조는 도구 목록을 최대 128개까지 받을 수 있다고 설명해.
2025-01-20 R1 릴리스 공지는 reasoning 별칭이 같은 포맷 위에서 동작한다는 날짜 기준점으로 쓰였어.

모델 가격표나 본체 크기보다, 이 페이지에서는 언제 기능이 붙었는지와 한도 숫자가 더 직접적인 판단 기준이야.

통과 비판 검토

가장 흔한 오해인 모델명 혼동, 상태 저장 오해, completions API 혼동을 따로 막았어.

이 용어를 `deepseek-chat` 같은 모델 별칭과 같은 것으로 설명하지 않고, 그 별칭을 태워 보내는 API라고 분리했어.
Multi-round Conversation 가이드가 stateless라고 적는 만큼, 서버가 대화 문맥을 자동으로 오래 기억해 준다는 식의 표현을 피했어.
2024-07-25 공지가 대화형 경로와 `/completions`를 분리해서 소개하므로, 일반 대화형 호출과 FIM Completion을 같은 것으로 쓰지 않았어.
Reasoner의 추론 결과나 tool call 흐름을 단순 채팅 응답처럼 취급하면 후속 메시지 처리에서 오류가 생길 수 있다는 점을 본문에 남겼어.

이 용어는 모델 성능표보다 API 계약과 상태 관리 책임을 먼저 보게 만들어야 해.

출처: Create Chat Completion | DeepSeek API Docs , Multi-round Conversation | DeepSeek API Docs , DeepSeek API Upgrade | DeepSeek API Docs , DeepSeek-R1 Release | DeepSeek API Docs , DeepSeek API Docs - Change Log , deepseek-ai/DeepSeek-R1 , Chat Completions | OpenAI API Reference , Migrate to the Responses API | OpenAI API