이 용어는 어디까지 신뢰할 수 있나요?

Chat은 사람이 메시지를 보내고 LLM이 응답을 돌려주는 대화형 AI 사용 방식이야. 브라우저에서 여는 채팅 화면일 수도 있고, 서버가 messages 배열을 보내는 API 호출일 수도 있어. 그래서 이 말이 나오면 먼저 “사용자 화면을 말하나, 대화 응답 생성 API를 말하나, 아니면 DeepSeek의 chat alias 같은 모델 이름을 말하나”를 갈라야 해.

DeepSeek 사례가 이 차이를 잘 보여 줘. DeepSeek R1 저장소는 chat.deepseek.com에서 DeepThink를 켜고 대화할 수 있다고 안내하면서, 동시에 OpenAI 호환 API 플랫폼도 제공한다고 적어. 둘 다 Chat처럼 보이지만, 하나는 사람이 누르는 웹 앱이고 다른 하나는 코드가 호출하는 API야.

실제로 무엇을 하나

API 문맥의 Chat은 대화 이력을 구조화해서 모델에 넘기는 방식이야. DeepSeek API Reference 기준으로 POST /chat/completions는 최소 1개 이상의 messages 배열을 받고, 각 메시지는 system, user, assistant, tool 같은 role을 가져. 응답은 chat.completion 객체로 오고, streaming을 켜면 chat.completion.chunk 조각이 data: [DONE]까지 이어져.

실제로 연동할 때는 모델 이름까지 같이 봐야 해. 2026년 5월 7일 확인 기준 DeepSeek Quick Start의 기본 예시는 deepseek-v4-pro와 deepseek-v4-flash를 쓰고, 예전 이름인 deepseek-chat과 DeepSeek Reasoner는 2026년 7월 24일 폐기 예정이라고 적혀 있어. 같은 Chat API라도 model 값이 바뀌면 thinking mode, 응답 속도, 출력 비용, 호환성이 달라질 수 있어.

Chat API는 도구 호출 파라미터도 받을 수 있어. DeepSeek의 현재 대화 API 스키마는 function tool을 넘길 수 있고, tool_choice로 none, auto, required를 고를 수 있게 해. 다만 이건 모델이 함수 호출 형태의 출력을 만들 수 있다는 뜻이지, 권한 관리와 반복 실행까지 알아서 끝내는 agent라는 뜻은 아니야.

왜 중요한가

AI 기사에서 Chat이라는 말을 대충 읽으면 판단이 꼬이기 쉬워. “Chat이 열렸다”는 말은 사용자가 웹에서 써 볼 수 있다는 뜻일 수도 있고, 개발자가 API key로 제품에서 호출할 수 있다는 뜻일 수도 있어. 둘은 배포 판단이 달라. 웹 화면은 바로 체험할 수 있지만, API는 인증, rate limit, 모델 alias, streaming, JSON 출력, 사용량 집계까지 봐야 해.

비용도 화면보다 API 쪽에서 먼저 드러나. DeepSeek R1 릴리스는 2025년 1월 20일 당시 reasoner API 가격을 cache hit 입력 100만 토큰 $0.14, cache miss 입력 100만 토큰 $0.55, 출력 100만 토큰 $2.19로 적었어. 지금 가격표로 그대로 옮기면 안 되지만, Chat API가 “대화창”이 아니라 토큰 단위로 과금되고 기록되는 운영 경로라는 점은 분명해.

또 하나는 benchmark 해석이야. Change Log를 보면 chat alias는 2024년부터 여러 번 다른 backend 모델로 업그레이드됐고, 2026년 4월 24일에는 DeepSeek V4 계열 도입과 legacy alias 중단 일정이 공지됐어. 그러니까 “chat alias 성능”이라는 문장을 볼 때는 어느 날짜의 어떤 backend를 말하는지 같이 확인해야 해.

주의해서 볼 점

첫째, Chat은 모델 자체가 아니야. LLM은 응답을 만드는 엔진이고, Chat은 그 엔진에 메시지 이력을 넣고 결과를 받는 입출력 경로에 가까워. 이름에 chat이 들어간 모델 alias도 있지만, 그 alias가 곧 웹 채팅 제품이나 API 전체를 뜻하지는 않아.

둘째, Chat API는 대화 기록을 그냥 “기억”하는 게 아니야. 매 호출마다 어떤 messages를 보내는지, 이전 assistant 답변을 다시 포함하는지, system 메시지를 허용하는지에 따라 결과가 달라져. 긴 대화에서는 입력 토큰이 늘고, thinking mode에서는 reasoning token까지 비용과 지연에 영향을 줄 수 있어.

셋째, tool calls와 JSON 출력은 자동화에 필요한 입력 조건일 뿐이야. 함수 schema를 넣고 tool_choice: "required"를 줘도, 실제 함수 실행, 재시도, 로그, 권한 제한, 사용자 확인은 서비스 쪽에서 설계해야 해. 이 단계까지 갖춰야 Chat이 agent 업무 흐름으로 넘어간다고 보는 편이 맞아.

넷째, 모델 alias는 오래된 문서와 현재 문서가 다를 수 있어. DeepSeek 문서만 봐도 2025년 1월에는 R1을 reasoner alias로 호출한다고 했고, 2026년 4월에는 V4 모델명과 legacy alias 폐기 일정을 공지했어. Chat 관련 글을 읽을 때는 날짜, endpoint, 모델 파라미터를 한 묶음으로 확인해야 해.

이 항목을 참조하는 위키

포맷 v3 가이드 wiki 3.2.0

팩트 체크

통과 · 2026-05-07 KST

검증 생성: AI + 편집 검토 · 2026-05-07 상태: 통과

통과 원문 대조 검증 출처 5

후보 JSON의 DeepSeek-R1 출처에서 나온 chat 언급을 모델명으로만 보지 않고, 웹 채팅 화면과 Chat API 호출 방식을 나눠 대조했어.

독자 문제 대조: Chat이 웹 화면인지, API 호출 방식인지, 모델 alias인지 헷갈리는 지점을 먼저 검증했어.
DeepSeek API Reference는 해당 endpoint가 대화 이력을 받아 모델 응답을 만드는 경로라고 적어. 그래서 본문도 Chat을 단순 웹 화면이 아니라 API 호출 방식까지 포함하는 도구 경로로 잡았어.
Quick Start는 OpenAI 호환 `base_url`을 `https://api.deepseek.com`으로 두고, curl 예시에서 같은 REST path와 `messages` 배열을 함께 보여 줘. 본문에서 메시지 role과 API 호출을 같이 설명한 근거야.
DeepSeek-R1 저장소는 `chat.deepseek.com`에서 DeepThink를 켜고 R1과 대화할 수 있으며, 별도로 OpenAI 호환 API 플랫폼도 제공한다고 안내해. 본문이 웹 UI와 API를 분리한 이유가 여기에 있어.
R1 릴리스 문서는 2025-01-20 당시 R1용 reasoner alias와 가격표를 공개했어. 그래서 `chat`이라는 말이 모델 공개, 웹 앱, API 상품 문맥에서 같이 섞일 수 있다고 봤어.

통과 교차 검증 검증 출처 7

DeepSeek 내부 문서만 보지 않고 OpenAI와 Anthropic의 공식 API 문서까지 대조해, 대화형 API가 공통으로 메시지 목록과 모델 호출 조건을 다루는지 확인했어.

비교 기준: 같은 Chat이라는 말이라도 웹 UI, API endpoint, 모델 alias, tool call 지원 여부를 따로 봤어.
API Reference의 현재 요청 스키마는 `messages`를 필수 배열로 두고 `system`, `user`, `assistant`, `tool` role을 구분해. 이는 본문에서 Chat을 '질문 한 문장'보다 대화 상태를 넘기는 인터페이스로 설명한 근거야.
Quick Start는 2026-05-07 확인 기준 모델 예시를 `deepseek-v4-flash`, `deepseek-v4-pro`로 두고, 두 legacy alias는 2026-07-24 폐기 예정이라고 적어. 그래서 본문은 모델 alias가 고정된 제품명이 아니라고 경고했어.
Change Log는 2026-04-24 V4 지원과 legacy alias의 2026-07-24 중단 예고를 기록하고, 2025년에는 같은 alias가 V3.1, V3.2 등으로 계속 바뀐 흐름을 보여 줘.
OpenAI API Reference는 별도 회사 문서인데도 Chat Completions 묶음과 `api.openai.com/v1/chat/completions` 예시를 둬. DeepSeek의 OpenAI 호환 경로가 독특한 은어가 아니라 널리 쓰이는 API 패턴이라는 대조 근거야.
Anthropic 문서는 Messages API가 상태를 저장하지 않으므로 매번 전체 대화 기록을 보내는 패턴을 설명해. 본문에서 Chat을 숨은 장기 기억이 아니라 호출자가 구성하는 메시지 이력으로 설명한 대목을 보강해.
GitHub README와 R1 릴리스는 웹 chat과 API platform을 함께 안내하지만, 로컬 실행은 vLLM, SGLang 같은 별도 서빙 경로도 언급해. 그래서 Chat을 모델 가중치나 로컬 런타임 자체로 쓰지 않았어.

통과 수치 검증 검증 출처 5

본문의 날짜, 엔드포인트, 모델 alias, 가격 숫자는 공식 문서에서 확인되는 범위로만 남겼어.

현재 API Reference는 대화 응답 생성용 POST 경로, 필수 `messages` 배열, 현재 모델 값 `deepseek-v4-flash`와 `deepseek-v4-pro`를 보여 줘.
Quick Start와 Change Log는 두 legacy alias의 폐기 예정일을 `2026-07-24`로 적고, 각각 `deepseek-v4-flash`의 non-thinking mode와 thinking mode를 가리킨다고 설명해.
R1 릴리스의 2025-01-20 가격표는 reasoner alias 기준 cache hit 입력 100만 토큰 `$0.14`, cache miss 입력 100만 토큰 `$0.55`, 출력 100만 토큰 `$2.19`였어. 본문에서는 당시 사례로만 적었어.
API Reference의 응답 예시는 `usage`에 `prompt_tokens`, `completion_tokens`, `total_tokens`를 담고, thinking mode에서는 `reasoning_tokens`를 따로 둘 수 있어. 그래서 비용과 지연 판단을 토큰 단위로 설명했어.

통과 비판 검토 검증 출처 5

chat이라는 짧은 말이 웹 앱, API, 모델 alias, agent 기능을 모두 뜻하는 것처럼 보이는 오해를 먼저 막았어.

`chat.deepseek.com`에서 대화할 수 있다는 말은 같은 모델을 API로 안정적으로 연동할 수 있다는 뜻과 같지 않아. 인증, 모델 파라미터, streaming, 사용량 필드가 API 쪽 판단 기준이야.
legacy chat alias는 Chat 화면 그 자체가 아니라 API에서 쓰던 모델 이름이야. 2026-04-24 이후 문서는 V4 모델명과 2026-07-24 폐기 일정을 함께 보라고 말해.
tool calls가 있다고 해서 Chat이 곧 agent는 아니야. API Reference는 최대 128개 function tool을 넘길 수 있다고 설명하지만, 권한 관리와 반복 실행 루프는 별도 설계 문제야.
R1 릴리스의 가격 숫자는 2025-01-20 시점의 release note라서 현재 가격표로 일반화하지 않았어. 본문도 '당시' 사례로 한정했어.

이 페이지는 chat을 모델명이나 벤치마크 점수가 아니라, 사람이 쓰는 대화 화면과 프로그램이 부르는 Chat API 사이의 경계로 읽게 만드는 쪽이 맞아.
관련 용어는 넓은 business보다 API, LLM, token, agent, DeepSeek alias처럼 실제 오해가 자주 생기는 항목으로 좁혔어.

Chat (대화형 AI 인터페이스)

전체 AI 기술 맵에서의 위치

한 줄 정의

실제로 무엇을 하나

왜 중요한가

주의해서 볼 점

관련 용어

이 항목을 참조하는 위키