한 줄 정의

Chat은 사람이 메시지를 보내고 LLM이 응답을 돌려주는 대화형 AI 사용 방식이야. 브라우저에서 여는 채팅 화면일 수도 있고, 서버가 messages 배열을 보내는 API 호출일 수도 있어. 그래서 이 말이 나오면 먼저 “사용자 화면을 말하나, 대화 응답 생성 API를 말하나, 아니면 DeepSeek의 chat alias 같은 모델 이름을 말하나”를 갈라야 해.

DeepSeek 사례가 이 차이를 잘 보여 줘. DeepSeek R1 저장소는 chat.deepseek.com에서 DeepThink를 켜고 대화할 수 있다고 안내하면서, 동시에 OpenAI 호환 API 플랫폼도 제공한다고 적어. 둘 다 Chat처럼 보이지만, 하나는 사람이 누르는 웹 앱이고 다른 하나는 코드가 호출하는 API야.

실제로 무엇을 하나

API 문맥의 Chat은 대화 이력을 구조화해서 모델에 넘기는 방식이야. DeepSeek API Reference 기준으로 POST /chat/completions는 최소 1개 이상의 messages 배열을 받고, 각 메시지는 system, user, assistant, tool 같은 role을 가져. 응답은 chat.completion 객체로 오고, streaming을 켜면 chat.completion.chunk 조각이 data: [DONE]까지 이어져.

실제로 연동할 때는 모델 이름까지 같이 봐야 해. 2026년 5월 7일 확인 기준 DeepSeek Quick Start의 기본 예시는 deepseek-v4-prodeepseek-v4-flash를 쓰고, 예전 이름인 deepseek-chatDeepSeek Reasoner는 2026년 7월 24일 폐기 예정이라고 적혀 있어. 같은 Chat API라도 model 값이 바뀌면 thinking mode, 응답 속도, 출력 비용, 호환성이 달라질 수 있어.

Chat API는 도구 호출 파라미터도 받을 수 있어. DeepSeek의 현재 대화 API 스키마는 function tool을 넘길 수 있고, tool_choicenone, auto, required를 고를 수 있게 해. 다만 이건 모델이 함수 호출 형태의 출력을 만들 수 있다는 뜻이지, 권한 관리와 반복 실행까지 알아서 끝내는 agent라는 뜻은 아니야.

왜 중요한가

AI 기사에서 Chat이라는 말을 대충 읽으면 판단이 꼬이기 쉬워. “Chat이 열렸다”는 말은 사용자가 웹에서 써 볼 수 있다는 뜻일 수도 있고, 개발자가 API key로 제품에서 호출할 수 있다는 뜻일 수도 있어. 둘은 배포 판단이 달라. 웹 화면은 바로 체험할 수 있지만, API는 인증, rate limit, 모델 alias, streaming, JSON 출력, 사용량 집계까지 봐야 해.

비용도 화면보다 API 쪽에서 먼저 드러나. DeepSeek R1 릴리스는 2025년 1월 20일 당시 reasoner API 가격을 cache hit 입력 100만 토큰 $0.14, cache miss 입력 100만 토큰 $0.55, 출력 100만 토큰 $2.19로 적었어. 지금 가격표로 그대로 옮기면 안 되지만, Chat API가 “대화창”이 아니라 토큰 단위로 과금되고 기록되는 운영 경로라는 점은 분명해.

또 하나는 benchmark 해석이야. Change Log를 보면 chat alias는 2024년부터 여러 번 다른 backend 모델로 업그레이드됐고, 2026년 4월 24일에는 DeepSeek V4 계열 도입과 legacy alias 중단 일정이 공지됐어. 그러니까 “chat alias 성능”이라는 문장을 볼 때는 어느 날짜의 어떤 backend를 말하는지 같이 확인해야 해.

주의해서 볼 점

첫째, Chat은 모델 자체가 아니야. LLM은 응답을 만드는 엔진이고, Chat은 그 엔진에 메시지 이력을 넣고 결과를 받는 입출력 경로에 가까워. 이름에 chat이 들어간 모델 alias도 있지만, 그 alias가 곧 웹 채팅 제품이나 API 전체를 뜻하지는 않아.

둘째, Chat API는 대화 기록을 그냥 “기억”하는 게 아니야. 매 호출마다 어떤 messages를 보내는지, 이전 assistant 답변을 다시 포함하는지, system 메시지를 허용하는지에 따라 결과가 달라져. 긴 대화에서는 입력 토큰이 늘고, thinking mode에서는 reasoning token까지 비용과 지연에 영향을 줄 수 있어.

셋째, tool calls와 JSON 출력은 자동화에 필요한 입력 조건일 뿐이야. 함수 schema를 넣고 tool_choice: "required"를 줘도, 실제 함수 실행, 재시도, 로그, 권한 제한, 사용자 확인은 서비스 쪽에서 설계해야 해. 이 단계까지 갖춰야 Chat이 agent 업무 흐름으로 넘어간다고 보는 편이 맞아.

넷째, 모델 alias는 오래된 문서와 현재 문서가 다를 수 있어. DeepSeek 문서만 봐도 2025년 1월에는 R1을 reasoner alias로 호출한다고 했고, 2026년 4월에는 V4 모델명과 legacy alias 폐기 일정을 공지했어. Chat 관련 글을 읽을 때는 날짜, endpoint, 모델 파라미터를 한 묶음으로 확인해야 해.