요즘 GPT나 Claude API 비용 청구서 보고 깜짝 놀란 적 있어? 로컬 LLM 커뮤니티에서 한 개발자가 DeepSeek V4가 GPT-5.2와 동급인데 17배 저렴하다는 결과를 보고 본인 작업 중 어디까지 클라우드 의존을 줄일 수 있나 측정한 글이 화제가 됐어. 댓글이 100개를 훌쩍 넘기면서 공감대가 컸거든.
수치 자체를 한번 보자. DeepSeek V4 Pro는 4월 24일에 공개됐는데, FoodTruck Bench라는 독립 에이전틱 벤치마크에서 GPT-5.2와 동급 성능을 내면서 API 비용은 입력 1M 토큰당 $0.435였어. GPT-5.2는 같은 워크로드에 $1.75가 들었거든. 단일 호출 단가만 보면 4배 차인데, 에이전틱 워크로드처럼 한 작업에 수십 번 호출이 누적되면서 전체 비용이 17배로 벌어진 거야.
이게 스타트업 단위경제에는 결정적이야. AI 기능 하나에 사용자당 월 $5씩 청구되는 SaaS라면, API 원가가 $4인지 $0.23인지에 따라 마진이 완전히 달라지거든. V4는 MIT 라이선스 오픈웨이트라 Hugging Face에서 직접 받아 자체 호스팅도 가능해. V4-Flash 변형은 입력 $0.14, 출력 $0.28까지 내려가서 분류·검색 같은 단순 작업에 쓰면 비용 절감 폭이 더 커져.
다만 17배라는 숫자에는 함정이 있어. FoodTruck Bench 한 도메인의 결과이고, 코딩이나 긴 컨텍스트 추론 워크로드에서는 격차가 좁아질 수 있거든. Simon Willison도 V4가 frontier 모델과 3-6개월 격차로 따라붙었다고 평가했는데, 이게 모든 태스크에 일률 적용되는 건 아니야. 본인 워크로드 일부를 V4로 옮겨서 직접 비교해 보면 어디까지 대체 가능한지가 보일 거야.