한 줄 정의

GPT-5-Codex (지피티 5 코덱스)는 OpenAICodex나 비슷한 코딩 에이전트 하네스에서 코드 작업을 오래 굴리려고 만든 GPT-5 계열 모델군이야. 기준 모델 ID는 gpt-5-codex이고, 공식 모델 카드는 이 모델을 Responses API에서만 쓴다고 적어. 일반 GPT-5를 살짝 이름만 바꾼 모델이라기보다, 저장소를 읽고 파일을 고치고 테스트 결과를 다시 반영하는 agentic-coding 루프에 맞춘 쪽으로 보는 게 정확해.

기준 스펙은 문맥 창 400,000토큰, 최대 출력 128,000토큰, 지식 기준 시점 2024년 9월 30일이야. 텍스트는 입력과 출력 모두 지원하고 이미지는 입력만 받아. 오디오와 비디오는 지원 범위에 없고, 가중치 다운로드나 직접 호스팅 경로도 공개돼 있지 않아.

이 모델로 무엇을 할 수 있나

GPT-5-Codex는 답변 하나를 잘 쓰는 모델이라기보다, 코드 수정 루프를 끝까지 끌고 가는 모델로 보는 편이 좋아. 예를 들어 실패한 테스트 로그를 읽고 원인 파일을 좁힌 뒤 패치를 만들고, 다시 명령 결과를 읽어 수정하는 흐름이 후보가 돼. 단일 함수 자동완성보다 저장소 탐색, 멀티파일 리팩터, 테스트 추가, 리뷰 코멘트 반영처럼 작업이 여러 단계로 이어질 때 의미가 커져.

Cookbook의 GPT-5-Codex 프롬프팅 가이드는 이 모델이 GPT-5의 drop-in replacement가 아니라고 못 박아. 같은 문서는 GPT-5-Codex가 Responses API에서만 지원되고, verbosity 파라미터를 지원하지 않는다고 안내해. 그래서 일반 GPT-5 프롬프트를 길게 복사해 붙이는 방식보다, 바깥 하네스가 파일 읽기, 터미널 실행, apply_patch 적용, 검증 반복을 어떻게 관리할지 먼저 정하는 편이 낫다.

이후 나온 GPT-5.1 CodexGPT-5.1 Codex mini도 이 흐름을 이어받아. OpenAIGPT-5.1 발표 글은 두 모델을 Codex나 비슷한 하네스에서 오래 도는 agentic coding 작업용으로 소개했고, Cookbook 가이드는 GPT-5-Codex와 같은 프롬프트·하네스를 유지하라고 안내해. 이름은 달라도 운영 감각은 같은 계열로 읽어도 된다.

실무에서는 이런 작업이 잘 맞아.

  • 여러 파일을 오가며 기능 수정, 테스트 추가, 리팩터를 한 번에 진행하는 작업
  • PR 리뷰 초안처럼 코드베이스를 읽고 근거 있는 코멘트를 남기는 작업
  • 실패 로그를 읽고 패치를 다시 만들며 검증을 반복하는 작업
  • Codex CLI나 자체 Responses API 하네스에서 오래 도는 코딩 자동화

왜 중요한가

이 이름이 중요한 이유는 “Codex”가 모델 이름이기도 하고 제품 환경 이름이기도 해서야. Codex는 앱, CLI, IDE 확장, 클라우드 작업 환경까지 묶는 제품명으로 쓰이고, GPT-5-Codex는 그 환경이나 비슷한 하네스에서 부르는 모델 계열 이름이야. 이 구분을 놓치면 API 모델 선택, ChatGPT 모델 선택, 코딩 에이전트 설계가 한 문장 안에서 섞여 버려.

가격도 판단을 바로 갈라 줘. 기준 GPT-5-Codex 가격은 입력 100만 토큰당 $1.25, 캐시 입력 $0.125, 출력 $10.00이야. GPT-5.1 Codex mini는 입력 $0.25, 캐시 입력 $0.025, 출력 $2.00이라 같은 양을 돌릴 때 단가가 5분의 1로 내려가. 대신 공식 mini 카드가 더 작고, 더 싸고, 덜 강한 버전이라고 적기 때문에 대량 보조 패치와 품질 우선 장기 수정 작업을 나눠서 봐야 해.

또 하나는 현재 선택의 기준이야. 2026년 5월 6일 기준 OpenAI 모델 목록은 새 프로젝트의 출발점으로 GPT-5.5를 권해. 그러니까 GPT-5-Codex를 “지금 모든 코딩 작업의 기본값”으로 보는 건 과해. 이 항목은 Codex형 코딩 모델이 일반 GPT-5 계열과 어디서 갈라졌는지, 그리고 5.1 Codex나 mini를 왜 같은 하네스 문맥에서 비교하는지 이해할 때 특히 쓸모가 있어.

같이 보면 좋은 모델

  • GPT-5: GPT-5-Codex가 출발한 기준 계열이야. 일반 코딩·추론 모델과 Codex형 장기 작업 모델을 어디서 나눌지 볼 때 먼저 비교하면 좋아.
  • GPT-5.1: GPT-5.1은 범용 코딩·에이전트 API 모델이고, Codex 계열은 그중 장기 코딩 하네스에 맞춘 갈래야. 둘을 같은 모델처럼 다루면 API 경로와 프롬프트 방식이 어긋날 수 있어.
  • GPT-5.1 Codex: GPT-5-Codex의 운영 패턴을 이어받은 후속 Codex 모델이야. 같은 400,000토큰 문맥 창과 128,000토큰 최대 출력, 같은 가격대를 두고 일반 GPT-5.1과 비교할 때 같이 봐야 해.
  • GPT-5.1 Codex mini: Codex형 하네스를 유지하면서 비용을 낮춘 선택지야. 호출 수가 많은 자동화는 mini부터 시험하고, 품질이 더 중요한 장기 수정은 상위 Codex와 비교하는 식이 자연스러워.
  • Responses API: GPT-5-Codex를 실제로 설계할 때의 API 문맥이야. 도구 호출, 상태 관리, 파일 수정 루프를 어디까지 하네스가 맡길지 보려면 모델 카드보다 이 API 쪽을 같이 읽어야 해.