이 용어는 어디까지 신뢰할 수 있나요?

GPT-5-Codex (지피티 5 코덱스)는 OpenAI가 Codex나 비슷한 코딩 에이전트 하네스에서 코드 작업을 오래 굴리려고 만든 GPT-5 계열 모델군이야. 기준 모델 ID는 gpt-5-codex이고, 공식 모델 카드는 이 모델을 Responses API에서만 쓴다고 적어. 일반 GPT-5를 살짝 이름만 바꾼 모델이라기보다, 저장소를 읽고 파일을 고치고 테스트 결과를 다시 반영하는 agentic-coding 루프에 맞춘 쪽으로 보는 게 정확해.

기준 스펙은 문맥 창 400,000토큰, 최대 출력 128,000토큰, 지식 기준 시점 2024년 9월 30일이야. 텍스트는 입력과 출력 모두 지원하고 이미지는 입력만 받아. 오디오와 비디오는 지원 범위에 없고, 가중치 다운로드나 직접 호스팅 경로도 공개돼 있지 않아.

이 모델로 무엇을 할 수 있나

GPT-5-Codex는 답변 하나를 잘 쓰는 모델이라기보다, 코드 수정 루프를 끝까지 끌고 가는 모델로 보는 편이 좋아. 예를 들어 실패한 테스트 로그를 읽고 원인 파일을 좁힌 뒤 패치를 만들고, 다시 명령 결과를 읽어 수정하는 흐름이 후보가 돼. 단일 함수 자동완성보다 저장소 탐색, 멀티파일 리팩터, 테스트 추가, 리뷰 코멘트 반영처럼 작업이 여러 단계로 이어질 때 의미가 커져.

Cookbook의 GPT-5-Codex 프롬프팅 가이드는 이 모델이 GPT-5의 drop-in replacement가 아니라고 못 박아. 같은 문서는 GPT-5-Codex가 Responses API에서만 지원되고, verbosity 파라미터를 지원하지 않는다고 안내해. 그래서 일반 GPT-5 프롬프트를 길게 복사해 붙이는 방식보다, 바깥 하네스가 파일 읽기, 터미널 실행, apply_patch 적용, 검증 반복을 어떻게 관리할지 먼저 정하는 편이 낫다.

이후 나온 GPT-5.1 Codex와 GPT-5.1 Codex mini도 이 흐름을 이어받아. OpenAI의 GPT-5.1 발표 글은 두 모델을 Codex나 비슷한 하네스에서 오래 도는 agentic coding 작업용으로 소개했고, Cookbook 가이드는 GPT-5-Codex와 같은 프롬프트·하네스를 유지하라고 안내해. 이름은 달라도 운영 감각은 같은 계열로 읽어도 된다.

실무에서는 이런 작업이 잘 맞아.

여러 파일을 오가며 기능 수정, 테스트 추가, 리팩터를 한 번에 진행하는 작업
PR 리뷰 초안처럼 코드베이스를 읽고 근거 있는 코멘트를 남기는 작업
실패 로그를 읽고 패치를 다시 만들며 검증을 반복하는 작업
Codex CLI나 자체 Responses API 하네스에서 오래 도는 코딩 자동화

왜 중요한가

이 이름이 중요한 이유는 “Codex”가 모델 이름이기도 하고 제품 환경 이름이기도 해서야. Codex는 앱, CLI, IDE 확장, 클라우드 작업 환경까지 묶는 제품명으로 쓰이고, GPT-5-Codex는 그 환경이나 비슷한 하네스에서 부르는 모델 계열 이름이야. 이 구분을 놓치면 API 모델 선택, ChatGPT 모델 선택, 코딩 에이전트 설계가 한 문장 안에서 섞여 버려.

가격도 판단을 바로 갈라 줘. 기준 GPT-5-Codex 가격은 입력 100만 토큰당 $1.25, 캐시 입력 $0.125, 출력 $10.00이야. GPT-5.1 Codex mini는 입력 $0.25, 캐시 입력 $0.025, 출력 $2.00이라 같은 양을 돌릴 때 단가가 5분의 1로 내려가. 대신 공식 mini 카드가 더 작고, 더 싸고, 덜 강한 버전이라고 적기 때문에 대량 보조 패치와 품질 우선 장기 수정 작업을 나눠서 봐야 해.

또 하나는 현재 선택의 기준이야. 2026년 5월 6일 기준 OpenAI 모델 목록은 새 프로젝트의 출발점으로 GPT-5.5를 권해. 그러니까 GPT-5-Codex를 “지금 모든 코딩 작업의 기본값”으로 보는 건 과해. 이 항목은 Codex형 코딩 모델이 일반 GPT-5 계열과 어디서 갈라졌는지, 그리고 5.1 Codex나 mini를 왜 같은 하네스 문맥에서 비교하는지 이해할 때 특히 쓸모가 있어.

같이 보면 좋은 모델

GPT-5: GPT-5-Codex가 출발한 기준 계열이야. 일반 코딩·추론 모델과 Codex형 장기 작업 모델을 어디서 나눌지 볼 때 먼저 비교하면 좋아.
GPT-5.1: GPT-5.1은 범용 코딩·에이전트 API 모델이고, Codex 계열은 그중 장기 코딩 하네스에 맞춘 갈래야. 둘을 같은 모델처럼 다루면 API 경로와 프롬프트 방식이 어긋날 수 있어.
GPT-5.1 Codex: GPT-5-Codex의 운영 패턴을 이어받은 후속 Codex 모델이야. 같은 400,000토큰 문맥 창과 128,000토큰 최대 출력, 같은 가격대를 두고 일반 GPT-5.1과 비교할 때 같이 봐야 해.
GPT-5.1 Codex mini: Codex형 하네스를 유지하면서 비용을 낮춘 선택지야. 호출 수가 많은 자동화는 mini부터 시험하고, 품질이 더 중요한 장기 수정은 상위 Codex와 비교하는 식이 자연스러워.
Responses API: GPT-5-Codex를 실제로 설계할 때의 API 문맥이야. 도구 호출, 상태 관리, 파일 수정 루프를 어디까지 하네스가 맡길지 보려면 모델 카드보다 이 API 쪽을 같이 읽어야 해.

GPT-5-Codex (지피티 5 코덱스)

전체 AI 기술 맵에서의 위치

한 줄 정의

이 모델로 무엇을 할 수 있나

왜 중요한가

같이 보면 좋은 모델

관련 용어