한 줄 정의

GPT-5.1 Codex (지피티 5.1 코덱스)는 OpenAICodex나 비슷한 코딩 에이전트 하네스에서 오래 도는 코드 작업을 맡기려고 만든 GPT-5.1 계열 모델이야. 공식 모델 카드의 모델 ID는 gpt-5.1-codex이고, 설명 문단은 Responses API에서만 쓴다고 적어. 그냥 대화형 GPT-5.1이 아니라, 파일을 읽고 고치고 테스트 결과를 다시 반영하는 agentic-coding 루프에 맞춘 버전으로 보는 게 맞아.

운영 숫자는 꽤 선명해. 문맥 창은 400,000토큰, 최대 출력은 128,000토큰이고, 지식 기준 시점은 2024년 9월 30일이야. 텍스트는 입력과 출력 모두 지원하고 이미지는 입력만 받아. 오디오와 비디오는 지원 범위에 들어 있지 않고, 가중치 다운로드나 직접 호스팅 경로도 공개돼 있지 않아.

이 모델로 무엇을 할 수 있나

이 모델은 답변 하나를 예쁘게 쓰는 모델이라기보다, 코드 작업을 여러 번 돌리게 하는 모델이야. 예를 들어 저장소에서 실패한 테스트를 읽고 원인 파일을 좁힌 뒤 패치를 만들고, 다시 테스트 로그를 읽어 수정하는 흐름에 잘 맞아. 단일 함수 자동완성보다 저장소 탐색, 파일 수정, 명령 실행, 리뷰 코멘트 정리처럼 작업이 길어질 때 의미가 커져.

OpenAI Cookbook의 GPT-5-Codex 프롬프팅 가이드GPT-5-Codex용 프롬프트와 하네스를 GPT-5.1-Codex에도 같은 방식으로 쓰라고 안내해. 이 가이드에서 강조하는 방향은 길고 촘촘한 프롬프트를 더 붙이는 게 아니라, 터미널 도구와 apply_patch 같은 최소 도구를 두고 지시를 짧게 유지하는 쪽이야. 그래서 gpt-5.1-codex를 쓸 때도 일반 GPT-5 지시문을 그대로 복사하기보다, 코드 변경 루프를 바깥 하네스가 어떻게 관리할지 먼저 정하는 편이 낫다.

실무에서는 이런 작업이 후보가 돼.

  • 여러 파일을 오가며 기능 수정, 테스트 추가, 리팩터를 한 번에 진행하는 작업
  • PR 리뷰 초안처럼 코드베이스를 읽고 근거 있는 코멘트를 남기는 작업
  • 실패 로그를 읽고 패치를 다시 만들며 검증을 반복하는 작업
  • Codex CLI나 자체 Responses API 하네스에서 오래 도는 코딩 자동화

왜 중요한가

헷갈리기 쉬운 이름이기 때문에 중요해. GPT-5.1은 코딩과 에이전트 작업을 넓게 다루는 API 모델이고, Codex는 제품과 작업 환경 이름이야. gpt-5.1-codex는 그 사이에서 “Codex형 코딩 루프에 맞춘 모델 ID”로 봐야 해. 이 구분을 놓치면 ChatGPT용 모델을 찾는 질문, API 모델 선택 질문, 코딩 에이전트 하네스 설계 질문이 한 덩어리로 섞여 버려.

가격도 판단을 바로 갈라 줘. gpt-5.1-codex는 입력 100만 토큰당 $1.25, 캐시 입력 $0.125, 출력 $10.00이야. GPT-5.1 Codex mini는 같은 400,000토큰 문맥 창과 128,000토큰 최대 출력을 유지하면서 입력 $0.25, 캐시 입력 $0.025, 출력 $2.00으로 내려가. 대신 공식 카드가 mini를 더 작고 더 싸고 덜 강한 버전이라고 못 박고 있어. 그러니까 대량 보조 패치나 반복 리뷰 초안은 mini부터 실험해볼 수 있지만, 품질이 더 중요한 장기 코드 수정은 gpt-5.1-codex를 먼저 비교하는 게 자연스러워.

또 하나는 안정성이야. 공식 모델 카드gpt-5.1-codex의 underlying model snapshot이 정기적으로 갱신될 수 있다고 안내해. 같은 별칭을 계속 불러도 모델 동작이 조금씩 바뀔 수 있다는 뜻이라, 팀에서 회귀 테스트나 프롬프트 평가를 돌린다면 모델 이름만 고정했다고 끝났다고 보면 안 돼.

같이 보면 좋은 모델

  • GPT-5.1: 일반 API 모델 선택에서 먼저 비교할 기준이야. gpt-5.1-codex는 이 계열의 코딩 하네스용 변형이라, 일반 문서·검색·업무 자동화까지 넓게 맡길 때는 GPT-5.1과 구분해서 봐야 해.
  • GPT-5.1 Codex mini: 같은 Codex 계열의 저비용 버전이야. 공식 카드가 less-capable이라고 적기 때문에, 호출 수가 많은 보조 작업은 mini, 복잡한 장기 수정은 gpt-5.1-codex 쪽으로 나눠 보는 게 좋아.
  • Codex: Codex는 모델 하나가 아니라 앱, CLI, IDE 확장, 클라우드 작업 환경까지 묶는 코딩 에이전트 제품명이야. 문서에서 Codex가 보이면 모델 ID인지 제품 환경인지 먼저 가르는 습관이 필요해.
  • Responses API: gpt-5.1-codex를 실제로 부르는 API 경로야. 도구 호출, 상태 관리, 장기 실행 작업을 어떻게 설계할지 보려면 모델 카드보다 이 API 쪽 문맥을 같이 읽어야 해.
  • Agentic Coding: 이 모델이 겨냥하는 작업 방식이야. 단순 코드 생성이 아니라 저장소 읽기, 명령 실행, 패치 적용, 검증을 반복하는 흐름을 이해할 때 도움이 돼.