이 용어는 어디까지 신뢰할 수 있나요?

각 용어는 최신 공개 자료 기반으로 정리되며, 출처와 검증 기록을 바탕으로 점진적으로 업데이트됩니다.

GPT-5.1 Codex (지피티 5.1 코덱스)

다른 이름: gpt 5.1 codexgpt-5.1-codex

GPT-5.1 Codex는 OpenAI가 Codex나 비슷한 코딩 에이전트 하네스에서 오래 도는 코드 작업을 맡기려고 낸 GPT-5.1 계열 API 모델이야. 400,000토큰 문맥 창과 128,000토큰 최대 출력을 쓰고, 일반 GPT-5.1이나 mini와 구분해서 봐야 해.

모델 프로필

모델을 고를 때 먼저 확인할 것만 모았어. 어려운 말은 링크를 눌러 뜻부터 잡으면 돼.

상위 모델

전체 AI 기술 맵에서의 위치

응용 (Application)

프로젝트 (Project)

데이터셋 (Dataset)

기법 (Technique)

프레임워크 (Framework)

모델 (Model)

개념 (Concept)

Agents SDK(에이전트 SDK)AI Studio (AI 스튜디오)Aider(에이더)Alibaba Cloud API(알리바바 클라우드 API)Alibaba Cloud Model Studio(알리바바 클라우드 모델 스튜디오)Amazon Bedrock(아마존 베드록)Anthropic API(앤트로픽 API)App Store(앱 스토어)Batch API(배치 API)BentoML(벤토엠엘)Chat (대화형 AI 인터페이스)Chat Completions(챗 컴플리션스)ChatGPT(챗지피티)Chroma(크로마)Claude Code (클로드 코드)Claude Code Remote Control(클로드 코드 리모트 컨트롤)Claude Cowork(클로드 코워크)Claude Desktop(클로드 데스크톱)claude remote-control(클로드 리모트 컨트롤 명령)claude --version (버전 조회)claude.ai(클로드 웹 앱)Cline(클라인)CloudTrail(클라우드트레일)Codex(코덱스)Codex CLI(코덱스 CLI)ComfyUI(컴피유아이)Continue(컨티뉴)GitHub Copilot (깃허브 코파일럿)Cursor(커서)DeepSeek API(딥시크 API)DGX B200(디지엑스 B200)DGX Spark(디지엑스 스파크)Docker(도커)Excel(엑셀)FAISS (페이스)Gemini API(제미니 API)Gemini API File Search(제미니 API 파일 검색)Gemini Developer API(제미니 디벨로퍼 API)Gemini Enterprise Agent Platform(제미니 엔터프라이즈 에이전트 플랫폼)GitHub (깃허브)Gmail(지메일)Google AI Studio(구글 AI 스튜디오)Google Calendar(구글 캘린더)Google Docs(구글 문서)Google Drive(구글 드라이브)Google Search(구글 검색)Google Sheets(구글 시트)H100 (엔비디아 호퍼 GPU)Hugging Face(허깅 페이스)Jetson Thor(젯슨 토르)Kimi API(키미 API)Kimi Code(키미 코드)Kimi.com(키미닷컴)KTransformers (케이트랜스포머스)Live API(라이브 API)llama-cli (로컬 LLM CLI)llama.cpp(로컬 LLM 런타임)llama-server(로컬 LLM 서빙 서버)llama.cpp (로컬 LLM 추론 엔진)LM Studio(엘엠 스튜디오)LocalLLaMA (로컬라마)Microsoft Foundry(마이크로소프트 파운드리)MLflow(엠엘플로우)Modal(모달)Model Garden(모델 가든)Model Studio(모델 스튜디오)Model Studio API(모델 스튜디오 API)ModelScope(모델스코프)n8n(엔에잇엔)Ollama(올라마)OpenAI API(오픈에이아이 API)OpenAI Chat Completion(오픈AI 챗 컴플리션)OpenAI SDK(오픈에이아이 SDK)OpenClaw(오픈클로)OpenRouter(오픈라우터)Perplexity (퍼플렉시티)Pinecone (파인콘)Qdrant (큐드런트)Qwen API(큐원 API)Qwen Code(큐원 코드)Qwen Studio(큐원 스튜디오)Raspberry Pi (라즈베리 파이)Replicate(레플리케이트)Responses API(리스폰스 API)SDK(소프트웨어 개발 키트)SGLang(에스지랭)Supabase(수파베이스)Tokenizer(토크나이저)Triton Inference Server(트리톤 추론 서버)Vector Database (벡터 데이터베이스)vLLM(브이엘엘엠)VS Code(비주얼 스튜디오 코드)Weaviate(위비에이트)Weights & Biases(웨이츠 앤 바이어시스)Windsurf(윈드서프)

Activepieces (액티브피시스)Agentic AQUA (에이전틱 아쿠아)Apache Airflow (아파치 에어플로)DeepGEMM(딥시크 CUDA 커널 라이브러리)Engram(엔그램)HyperFrames (하이퍼프레임스)LightRAG (라이트RAG)Manifest (매니페스트)NautilusTrader (노틸러스 트레이더)NostalgiaForInfinity (노스탤지아 포 인피니티)OpenMemory (오픈메모리)PocketBase (포켓베이스)Microsoft Qlib (마이크로소프트 Qlib)whisper.cpp (위스퍼.cpp)yfinance (와이파이낸스)

Nemotron-Personas-Korea (네모트론 페르소나스 코리아)PII-Masking-300k(피아이아이 마스킹 300K)

agentic-coding(에이전틱 코딩)벤치마크 Chain-of-Thought(연쇄 추론 유도)DeepSeek Sparse Attention (딥시크 스파스 어텐션)Distillation (지식 증류)Eval(평가)Fine-tuning (파인튜닝)Function Calling(함수 호출)Grounding (그라운딩)Guardrail(가드레일)--kv-cache-dtype bfloat16 (BF16 KV 캐시 저장 형식 플래그)Prompt Caching(프롬프트 캐싱)Prompt Engineering(프롬프트 엔지니어링)Quantization (양자화)RAG (검색 증강 생성)reasoning.effort (리즈닝 이포트)Red Teaming (레드 팀잉)RLHF(인간 피드백 기반 강화학습)Speech to Text(음성 인식)Synthetic Data(합성 데이터)Text to Speech(음성 합성)Tool Use(도구 사용)Training(학습)Vibe Coding(바이브 코딩)

Agent Platform(에이전트 플랫폼)Agent Runtime(에이전트 런타임)AutoGen(오토젠)Claude Managed Agents(클로드 매니지드 에이전트)CrewAI (크루에이아이)DeepSpeed(딥스피드)GGUF(GGUF 모델 파일 형식)Gradio (그라디오)JAX (잭스)Kubeflow(쿠브플로우)LangChain (랭체인)LangGraph(랭그래프)LlamaIndex (라마인덱스)llm-server(로컬 llama.cpp 서빙 자동화 프레임워크)MCP (모델 컨텍스트 프로토콜)MLX(엠엘엑스)ONNX(오닉스)PyTorch(파이토치)Ray(레이)Runtime(런타임)Streamlit(스트림릿)TensorFlow (텐서플로)TensorRT Edge-LLM(텐서RT 엣지 LLM)Transformer Engine(트랜스포머 엔진)Vercel AI SDK(버셀 AI SDK)x402 (에이전트 micropayment 프로토콜)

Alibaba Qwen (알리바바 큐원)Anthropic Claude(앤트로픽 클로드)ChatGPT-5.2 Instant (챗지피티 5.2 인스턴트)ChatGPT-5.2 Pro (챗지피티 5.2 프로)Claude(클로드)Claude Opus (클로드 오퍼스)Claude Opus 4.5(클로드 오퍼스 4.5)Claude Opus 4.6(클로드 오퍼스 4.6)Claude Opus 4.7(클로드 오퍼스 4.7)Claude Sonnet (클로드 소넷)Claude Sonnet 4.5(클로드 소네트 4.5)DALL-E (달리)DeepSeek (딥시크)deepseek-chat (딥시크 챗)DeepSeek R1(딥시크 R1)DeepSeek Reasoner (딥시크 리저너)DeepSeek-V3.2-Speciale (딥시크 V3.2-Speciale)DeepSeek V4 (딥시크 V4)FLUX.1 (플럭스 원)Gemini(제미니)Gemini 2.5 (제미나이 2.5)Gemini 2.5 Flash (제미나이 2.5 플래시)Gemini 2.5 Pro (제미나이 2.5 프로)Gemini Embedding(제미니 임베딩)Gemini Embedding 2(제미니 임베딩 2)Gemma (젬마)Gemma 3(젬마 3)Gemma 4(젬마 4)Gemma-4-26B-A4B-NVFP4(젬마 4 26B A4B NVFP4)GLM (지엘엠)GLM 5(지엘엠 5)GLM 5.1(지엘엠 5.1)GPT-2 (지피티-2)GPT-3 (지피티-3)GPT-3.5 (지피티-3.5)GPT-4 (지피티-4)GPT-4.1 (지피티 4.1)GPT-4o(지피티-4o)gpt-4o-mini (지피티-4o 미니)gpt-4o-mini-2024-07-18 스냅샷 GPT-5 (지피티-5)GPT-5.5 Instant (지피티 5.5 인스턴트)GPT-5-Codex (지피티 5 코덱스)GPT-5.1 (지피티 5.1)gpt-5.1-chat-latest (지피티 5.1 챗 레이티스트)GPT-5.1 Codex (지피티 5.1 코덱스)GPT-5.1 Codex mini (지피티 5.1 코덱스 미니)GPT-5.2 (지피티 5.2)gpt-5.2-2025-12-11 (GPT-5.2 고정 스냅샷)gpt-5.2-chat-latest (지피티 5.2 챗 레이티스트)GPT-5.2 Pro (지피티 5.2 프로)GPT-5.2 Pro 2025-12-11 스냅샷 (지피티 5.2 프로 고정 버전)GPT-5.2 Thinking (지피티 5.2 씽킹)GPT-5.3 (지피티 5.3)gpt-5.3-chat-latest (지피티 5.3 챗 레이티스트)GPT-5.3 Instant (GPT-5.3 인스턴트)GPT-5.4 (지피티 5.4)gpt-5.4-2026-03-05 (GPT-5.4 고정 스냅샷)GPT-5.4 API (지피티 5.4 API)GPT-5.4-Cyber (지피티 5.4 사이버)GPT-5.4 Mini (지피티 5.4 미니)GPT-5.4 Pro (지피티 5.4 프로)GPT-5.4 Thinking (지피티 5.4 씽킹)GPT-5.5 (지피티 5.5)GPT-5.5 Instant (지피티 5.5 인스턴트)GPT-5.5 Pro (지피티 5.5 프로)GPT-5.5 Thinking (지피티 5.5 씽킹)gpt-image-2 (지피티 이미지 2)gpt-oss(지피티 오에스에스)GPT-OSS 20B(오픈 웨이트 모델)GPT-Rosalind(지피티-로절린드)Grok (그록)Imagen (이마젠)K2.5 (키미 K2.5)Kimi(키미)Kimi K2 (키미 K2)Kimi K2.6 (키미 K2.6)Llama (라마)Lyria (리리아)M2.7(엠투점칠)MiMo-V2.5-ASR (샤오미 음성인식 모델)MiniMax M2.7(미니맥스 M2.7)Mistral(미스트랄 모델 계열)Mistral AI (미스트랄 AI)Mixtral(믹스트랄)model="deepseek-reasoner" (딥시크 리저너 모델값)Mythos Preview (마이토스 프리뷰)Nano Banana(나노 바나나)Nemotron 3 Nano Omni (네모트론 3 나노 옴니)Nemotron OCR v2 (네모트론 OCR v2)o1(OpenAI 추론 모델)o3 (오쓰리)Phi (파이)Privacy Filter(프라이버시 필터)Qwen (큐원)Qwen 3.5(큐원 3.5)Qwen3 (큐원3)Qwen3-14B (큐원3 14B)Qwen3-14B-GGUF (큐원3 14B GGUF)Qwen3-30B-A3B (큐웬3 30B A3B)Qwen3.5-122B-A10B (122B MoE 대체형)Qwen3.5-27B (큐웬3.5-27B)Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled (쿠엔3.5-27B 클로드 4.6 오퍼스 리즈닝 디스틸드)Qwen3.5-35B-A3B (큐원 3.5-35B-A3B)Qwen3.5-9B (큐원 3.5-9B)Qwen3.5-9B BF16 (큐원 3.5-9B BF16)Qwen3.6 (큐원 3.6)Qwen3.6-27B (큐원 3.6-27B)Qwen3.6 27B FP8 (큐원 3.6 27B FP8)Qwen3.6-35B-A3B (큐원 3.6-35B-A3B)Sora (소라)Stable Diffusion(스테이블 디퓨전)DeepSeek V2.5 (딥시크 V2.5)DeepSeek V3.2 (딥시크 V3.2)V3.2-Speciale (딥시크 V3.2-Speciale)V4-Flash (딥시크 V4-Flash)V4 Pro (딥시크 V4 프로)Veo (비오)Whisper (위스퍼)

24GB GPU(24GB VRAM 카드)A3B (활성 파라미터 3B 표기)A4B(활성 파라미터 4B)A4B MoE(A4B 전문가 혼합 표기)AI Agent (AI 에이전트)Agent Identity(에이전트 신원)Agent Observability(에이전트 관측성)Agentic AI(에이전틱 AI)Alignment(정렬)API (애플리케이션 프로그래밍 인터페이스)Apple Silicon (애플 실리콘)Attention (어텐션)AWS Bedrock(AWS 베드록)Bedrock(베드록)BF16 (브레인 플로팅 포인트 16)BF16 KV (BF16 키-값 캐시)Blackwell (NVIDIA GPU 아키텍처)BrowseComp(브라우즈컴프)chat-latest (챗 레이티스트)ChatGPT Instant (챗지피티 인스턴트)CLI(명령줄 인터페이스)Context(컨텍스트)Context Window(컨텍스트 윈도우)CUDA(쿠다)CUDA 12.9(쿠다 12.9)Deep Research (딥 리서치)Developer Tools(개발자 도구)DFlash (디플래시)Diffusion Model(확산 모델)E2B (이투비)E4B (이포비)Embedding (임베딩)Enterprise(엔터프라이즈)Enterprise AI(엔터프라이즈 AI)F1 96(에프원 96 표기)F32 (32비트 부동소수점)File Search(파일 검색)FIM completion(중간 채우기 완성)Flash(플래시)FP16 (반정밀도 부동소수점)FP4 (4비트 부동소수점 포맷)FP4 Indexer(FP4 인덱서)FP8 (8비트 부동소수점 포맷)FP8 E4M3(8비트 E4M3 포맷)FP8 KV (FP8 키-값 캐시)FP8 양자화 가중치 FP8 Tensor Core(FP8 텐서 코어)Gated DeltaNet(게이티드 델타넷)GDDR7(그래픽 DRAM 7세대)GDDR7 ECC(오류 수정 GDDR7 메모리)GPQA Diamond (지피큐에이 다이아몬드)GPT (생성형 사전학습 트랜스포머)GPU (그래픽 처리 장치)GPU VRAM(GPU 전용 비디오 메모리)GUI(그래픽 사용자 인터페이스)Hallucination (환각)HTTP API(HTTP 호출 인터페이스)HumanEval(휴먼이밸)IDE (통합 개발 환경)Image Generation(이미지 생성)Inference (추론)Instant(인스턴트)INT4 (4비트 정수 정밀도)INT8 (8비트 정수 정밀도)K2.6 (키미 K2.6 줄임말)KV Cache (KV 캐시)Language Model (언어 모델)Linux(리눅스)LiveCodeBench(라이브코드벤치)LLM (거대 언어 모델)Local LLM (로컬 LLM)Long Context (긴 문맥)M5 Max(M5 맥스)M5 Max 64GB(M5 맥스 64GB)Mac(맥)Managed Agents(관리형 에이전트)Mega MoE(메가 MoE)Memory(메모리)Mixture of Experts(전문가 혼합)MMLU(엠엠엘유)MMLU Pro(엠엠엘유 프로)모델 Multimodal AI(멀티모달 AI)Mythos (마이토스)Nano Omni (나노 옴니)Nemotron(네모트론)NL2Repo 39.8(엔엘투레포 39.8)Nous Research (누스 리서치)NVFP4 (NVIDIA FP4 포맷)NVIDIA GPU(엔비디아 GPU)NVLink(엔비디아 GPU 인터커넥트)OAuth(권한 위임)OCR (광학 문자 인식)On-device AI(온디바이스)openai-agents>=0.14.0(오픈AI 에이전트 SDK 0.14.0 이상)OpenAI-compatible(OpenAI 호환)p95(95번째 백분위 지연시간)Personal Intelligence(퍼스널 인텔리전스)PrivateLink(프라이빗링크)Project Glasswing (프로젝트 글래스윙)Python (파이썬)Q8 KV (Q8 키-값 캐시)Qwen3.6-35B-A3B Benchmarks (큐웬3.6 벤치마크)RAM (시스템 메모리)Reasoning Model (추론 모델)reasoning content(추론 내용)Reasoning Model (추론 모델)RTX PRO (엔비디아 전문가용 GPU 계열)SaaS(서비스형 소프트웨어)Small Language Model(소형 언어 모델)SWE-bench(깃허브 이슈 해결 벤치마크)SWE-Bench Pro (에스더블유이 벤치 프로)SWE-bench Verified (스위벤치 베리파이드)SWE Multilingual(다국어 소프트웨어 엔지니어링 벤치마크 표기)SWE-Pro(에스더블유이 프로 표기)SwiGLU(스위글루)Tensor Core(텐서 코어)Terminal-Bench (터미널 벤치)Terminal-Bench 2.0(터미널 벤치 2.0)Thinking (씽킹)tok/s(초당 토큰)Token (토큰)Token Plan(토큰 플랜)Transformer (트랜스포머)Trusted Access (신뢰 기반 접근)TypeScript(타입스크립트)Vertex AI (버텍스 AI)VIBE-Pro(바이브 프로)Video Generation(영상 생성)Vision-Language Model (비전-언어 모델)VRAM(비디오 메모리)Model Weights(웨이트)Windows(윈도우)Xiaomi MiMo(샤오미 미모)YaRN (야른)

한 줄 정의

GPT-5.1 Codex (지피티 5.1 코덱스)는 OpenAI가 Codex나 비슷한 코딩 에이전트 하네스에서 오래 도는 코드 작업을 맡기려고 만든 GPT-5.1 계열 모델이야. 공식 모델 카드의 모델 ID는 gpt-5.1-codex이고, 설명 문단은 Responses API에서만 쓴다고 적어. 그냥 대화형 GPT-5.1이 아니라, 파일을 읽고 고치고 테스트 결과를 다시 반영하는 agentic-coding 루프에 맞춘 버전으로 보는 게 맞아.

운영 숫자는 꽤 선명해. 문맥 창은 400,000토큰, 최대 출력은 128,000토큰이고, 지식 기준 시점은 2024년 9월 30일이야. 텍스트는 입력과 출력 모두 지원하고 이미지는 입력만 받아. 오디오와 비디오는 지원 범위에 들어 있지 않고, 가중치 다운로드나 직접 호스팅 경로도 공개돼 있지 않아.

이 모델로 무엇을 할 수 있나

이 모델은 답변 하나를 예쁘게 쓰는 모델이라기보다, 코드 작업을 여러 번 돌리게 하는 모델이야. 예를 들어 저장소에서 실패한 테스트를 읽고 원인 파일을 좁힌 뒤 패치를 만들고, 다시 테스트 로그를 읽어 수정하는 흐름에 잘 맞아. 단일 함수 자동완성보다 저장소 탐색, 파일 수정, 명령 실행, 리뷰 코멘트 정리처럼 작업이 길어질 때 의미가 커져.

OpenAI Cookbook의 GPT-5-Codex 프롬프팅 가이드는 GPT-5-Codex용 프롬프트와 하네스를 GPT-5.1-Codex에도 같은 방식으로 쓰라고 안내해. 이 가이드에서 강조하는 방향은 길고 촘촘한 프롬프트를 더 붙이는 게 아니라, 터미널 도구와 apply_patch 같은 최소 도구를 두고 지시를 짧게 유지하는 쪽이야. 그래서 gpt-5.1-codex를 쓸 때도 일반 GPT-5 지시문을 그대로 복사하기보다, 코드 변경 루프를 바깥 하네스가 어떻게 관리할지 먼저 정하는 편이 낫다.

실무에서는 이런 작업이 후보가 돼.

여러 파일을 오가며 기능 수정, 테스트 추가, 리팩터를 한 번에 진행하는 작업
PR 리뷰 초안처럼 코드베이스를 읽고 근거 있는 코멘트를 남기는 작업
실패 로그를 읽고 패치를 다시 만들며 검증을 반복하는 작업
Codex CLI나 자체 Responses API 하네스에서 오래 도는 코딩 자동화

왜 중요한가

헷갈리기 쉬운 이름이기 때문에 중요해. GPT-5.1은 코딩과 에이전트 작업을 넓게 다루는 API 모델이고, Codex는 제품과 작업 환경 이름이야. gpt-5.1-codex는 그 사이에서 “Codex형 코딩 루프에 맞춘 모델 ID”로 봐야 해. 이 구분을 놓치면 ChatGPT용 모델을 찾는 질문, API 모델 선택 질문, 코딩 에이전트 하네스 설계 질문이 한 덩어리로 섞여 버려.

가격도 판단을 바로 갈라 줘. gpt-5.1-codex는 입력 100만 토큰당 $1.25, 캐시 입력 $0.125, 출력 $10.00이야. GPT-5.1 Codex mini는 같은 400,000토큰 문맥 창과 128,000토큰 최대 출력을 유지하면서 입력 $0.25, 캐시 입력 $0.025, 출력 $2.00으로 내려가. 대신 공식 카드가 mini를 더 작고 더 싸고 덜 강한 버전이라고 못 박고 있어. 그러니까 대량 보조 패치나 반복 리뷰 초안은 mini부터 실험해볼 수 있지만, 품질이 더 중요한 장기 코드 수정은 gpt-5.1-codex를 먼저 비교하는 게 자연스러워.

또 하나는 안정성이야. 공식 모델 카드는 gpt-5.1-codex의 underlying model snapshot이 정기적으로 갱신될 수 있다고 안내해. 같은 별칭을 계속 불러도 모델 동작이 조금씩 바뀔 수 있다는 뜻이라, 팀에서 회귀 테스트나 프롬프트 평가를 돌린다면 모델 이름만 고정했다고 끝났다고 보면 안 돼.

같이 보면 좋은 모델

GPT-5.1: 일반 API 모델 선택에서 먼저 비교할 기준이야. gpt-5.1-codex는 이 계열의 코딩 하네스용 변형이라, 일반 문서·검색·업무 자동화까지 넓게 맡길 때는 GPT-5.1과 구분해서 봐야 해.
GPT-5.1 Codex mini: 같은 Codex 계열의 저비용 버전이야. 공식 카드가 less-capable이라고 적기 때문에, 호출 수가 많은 보조 작업은 mini, 복잡한 장기 수정은 gpt-5.1-codex 쪽으로 나눠 보는 게 좋아.
Codex: Codex는 모델 하나가 아니라 앱, CLI, IDE 확장, 클라우드 작업 환경까지 묶는 코딩 에이전트 제품명이야. 문서에서 Codex가 보이면 모델 ID인지 제품 환경인지 먼저 가르는 습관이 필요해.
Responses API: gpt-5.1-codex를 실제로 부르는 API 경로야. 도구 호출, 상태 관리, 장기 실행 작업을 어떻게 설계할지 보려면 모델 카드보다 이 API 쪽 문맥을 같이 읽어야 해.
Agentic Coding: 이 모델이 겨냥하는 작업 방식이야. 단순 코드 생성이 아니라 저장소 읽기, 명령 실행, 패치 적용, 검증을 반복하는 흐름을 이해할 때 도움이 돼.

이 항목을 참조하는 위키

포맷 v3 가이드 wiki 3.2.0

팩트 체크

통과 · 2026-05-06 KST

검증 생성: AI + 편집 검토 · 2026-05-06 상태: 통과

통과 원문 대조 검증 출처 5

공식 모델 카드와 GPT-5.1 발표 글을 대조해서, 이 페이지가 일반 GPT-5.1이나 Codex 제품이 아니라 `gpt-5.1-codex` 모델을 설명하는지 맞췄어.

독자 문제 대조: 먼저 갈라야 할 건 범용 GPT-5.1, Codex 제품, `gpt-5.1-codex`, mini 버전이 서로 다른 층위라는 점이라 첫 문단에서 그 구분을 바로 보이게 했어.
공식 `gpt-5.1-codex` 모델 카드는 이 모델을 Codex나 비슷한 환경의 agentic coding 작업에 최적화된 GPT-5 계열 변형으로 적고 있어서 본문 정의도 그 범위로 좁혔어.
문맥 창 400,000토큰, 최대 출력 128,000토큰, 2024년 9월 30일 지식 기준, reasoning token support는 `gpt-5.1-codex` 모델 카드 값과 맞췄어.
텍스트 입력·출력, 이미지 입력만 지원, 오디오·비디오 미지원은 모델 카드 modalities 항목에 맞춰 modelProfile과 본문에 넣었어.

통과 교차 검증 검증 출처 5

모델 카드, GPT-5.1 발표 글, Codex 프롬프팅 가이드를 같이 보고 모델 포지션과 사용 하네스를 교차 확인했어.

비교 기준: 일반 `gpt-5.1`과 무엇이 다른가, `gpt-5.1-codex-mini`와 가격·성능 기대가 어떻게 갈리나, Codex 제품명과 모델 ID를 어떻게 나누나로 잡았어.
GPT-5.1 발표 글은 `gpt-5.1-codex`와 `gpt-5.1-codex-mini`를 API에 같이 공개했고, Codex나 Codex-like harness에서 오래 도는 agentic coding 작업용이라고 설명해.
Cookbook 프롬프팅 가이드는 GPT-5-Codex용 프롬프트와 하네스를 GPT-5.1-Codex와 GPT-5.1-Codex-Mini에도 그대로 쓰라고 안내해서, 본문 사용 장면을 Responses API 하네스 중심으로 잡았어.
같은 가이드는 GPT-5-Codex가 GPT-5의 drop-in replacement가 아니라고 적어서, 일반 GPT-5.1 지시문을 그대로 옮기는 식의 과장을 주의점으로 남겼어.

통과 수치 검증 검증 출처 3

본문과 modelProfile에 넣은 숫자는 OpenAI 공식 문서에 직접 나온 값만 남기고, 추정 파라미터나 비공개 벤치마크는 넣지 않았어.

`gpt-5.1-codex` 가격은 입력 100만 토큰당 $1.25, 캐시 입력 $0.125, 출력 $10.00으로 모델 카드와 맞췄어.
`gpt-5.1-codex-mini` 가격은 입력 $0.25, 캐시 입력 $0.025, 출력 $2.00이라 본문에서 mini가 5분의 1 단가라는 비교만 남겼어.
문맥 창 400,000토큰과 최대 출력 128,000토큰은 `gpt-5.1-codex`, `gpt-5.1-codex-mini`, `gpt-5.1` 모델 카드에 공통으로 보이는 값이어서 본문 비교 축으로 썼어.
GPT-5.1 발표 글의 SWE-bench Verified 76.3% 같은 범용 GPT-5.1 수치는 `gpt-5.1-codex` 전용 수치가 아니라서 이 페이지의 성능 주장으로 끌어오지 않았어.

통과 비판 검토 검증 출처 4

이 모델을 최신 만능 코딩 모델처럼 넓히지 않고, Responses API 전용 코딩 하네스 모델이라는 범위와 mini 대비 비용 조건을 같이 적었어.

공식 모델 카드가 Responses API 전용이라고 적는 점을 반영해서, Chat Completions나 ChatGPT 제품 모델처럼 넓게 소개하지 않았어.
Codex는 제품·도구 환경이고 `gpt-5.1-codex`는 그 환경이나 비슷한 하네스에서 부르는 모델 ID라서, 본문과 관련 항목에서 층위를 따로 나눴어.
가중치 공개, 로컬 실행, 파라미터 수, 독립 성능 점수처럼 공식 문서에 없는 항목은 비공개 또는 미공개로 남겼어.
mini는 더 싸지만 less-capable이라고 공식 카드에 적혀 있어서, 호출 수가 많은 보조 작업과 품질이 더 중요한 장기 수정 작업을 분리해 설명했어.