OpenAI가 기업 시장에서 GPT-5.4를 중심으로 포지셔닝을 강화하고 있어. 올해 3월 출시된 GPT-5.4는 세 가지 벤치마크에서 뚜렷한 숫자를 냈는데 — SWE-bench Pro(코딩) 57.7%, OSWorld(컴퓨터 사용) 75%, GDPval(지식 업무) 83%야. 특히 컴퓨터 사용 75%는 화면을 직접 읽고 클릭하는 작업을 자동화할 수 있다는 뜻이거든.
1M 컨텍스트 + 5단계 추론 강도가 포인트야
컨텍스트 윈도우가 100만 토큰을 넘는다는 건 긴 계약서, 코드베이스, 리서치 문서를 한 번에 집어넣을 수 있다는 거야. 여기에 추론 강도를 5단계로 조절하는 기능이 붙어 있어 — 단순 Q&A는 낮은 강도로 빠르게, 복잡한 분석은 높은 강도로 정확하게 처리하는 거야. 비용 측면에서 실용적인 선택지가 생긴 셈이야.
API 가격은 input/output 기준 $2.50/$15 per MTok(백만 토큰)이고, 더 많은 성능이 필요하면 Pro 버전이 $30/$180야. Mini 버전은 SWE-bench Pro 54.38%에 가격이 약 6배 저렴해서 ($0.40/$1.60) 비용 민감한 작업에는 Mini가 현실적인 선택이야.
지금 기업들이 GPT-5.4에 관심 갖는 이유
단순 텍스트 생성이 아니라 컴퓨터를 직접 조작하는 Computer Use API가 이번 릴리스의 포인트야. RPA(Robotic Process Automation) 도구를 굳이 별도로 설치하지 않아도 GPT-5.4가 브라우저나 앱 UI를 직접 다룰 수 있거든. 반복 업무 자동화를 검토 중인 팀이라면 먼저 OSWorld 75%가 어떤 시나리오에서 나온 숫자인지 체크해보는 게 좋아 — 벤치마크가 실제 업무 환경과 항상 일치하진 않으니까.