무슨 일이 일어났나
OpenAI가 4월 21일 ChatGPT Images 2.0과 API 모델 gpt-image-2를 풀었어. 2K(2048×2048) 해상도, 한 프롬프트당 최대 8장 동시 생성, native reasoning이 들어갔어. DALL-E 2와 DALL-E 3는 5월 12일에 종료돼.
Plus·Pro 사용자는 thinking 모드를 켤 수 있어. 평균 22초 걸리는 대신 복잡한 구도와 텍스트 렌더링이 한 번에 잡혀.
왜 이게 일어났나
DALL-E 3는 1024×1024가 한계였고 텍스트 렌더링이 약했어. 그 사이 Midjourney v7과 Flux Pro 1.5가 4K와 정확한 텍스트로 시장을 잡았고, OpenAI는 GPT-5.5 reasoning 스택을 이미지로 옮겨 따라잡았어.
가격 라인은 다음과 같아:
- Standard 1K: $0.04/이미지 (DALL-E 3와 동일)
- Standard 2K: $0.08/이미지 (신규)
- Thinking 2K: $0.16/이미지, 평균 22초
- 8장 동시 생성: Pro 티어 한정 풀 8장, Plus는 4장
어떤 의미인가
DALL-E 3를 프로덕션에 깔아둔 팀은 5월 12일 전에 gpt-image-2로 마이그레이션해야 해. API 호환성 모드가 없어서 prompt 엔지니어링을 다시 해야 하고, 2주가 빠듯하면 일단 호출만 옮기고 quality QA는 점진적으로 하는 게 안전해.
다만 thinking 모드 화질 평가는 OpenAI 자체라 독립 비교가 아직 없어. 한국어 프롬프트 처리도 영문 위주로만 발표돼서 자사 도메인(상품 이미지·디자인 시안)에서 50건 정도 A/B 돌려보고 결정하는 게 좋아.
다음 수순
OpenAI Platform에서 모델 ID gpt-image-2로 바로 호출 가능해. VentureBeat 보도에 따르면 ChatGPT 내 이미지 편집(인페인팅·아웃페인팅)도 풀려서 Plus 사용자라면 Photoshop 일부 워크플로를 대체할 수 있어. DALL-E 의존 워크플로 목록을 먼저 뽑고, 5월 첫째 주에 gpt-image-2 마이그레이션을 완료하는 일정이 안전해.