한 줄 정의
Thinking (씽킹)은 AI 제품에서 모델이 바로 답하지 않고 더 긴 추론 예산을 써서 답을 만들도록 하는 모드나 응답 경로야. 사람이 머릿속 생각을 그대로 공개한다는 뜻이 아니라, 모델이 답을 내기 전에 더 오래 검토하거나 계획을 세우게 하는 운영 이름에 가까워.
Reasoning Model과 겹쳐 보이지만 완전히 같은 말은 아니야. reasoning은 모델 계열이나 문제 해결 성격을 말할 때가 많고, Thinking은 ChatGPT 화면의 선택지, 특정 모델의 제품 표시명, API의 추론 예산 설정처럼 사용자와 개발자가 만지는 경로 이름으로 더 자주 보여.
어떻게 작동하나
Thinking은 보통 세 층에서 나타나. 첫째는 ChatGPT 같은 앱에서 빠른 기본 경로와 깊은 추론 경로를 나누는 표시야. 예를 들어 ChatGPT Instant는 빠른 일상 응답 쪽이고, GPT-5.4 Thinking이나 GPT-5.5 Thinking은 복잡한 요청에서 더 오래 계산하는 쪽으로 읽으면 돼.
둘째는 API 설정이야. OpenAI 쪽에서는 reasoning.effort처럼 같은 모델에 얼마나 긴 추론 예산을 줄지 정하고, Google Vertex AI는 모델별 thinking_level을 둬. DeepSeek는 thinking 토글과 reasoning_effort를 함께 보여 줘. 이름은 달라도 공통점은 같아. 짧고 명확한 요청에는 낮은 예산을 쓰고, 여러 단계의 판단·계획·도구 호출이 필요한 요청에는 더 많은 추론을 쓰는 식이야.
셋째는 이미지 생성 같은 멀티모달 작업에서 나오는 표현이야. OpenAI가 2026년 4월 21일 공개한 ChatGPT Images 2.0 글은 복잡한 시각 작업과 추론형 사용 사례를 함께 보여 줬고, API 문서에서는 gpt-image-2를 텍스트·이미지 입력으로 이미지를 출력하는 모델로 정리해. 이때도 gpt-image-2는 모델 ID이고, Thinking은 긴 지시를 더 검토하게 하는 사용 경로로 나눠 읽는 편이 안전해.
왜 중요한가
Thinking을 알아야 모델 선택과 비용 감각이 덜 흔들려. “Thinking을 켜면 더 좋다”로만 보면 짧은 요약, 포맷 변환, 단순 분류에도 무거운 경로를 붙이게 돼. 그러면 응답은 느려지고 추론 토큰 비용은 늘 수 있어. 반대로 여러 문서 비교, 정책 충돌 검토, 도구 호출이 이어지는 작업에서는 Thinking을 낮게 두면 중간 검증을 건너뛰어 답이 쉽게 흔들릴 수 있어.
예를 들어 제품 로그를 설계할 때는 “사용자가 Thinking을 눌렀다”만 남기면 부족해. 실제로는 모델 ID, 추론 예산 값, 도구 호출 여부, 응답 시간, 실패한 재시도까지 같이 봐야 해. UI에서는 같은 Thinking으로 보이더라도 API에서는 reasoning.effort, thinking_level, thinking 토글처럼 서로 다른 필드로 남기 때문이야.
Image Generation(이미지 생성)에서도 이 구분이 중요해. DALL-E 2와 DALL-E 3의 API 종료일은 OpenAI deprecations 문서 기준 2026년 5월 12일이고, gpt-image-2는 별도 이미지 생성 모델이야. 이건 이미지 워크플로 마이그레이션 문제이지, Thinking이라는 단어 하나로 설명되는 기능 업데이트가 아니야.
주의해서 볼 점
첫째, Thinking은 정확도 보증이 아니야. 더 오래 생각하게 만든다고 해서 답이 항상 맞는 건 아니고, 출처 확인이나 실행 검증이 필요한 작업은 여전히 따로 확인해야 해.
둘째, “생각 과정”이 보인다고 해서 내부 판단 전체가 투명해지는 것도 아니야. 어떤 서비스는 reasoning 요약만 보여 주고, 어떤 API는 reasoning_content를 별도 필드로 돌려주고, 어떤 경우에는 중간 추론을 아예 숨겨. 화면에 보이는 문장을 실제 내부 계산 전체로 읽으면 과한 해석이 돼.
셋째, 벤더마다 제어 방식이 달라. OpenAI 문맥에서는 reasoning 계열과 GPT 계열의 역할 차이를 보고, Google 문맥에서는 모델별 thinking level 지원 범위를 보고, DeepSeek 문맥에서는 thinking mode가 켜졌을 때 일부 sampling 파라미터가 의미 없어질 수 있다는 제한까지 봐야 해. 그래서 문서에서 Thinking을 보면 먼저 “제품 표시명인가, API 설정인가, 모델 ID인가”부터 가르는 게 좋아.