한 줄 정의
GPT-Rosalind(지피티-로절린드)는 OpenAI가 2026년 4월 16일 공개한 생명과학 연구용 추론 모델 계열이야. 일반 범용 GPT를 그대로 다른 이름으로 부른 게 아니라, 신약 탐색, 유전체 해석, 실험 설계처럼 과학 도구와 데이터베이스를 여러 단계로 엮는 워크플로를 더 잘 처리하도록 맞춘 모델로 보는 편이 맞아.
이 모델로 무엇을 할 수 있나
OpenAI가 앞세우는 용도는 문헌 검토, 시퀀스-기능 해석, 실험 계획, 데이터 분석, 단백질과 유전자 관련 질의처럼 리서치 과정이 긴 생명과학 작업이야. 공식 글에서도 연구자가 논문, 특허, 데이터베이스, 실험 결과, 가설을 오가며 판단해야 하는 흐름을 문제로 잡고, GPT-Rosalind를 그 흐름을 줄이는 쪽에 붙였어.
같이 공개된 Codex용 Life Sciences research plugin도 포인트야. 이 플러그인은 50개가 넘는 과학 도구와 데이터 소스를 연결하고, 단백질 구조 조회, 시퀀스 검색, 문헌 리뷰, 공개 데이터셋 탐색 같은 반복 리서치 작업을 묶어줘. 예를 들어 연구자가 특정 유전자 변이를 조사할 때 관련 논문을 모으고, 공개 데이터셋과 단백질 구조 정보를 이어 보고, 다음 실험 가설까지 한 흐름으로 정리하는 식이야. 그래서 GPT-Rosalind를 그냥 답변 잘하는 모델로 보기보다, tool-use가 강한 생명과학 워크플로 모델로 읽는 편이 훨씬 정확해.
왜 중요한가
OpenAI는 미국에서 신약이 타깃 발굴부터 규제 승인까지 가는 데 보통 10년에서 15년이 걸린다고 짚었어. GPT-Rosalind가 겨냥하는 건 그중에서도 초반의 가설 정리, 표적 선택, 실험 설계처럼 뒤로 갈수록 비용 차이가 크게 벌어지는 구간이야. 이 문맥을 알면 왜 일반 챗봇 발표가 아니라 생명과학 전용 모델 발표로 따로 나왔는지 바로 읽혀.
수치도 범용 신모델 기사처럼 읽으면 안 되는 쪽으로 붙어 있어. OpenAI는 GPT-Rosalind가 LABBench2에서 GPT-5.4보다 11개 태스크 중 6개에서 앞섰다고 밝혔고, Dyno Therapeutics와의 평가에서는 Codex 앱 best-of-ten 기준으로 예측 태스크가 인간 전문가 95퍼센타일 이상, 시퀀스 생성 태스크가 약 84퍼센타일 수준에 들어갔다고 설명했어. 무조건 전 영역 우세라는 뜻이 아니라, 생명과학 리서치 태스크 몇 개에서 확실한 우위를 보였다는 신호로 읽는 게 맞아.
주의해서 볼 점
GPT-Rosalind는 2026년 4월 16일 기준 누구나 바로 쓰는 공개형 모델이 아니야. 미국의 자격을 갖춘 enterprise 고객에게 trusted access 프로그램으로 먼저 열렸고, 조직 단위 보안·거버넌스·오남용 방지 통제를 통과해야 들어갈 수 있어. ChatGPT, Codex, OpenAI API에서 연구 프리뷰로 쓴다고 해도, 실제 의미는 제한된 운영 환경 안에서 검증하며 쓰는 제품에 더 가까워.
또 하나는 공개 범위야. 파라미터 수, 구조, 컨텍스트 길이, 오픈 웨이트 여부 같은 모델 내부 수치는 나오지 않았고, 일반 멀티모달 범위도 자세히 열지 않았어. 그래서 이 항목을 볼 때는 “새 GPT가 나왔다”보다 “OpenAI가 생명과학 조직에 제한 접근형 연구 모델과 코덱스 플러그인 묶음을 내놨다”로 잡아야 과장이 덜해.
같이 보면 좋은 모델
- GPT-5.4: OpenAI가 공식 비교 대상으로 직접 언급한 범용 모델이야. GPT-Rosalind가 11개 태스크 중 6개에서 앞섰다는 문장을 읽을 때 기준선으로 같이 봐야 해.
- Codex: GPT-Rosalind는 단독 모델 발표이기도 하지만, 실제 사용 문맥에서는 코덱스 앱과 Life Sciences research plugin이 같이 붙어 있어. 그래서 모델 성능만이 아니라 도구 연결 방식도 같이 봐야 해.
- ChatGPT: GPT-Rosalind가 ChatGPT 연구 프리뷰로 제공된다는 문장은, 일반 소비자용 채팅 기능 추가가 아니라 조직 심사형 연구 접근이라는 뜻에 더 가까워. 같은 이름 공간 안에서 제품 층위를 구분할 때 도움이 돼.