무슨 일이 일어났나

챈 주커버그 바이오허브(Biohub)가 2026년 5월 27일 단백질 생물학을 다루는 월드 모델을 공개했어. 핵심은 세 덩어리야 — 언어 모델 ESMC, 구조 예측·설계 엔진 ESMFold2, 그리고 탐색용 데이터베이스 ESM Atlas. 셋 다 전 세계 연구자에게 무료로 열렸어.

숫자로 보면

ESMC는 지구상 거의 모든 생명에서 모은 약 28억 개 단백질 서열로 학습했어. ESM Atlas에는 68억 개 서열과 11억 개 예측 구조가 들어 있어서, 기존 데이터베이스가 못 잡던 단백질 사이 관계까지 펼쳐 볼 수 있고.

왜 중요한가

바이오허브는 이 도구로 암·면역에 핵심인 표적 5종에 붙는 단백질 바인더를 설계했고, 실험에서 결합을 확인했어. 예전 같으면 몇 달에서 몇 년 걸리던 설계를 며칠로 줄였다는 게 진짜 포인트야. 신약 개발 초기 단계의 속도가 통째로 바뀔 수 있다는 뜻이거든.

주의해서 볼 점

공개된 hit rate는 소형 미니바인더 36~88%, 항체 유래 포맷 15~29%로 포맷에 따라 편차가 커. 바이오허브 자체 실험 수치라 외부 연구실의 독립 재현은 아직 지켜봐야 하고, AlphaFold 계열과의 실제 성능 비교도 앞으로 나올 데이터로 봐야 해.