무슨 일이 일어났나
Darwin-36B-Opus가 Hugging Face에 올라왔어. 36B 총 파라미터를 갖고 있지만 답변할 때는 약 3B만 쓰는 MoE 구조야. 모델 카드는 262K 긴 문맥, Apache 2.0 표기, GPQA Diamond 결과를 앞세워.
GPQA 수치는 조건을 나눠 봐야 해. 첫 시도에서는 145/198 정답으로 73.2%였고, 틀린 문제를 다시 생성해 여러 답을 투표하고 동률이면 추가 투표한 뒤에는 175/198 정답으로 88.4%였어. 둘 다 제작자 공개값이라 독립 재현은 아직 따로 봐야 해.
왜 이게 일어났나
Darwin V7은 Qwen3.6-35B-A3B와 Claude Opus distillation 계열 체크포인트를 재조합했어. 처음부터 재학습하지 않고 웨이트를 조합해 새 후보를 찾는 방식이라 공개 속도는 빠르지만, parent 데이터 경로와 약관 확인은 더 중요해져.
어떤 의미인가
로컬 실행 관점에서는 GGUF 변환본이 이미 올라온 점이 커. 바로 시험해볼 수 있지만, 실무나 상업 사용 전에는 Apache 2.0 표기만 보지 말고 parent 모델 카드와 Anthropic 약관까지 같이 확인해야 해. GPQA 88.4%도 재시도 투표 포함값으로 읽는 게 맞아.