무슨 일이 있었나

nohurry가 Opus-4.6-Reasoning-3000x-filtered를 HuggingFace에 올렸어. 원본은 angrygiraffe가 만든 Claude 4.6/4.7 추론 대화 8,706개짜리 데이터셋이야. 여기서 거부 응답 979개를 걷어내고 순수 추론 예제만 남긴 버전이야.

이 데이터셋은 Claude Opus 4.6/4.7이 실제로 생성한 추론 과정 대화로 구성돼 있어. 모델이 문제를 단계별로 풀어나가는 방식을 보여주는 형식이라, 다른 모델을 파인튜닝할 때 추론 패턴을 전달하는 목적으로 쓰여.

어떻게 쓰이고 있나

이미 여러 파인튜닝 모델이 올라왔어.

  • Qwen3.5 계열: 2B, 9B, 14B, 27B, 35B-A3B까지 다양한 크기로 Jackrong 계정에서 파인튜닝 모델들이 공개됐어.
  • 데이터 변형: crownelius가 Opus-4.6-Reasoning-3300x라는 별도 버전을 만들었고, 필터링 방식이 다른 변형들도 나오고 있어.

주의할 점

Claude 출력을 학습 데이터로 써서 다른 모델을 파인튜닝하는 건 Anthropic 이용약관과 충돌할 수 있어. 커뮤니티에서 활발하게 쓰이고 있지만, 상업적 용도로 쓰기 전에 약관을 직접 확인해봐야 해. 증류(distillation)한 모델이 원본 Claude Opus 4.6 수준에 도달한다는 검증도 아직 없고.