무슨 일이 일어났나

JackrongQwen3.5-9B를 베이스로 에이전틱 코딩에 특화 미세조정한 Qwopus3.5-9B-Coder GGUFHugging Face에 공개했어. Apache-2.0 라이선스이고, Q2_K부터 BF16까지 7가지 양자화 옵션을 묶어서 올렸거든.

성능 수치는 어떤가

모델 카드에 적힌 자체 벤치마크 결과를 보면 사이즈 대비 점수가 높은 편이야:

  • ToolCall-15 (도구 호출 안정성): 100/100 — 완벽
  • HermesAgent-20 (복합 에이전트 성능): 85/100
  • BugFind-15 (코드 디버깅): 79/100
  • SWE-bench Verified: 53.33%

Claude 4.5 Opus가 SWE-bench에서 80.9%, Qwen3.5-27B가 75.0%인 걸 감안하면 9B 모델로는 꽤 선전한 편이지. ToolCall 100점은 agentic 워크플로우에서 실패가 거의 없다는 신호거든.

어떤 의미인가

9B 덴스 구조는 8비트로 16GB RAM 노트북이나 Mac mini에서 그대로 돈다고 명시돼 있어. 로컬에서 도는 GGUF 코딩 에이전트로는 sweet spot에 가까워. Trace Inversion 기법으로 상용 모델 출력에서 추론 체인을 재구성하고, GLM-5.1 trace에서 약 1만 개의 멀티턴 tool-call 궤적을 가져와 훈련했다고 하거든.

주의할 점

모델 카드 본인이 capability decay 경고를 붙여놨어. 코딩과 도구 호출에 수직 특화돼서, 일반 도메인 성능은 베이스 모델보다 떨어질 수 있다는 거지. 그리고 GLM-5.1 trace를 학습에 쓴 부분은 원천 모델 라이선스 검토가 필요해. 실제 워크로드에 투입하기 전에 짧은 파일럿이 안전해.