이 뉴스의 요약은 어떻게 만들어졌나요?

원문 링크를 바탕으로 핵심 요약을 만들고 fact-check 및 신호 점검을 거쳐 게재됩니다.

팩트체크 기준은 무엇인가요?

근거 링크, 수치 점검, 문맥 정합성, 최신성으로 조합해 상태를 표시해.

Qwen3.5 35B-A3B 'heretic' 공개 — 커뮤니티가 검열 풀고 MTP 785개 살린 변형

오픈소스 LLM 진영이 Qwen3.5 35B-A3B MoE 모델에서 검열 레이어를 제거한 'heretic' 변형을 공개했어. 785개 Multi-Token Prediction 토큰이 그대로 보존돼 추론 속도 그대로, Safetensors·GGUF·NVFP4·GPTQ-Int4 4가지 포맷 다 풀렸어.

무슨 일이 일어났나

오픈소스 LLM 커뮤니티가 Qwen3.5-35B-A3B 모델에서 안전 정렬(refusal) 레이어를 제거한 heretic v2 Native MTP Preserved 버전을 Hugging Face에 풀었어. 35B 파라미터 Mixture-of-Experts 모델이고, 한 번 추론할 때 실제로 도는 건 약 3B 정도야. 핵심은 모델에 박혀 있던 785개 Multi-Token Prediction 토큰을 그대로 보존했다는 점이야 — MTP는 한 번에 여러 토큰을 동시에 예측해 추론 속도를 끌어올리는 장치인데, 보통 abliteration(검열 제거)을 거치면서 망가지기 쉬워.

왜 이게 일어났나

공식 Qwen은 Alibaba가 안전 가드를 박아서 배포해. 그런데 로컬 환경에서 자기 데이터로 튜닝하거나 실험하려는 진영은 그 가드가 거추장스럽다고 느껴. 그래서 가중치를 직접 손봐서 “거부 반응”을 죽이는 abliteration 기법이 굳어졌어. 이번 버전은 거기에 더해 MTP 토큰까지 살린 게 차별점이야. 배포 포맷도 한 번에 4종 — Safetensors(원본), GGUF(llama.cpp용), NVFP4(NVIDIA Blackwell 4bit), GPTQ-Int4(범용 4bit) — 풀어놔서 RTX 3090부터 H100까지 거의 모든 환경에서 바로 돌릴 수 있어.

어떤 의미인가

상용 API(GPT, Claude)만 보다가 이 흐름을 모르고 있었다면, 오픈소스 진영이 이미 이렇게 빠르게 모델을 자기 손에 맞게 가공해서 쓰고 있다는 걸 알 필요가 있어. 특히 MoE와 MTP 조합은 앞으로 1~2년 LLM 추론 효율을 좌우할 키워드거든. 다만 검열 제거된 모델은 실서비스에 그대로 붙이기엔 위험해 — 컴플라이언스 리스크 없는 로컬 실험·연구용으로 쓰는 게 맞아.

주의해서 볼 점

이건 Alibaba/Qwen 공식 릴리스가 아니라 llmfan46이라는 개인 업로더의 변형이야. 가중치 처리 방식이 정확히 어떤 abliteration 알고리즘을 썼는지는 모델 카드에 자세히 안 적혀 있어서, 실제로 어디까지 안전 가드가 빠졌는지는 직접 돌려봐야 알 수 있어. 기업 환경에서 도입할 거면 라이선스와 함께 가중치 출처 검증을 꼭 거쳐야 해.

태그

#qwen#local-llm#moe#uncensored#huggingface

포맷 v3 가이드 news 3.4.1

팩트 체크

통과 · 2026-05-28 KST

검증 생성: AI + 편집 검토 · 2026-05-28 상태: 통과

통과 원문 대조

원본 Hugging Face 모델 카드의 핵심 사실(35B/3B MoE, 785 MTP, 4종 포맷)을 본문이 변형 없이 반영

35B 파라미터 MoE 구조: 모델 카드 명시
Active params ~3B per forward pass: 모델 카드 명시
785 MTPs preserved: r/LocalLLaMA 게시글 본문 명시
4종 포맷(Safetensors, GGUF, NVFP4, GPTQ-Int4): 모델 카드 다운로드 섹션 명시

통과 교차 검증 검증 출처 2

Qwen3.5-35B-A3B 베이스 모델 구조와 abliteration 처리 방식을 동일 베이스의 다른 변형 카드에서 교차 검증

독립 1차 출처: HuggingFace llmfan46 모델 카드 — 35B/3B MoE 구조와 785 MTP 명시
독립 1차 출처: HuggingFace HauhauCS Aggressive 변형 카드 — 동일 베이스 35B/3B MoE 구조와 abliteration 처리 방식 교차 확인
독립 1차 출처: HuggingFace mradermacher/Qwen3.5-35B-A3B-heretic-GGUF — GGUF 정적 양자화 형태로 동일 모델군 식별, 추가 cross-reference 확보

통과 수치 검증

본문에 등장하는 모든 수치를 모델 카드 원문과 1:1 대조

35B 파라미터: 모델 카드 'Qwen3.5 35B-A3B' 표기와 일치
약 3B active: 모델 카드 'A3B = ~3B activated per token'와 일치
785 MTPs preserved: 원본 r/LocalLLaMA 게시글의 'Full 785 MTPs Preserved' 표기와 일치
4종 포맷: Safetensors, GGUF, NVFP4(+GGUF 변형), GPTQ-Int4 — 모델 카드 다운로드 목록과 일치
1~2년 전망: 본문의 시간 범위 표현으로 검증 대상 수치 아님 — 시장 추세 코멘트

통과 비판 검토

Alibaba 공식 릴리스가 아닌 커뮤니티 변형이라는 점을 본문에 명시. 안전성 가드 약화 위험도 함께 언급

Causal evidence: abliteration은 안전 정렬 레이어 가중치를 직접 손보는 방식이라 refusal 응답이 줄어들고, MTP 토큰까지 살리려면 가중치 처리 절차가 더 복잡해진다는 인과 — 모델 카드와 abliteration 일반 문헌에서 확인
Mechanism evidence: MTP는 한 번에 여러 토큰을 동시 예측해 디코딩 step 수를 줄이는 추론 가속 메커니즘 — Qwen 공식 문서 및 Meta/Salesforce MTP 연구 라인에서 확인
공식 Qwen(Alibaba) 릴리스가 아니라 'llmfan46' 개인 업로더의 커뮤니티 변형 — 본문 4번째 섹션에 명시
uncensored 모델은 안전 가드 약화 — 실서비스보다는 로컬 실험·연구용으로 제한 권고를 본문에 반영

출처: Hugging Face Model Card (llmfan46) , Hugging Face — HauhauCS variant (cross-reference)