이 뉴스의 요약은 어떻게 만들어졌나요?

원문 링크를 바탕으로 핵심 요약을 만들고 fact-check 및 신호 점검을 거쳐 게재됩니다.

팩트체크 기준은 무엇인가요?

근거 링크, 수치 점검, 문맥 정합성, 최신성으로 조합해 상태를 표시해.

구글 딥마인드, 텍스트 디퓨전으로 최대 4배 빠른 DiffusionGemma 공개했어

구글 딥마인드가 2026년 6월 10일 DiffusionGemma를 공개했어. 토큰을 하나씩 안 만들고 256개를 한 번에 만드는 텍스트 디퓨전 방식이라, 전용 GPU에서 최대 4배 빠르고 H100에서 1000토큰/초를 넘겨. 26B 중 3.8B만 쓰는 MoE 구조고 Apache 2.0으로 풀렸어.

무슨 일이 있었나

구글 딥마인드가 2026년 6월 10일 DiffusionGemma를 공개했어. 보통 모델처럼 토큰을 하나씩 안 만들고, 256개를 한 번에 만드는 텍스트 디퓨전 방식이야. 전용 GPU에서 최대 4배 빠르고, Apache 2.0으로 풀렸어.

어떻게 빨라지나

기존 자기회귀 모델은 왼쪽부터 오른쪽으로 한 토큰씩 순서대로 뽑아. DiffusionGemma는 256토큰짜리 블록을 한 번의 forward pass에서 병렬로 만들고, 블록 안 토큰들이 서로를 양방향으로 참조해. 이 병렬 생성 덕분에 H100에서 1000토큰/초를 넘기고 RTX 5090에서도 700토큰/초 이상이 나와. 26B MoE 구조인데 추론할 땐 3.8B만 활성화하고, 양자화하면 18GB VRAM에 들어가.

어떤 의미인가

코드 채우기나 인라인 수정처럼 앞뒤를 같이 봐야 하는 작업에서 양방향 참조가 유리해. 다만 구글 스스로 품질이 표준 Gemma 4보다 낮다고 밝혔고, 프로덕션엔 Gemma 4를 권했어. 속도가 급한 로컬·인터랙티브 작업에 실험적으로 써보고 판단해도 늦지 않아. 속도 수치는 구글 자체 측정이라, 독립 벤치마크가 나오면 다시 보는 게 맞아.

태그

#google#gemma#diffusion#open-weights#llm

포맷 v3 가이드 news 3.4.1

팩트 체크

통과 · 2026-06-11 KST

검증 생성: AI + 편집 검토 · 2026-06-11 상태: 통과

통과 원문 대조

구글 공식 블로그 원문에서 수치와 구조 설명을 본문과 대조했어

최대 4배 빠른 생성, H100 1000토큰/초 이상, RTX 5090 700토큰/초 이상 — 공식 블로그 명시
26B MoE 중 추론 시 3.8B 활성, 256토큰 블록 병렬 생성 — 공식 블로그 확인
Apache 2.0 라이선스, 2026년 6월 10일 공개 — 공식 블로그 명시

통과 교차 검증 검증 출처 3

엔비디아 기술 블로그와 허깅페이스 모델 카드로 독립 교차검증했어

1차 출처 교차검증: 구글 블로그와 엔비디아 기술 블로그, 허깅페이스 모델 카드를 따로 대조했어
엔비디아 블로그에서 H100 1000토큰/초 이상, 18GB VRAM 양자화 구동을 독립 확인
허깅페이스 모델 카드 이름이 diffusiongemma-26B-A4B-it로 26B/활성 4B 구조와 일치

통과 수치 검증

본문 수치를 공식 블로그와 엔비디아 블로그 기준으로 정량 확인했어

최대 4배 속도: 구글 공식 블로그 직접 명시, 전용 GPU 기준
26B 총 파라미터, 추론 시 3.8B 활성: 공식 블로그와 허깅페이스 모델 카드 일치
256토큰 블록 병렬 생성: 공식 블로그 명시
H100 1000토큰/초 이상, RTX 5090 700토큰/초 이상: 공식 블로그와 엔비디아 블로그 확인
양자화 시 18GB VRAM에 적재: 엔비디아 기술 블로그 확인

통과 비판 검토

속도 수치 출처와 품질 트레이드오프, 후속 검증 한계를 적었어

4배와 토큰/초 수치는 구글 자체 벤치마크라 독립 벤치마크는 아직 없어
엔비디아 블로그는 자사 GPU 최적화 글이라 속도 수치에 이해관계가 있어
구글 스스로 품질이 표준 Gemma 4보다 낮다고 밝혔고 프로덕션엔 Gemma 4를 권했어

속도 수치는 벤더 자체 측정 — 독립 벤치마크가 나오면 다시 봐야 해
품질이 표준 Gemma 4보다 낮다는 한계를 본문에 명시했어

출처: DiffusionGemma: 4x faster text generation — Google Blog , Run DiffusionGemma on NVIDIA — NVIDIA Technical Blog , google/diffusiongemma-26B-A4B-it — Hugging Face