무슨 일이 있었나

Google DeepMind이 4월 2일 Gemma 4를 공개했어. Gemini 3이랑 같은 연구 기반으로 만든 오픈 웨이트 모델이고, Apache 2.0 라이선스로 배포돼. 모델E2B, E4B, 26B MoE, 31B Dense 4가지 크기로 나왔어.

왜 중요할까

성능 수치가 눈에 띄어. 31B Dense 모델은 Arena AI 텍스트 리더보드에서 오픈 모델 3위, MMLU Pro 85.2%, AIME 2026 89.2%를 기록했어. Codeforces ELO 2150으로 코딩 능력도 훨씬 큰 모델이랑 경쟁 가능한 수준이야. 26B MoE 모델도 리더보드 6위를 차지했고. Google 측은 “자기 크기의 20배 모델을 이기는” 효율성을 강조하고 있어.

앞으로 볼 점

근데 진짜 반응이 뜨거운 건 로컬 실행 쪽이야. 26B MoE 모델Mixture of Experts 구조 덕분에 16GB Mac에서 CPU 전용 모드로도 돌아가고, Raspberry Pi 5에서 Gemma 4 E4B를 실행한 사례도 나왔어. 4W 전력의 Rockchip NPU에서 llama.cpp 포크로 구동한 보고도 있고. 무겁고 비싼 클라우드 API 없이도 쓸 만한 성능의 AI를 로컬에서 돌리는 시대가 한 발짝 더 가까워졌어.