무슨 일이 있었나
Google DeepMind이 4월 2일 Gemma 4를 공개했어. Gemini 3이랑 같은 연구 기반으로 만든 오픈 웨이트 모델이고, Apache 2.0 라이선스로 배포돼. 모델은 E2B, E4B, 26B MoE, 31B Dense 4가지 크기로 나왔어.
왜 중요할까
성능 수치가 눈에 띄어. 31B Dense 모델은 Arena AI 텍스트 리더보드에서 오픈 모델 3위, MMLU Pro 85.2%, AIME 2026 89.2%를 기록했어. Codeforces ELO 2150으로 코딩 능력도 훨씬 큰 모델이랑 경쟁 가능한 수준이야. 26B MoE 모델도 리더보드 6위를 차지했고. Google 측은 “자기 크기의 20배 모델을 이기는” 효율성을 강조하고 있어.
앞으로 볼 점
근데 진짜 반응이 뜨거운 건 로컬 실행 쪽이야. 26B MoE 모델은 Mixture of Experts 구조 덕분에 16GB Mac에서 CPU 전용 모드로도 돌아가고, Raspberry Pi 5에서 Gemma 4 E4B를 실행한 사례도 나왔어. 4W 전력의 Rockchip NPU에서 llama.cpp 포크로 구동한 보고도 있고. 무겁고 비싼 클라우드 API 없이도 쓸 만한 성능의 AI를 로컬에서 돌리는 시대가 한 발짝 더 가까워졌어.