이 용어는 어디까지 신뢰할 수 있나요?

Gemma 4는 Google DeepMind가 만든 오픈 모델 계열이야. 같은 회사의 Gemini가 클라우드 서비스 쪽 중심이라면, Gemma 4는 가중치를 내려받아 로컬 장비나 엣지 기기에서도 굴릴 수 있게 설계된 쪽에 더 가까워. 공식 발표 기준 Apache 2.0 라이선스고 E2B, E4B, 26B A4B, 31B처럼 하드웨어별 크기로 나뉘어 있어.

이 모델로 무엇을 할 수 있나

실무에서는 로컬 코드 어시스턴트, 문서 OCR, 화면 이해, 이미지 입력이 섞인 에이전트 흐름, 온디바이스 앱 프로토타입에 많이 써. 작은 E2B와 E4B는 휴대폰, Raspberry Pi, Jetson Orin Nano 같은 엣지 기기에서 오프라인 실행을 노리고, 26B와 31B는 워크스테이션이나 consumer GPU에서 IDE 보조나 장문 리포지토리 분석용으로 많이 거론돼. Google은 31B와 26B를 AI Studio에서, 작은 모델은 AI Edge Gallery 쪽에서 바로 만져볼 수 있게 열어뒀어.

왜 중요한가

Gemma 4가 중요한 이유는 성능 좋은 오픈 모델에서 끝나지 않고, 작은 모델은 128K, 큰 모델은 256K 컨텍스트를 주면서 함수 호출과 구조화 출력 같은 에이전트 기능까지 기본 탑재했기 때문이야. 26B A4B MoE는 총 25.2B 중 3.8B만 활성화해서 속도를 챙기고, 31B Dense는 품질 쪽을 밀어줘서 같은 이름 아래에서도 선택 기준이 또렷해. 그래서 기사에서 Gemma 4가 보이면 그냥 Google의 공개형 모델이 아니라 로컬, 온디바이스, 멀티모달, 에이전트를 한꺼번에 묶는 전략으로 읽으면 돼.

같이 보면 좋은 모델

gemini: Gemini는 Google의 클라우드 중심 주력 모델이라면 Gemma 4는 배포 자유도가 큰 오픈 모델 쪽이야. 둘을 같이 보면 Google이 왜 폐쇄형과 공개형을 동시에 가져가는지 보여.
gemma: Gemma 4는 기존 Gemma 계열의 최신 세대야. 초창기 경량 오픈 모델 이미지에서 멀티모달과 에이전트 쪽으로 얼마나 넓어졌는지 비교하기 좋아.
local-llm: Gemma 4는 로컬 LLM 얘기에서 하드웨어 대비 성능 기준점으로 자주 쓰여. 특히 26B와 31B가 소비자 GPU에서 어디까지 가능한지 읽을 때 같이 보면 좋아.
localllama: 커뮤니티 반응을 따라가려면 LocalLLaMA 문맥도 중요해. Gemma 4가 실제로 어떤 장비에서 잘 돈다는 평가를 어디서 얻는지 감이 생겨.

이 항목을 참조하는 위키

📰 관련 기사 (2)

Google Gemma 4 나왔어 — 오픈 모델 세계 3위, Apache 2.0 라이선스2026-04-05🔥94점
z-lab, Gemma-4 26B용 DFlash 공식 드래프트 공개 — 동시 8 추론에서 3.7배 가속2026-05-09🔥78점 · 출처 3

포맷 v2 가이드 wiki 3.1.2

팩트 체크

통과 · 2026-04-17 KST

검증 생성: AI + 편집 검토 · 2026-04-17 상태: 통과

통과 원문 대조 검증 출처 2

공식 발표와 모델 카드 설명이 내가 쓴 정의랑 어긋나지 않는지 맞춰봤어.

독자 문제 대조: Gemma 4를 Gemini의 다른 이름으로 오해하지 않게 오픈 모델 계열이라는 점부터 앞에 뒀어.
Google 블로그의 Apache 2.0, 하드웨어별 네 가지 크기 설명을 본문 정의에 반영했어.
모델 카드의 128K, 256K 컨텍스트와 함수 호출 지원도 실제 사용 설명에 붙였어.

Gemma 4는 단순한 경량 모델이 아니라 기기별 배포 전략을 가진 제품군으로 읽는 게 맞아.

통과 교차 검증 검증 출처 2

출시 블로그와 모델 카드가 같은 제품 포지션을 말하는지 다시 봤어.

비교 기준: Google 블로그의 하드웨어 전략과 모델 카드의 세부 스펙이 서로 같은 네 가지 모델 구성을 가리키는지 맞춰봤어.
블로그의 온디바이스 오프라인 실행 설명과 모델 카드의 E2B, E4B, 26B, 31B 표를 서로 대조했어.
AI Studio와 AI Edge Gallery 배포 경로도 블로그 쪽 설명에만 있는 내용이라 과장 없이 그대로만 남겼어.

Gemma 4는 로컬 실행성과 제품 배포 채널이 같이 설계된 모델군이라는 점이 교차 확인돼.

통과 수치 검증 검증 출처 2

모델 크기, 컨텍스트 길이, 활성 파라미터 숫자를 다시 봤어.

작은 모델 128K, 큰 모델 256K 컨텍스트를 다시 확인했어.
26B A4B MoE의 총 25.2B와 활성 3.8B 수치를 다시 확인했어.
31B Dense와 E2B, E4B라는 제품 구성을 다시 확인했어.

숫자는 블로그와 모델 카드가 겹쳐 말하는 것만 남겨서 과장 가능성을 줄였어.

통과 비판 검토

Gemma 4를 그냥 작은 로컬 모델로만 읽는 오해를 막았어.

31B와 26B는 워크스테이션급 추론용이라는 점을 넣어서 모바일 모델처럼만 보이지 않게 했어.
Gemini의 공개 버전이라고 단순 치환하는 표현은 빼고 별도 오픈 모델 계열이라는 설명만 남겼어.
오픈 모델이라는 말이 곧 저사양 전용이라는 오해를 막으려고 하드웨어 범위를 같이 적었어.

Gemma 4를 기기별 제품군으로 읽게 해서 과도한 단순화를 막았어.

출처: Gemma 4: Byte for byte, the most capable open models , Scheda del modello Gemma 4  |  Google AI for Developers

Gemma 4(젬마 4)

상위 모델

버전 페이지

전체 AI 기술 맵에서의 위치

한 줄 정의

이 모델로 무엇을 할 수 있나

왜 중요한가

같이 보면 좋은 모델

관련 용어

이 항목을 참조하는 위키

📰 관련 기사 (2)