

Gemma 4 E4B
#8 in Small & Edge-Modellegoogle · v4 · e4b · seit 2. April 2026 · 11× · zuletzt 30. Juni 2026
30
Momentum
Gemma 4 E4B ist ein Open-Weight Edge-Sprachmodell von Google DeepMind mit ~4,5 Milliarden effektiven Parametern (8B Gesamtparameter), das für den Einsatz auf mobilen Geräten und Laptops konzipiert ist. Es unterstützt nativ Text-, Bild-, Video- und Audioeingaben und nutzt Per-Layer Embeddings (PLE) für maximale Parametereffizienz auf Edge-Hardware. Das Modell ist unter der Apache-2.0-Lizenz verfügbar und kann lokal ohne Cloud-Anbindung betrieben werden. Es ist Teil der Gemma-4-Familie, die vier Größen umfasst: E2B, E4B, 26B A4B und 31B.
Momentum-Verlauf
04.04.03.07.
Features
| Key-Benchmark (%) | MMLU-Pro: 69,4 % | AIME 2026: 42,5 % | LiveCodeBench v6: 52,0 % | MMMU Pro (Vision): 52,6 % (jeweils E4B-spezifisch) |
| Kontextfenster (Token) | 128.000 Token |
| Lizenz | Apache 2.0 (unrestricted commercial use, fine-tuning, redistribution) |
| Multimodalität | Text, Bild (variable Auflösung/Seitenverhältnis), Video (Frame-Sequenzen), Audio (ASR & Speech-to-Text-Übersetzung) – alle nativ im Modell integriert |
| Plattform | On-Device (Android, iOS, Desktop, IoT, Web) via LiteRT-LM; Hugging Face, Kaggle, Ollama, llama.cpp, LM Studio, vLLM, MLX, Unsloth, SGLang; Google AI Edge Gallery |
| Preis | Kostenlos (Open-Weight-Modell, Weights frei herunterladbar) |
| Release-Datum | 2. April 2026 |