

Gemma 2
#32 in Open-Source-Sprachmodellegoogle · v2 · seit 27. Juni 2024 (9B und 27B); Gemma 2 2B später im Jahr 2024 · 10× · zuletzt 30. Juni 2026
Gemma 2 ist eine Familie offener, leichtgewichtiger Sprachmodelle von Google DeepMind, die auf derselben Technologie wie die Gemini-Modelle basiert. Sie wurde am 27. Juni 2024 in den Größen 9B und 27B veröffentlicht, eine 2B-Variante folgte später. Die Modelle sind reine Text-zu-Text-Decoder-Modelle mit offenen Gewichten (Basis- und instruction-tuned Varianten), optimiert auf Inferenzgeschwindigkeit und Effizienz auf unterschiedlicher Hardware, von Laptops bis Cloud-TPUs/GPUs. Gemma 2 steht unter der kommerziell nutzbaren Gemma-Lizenz und ist über Kaggle, Hugging Face und Google Cloud Vertex AI verfügbar.
Features
| Key-Benchmark (%) | MMLU 27B (instruction-tuned): 76,2%; 9B (IT): 72,3%; 2B (IT): 56,1% |
| Kontextfenster (Token) | 8K Token (8192), mit Sliding-Window-Attention (lokal 4096 Token in jeder zweiten Schicht) |
| Lizenz | Gemma-Lizenz (kommerziell nutzbar, kein voller Open-Source-Standard) |
| Multimodalität | Nein – reine Text-zu-Text-Modelle (Input: Text, Output: Text); Bildfähigkeit erst über abgeleitetes Modell PaliGemma 2 |
| Plattform | Hugging Face, Kaggle, Google AI Studio, Vertex AI, Ollama, Hugging Face Transformers, JAX, PyTorch, TensorFlow/Keras, vLLM, Gemma.cpp, Llama.cpp, NVIDIA TensorRT-LLM/NIM |
| Release-Datum | 27. Juni 2024 (Gemma 2 9B/27B); 2B-Variante folgte später 2024 |