

Google AI Edge Gallery
#11 in Lokale LLM-Runtimesgoogle · 12× · zuletzt 30. Juni 2026
13
Momentum
Google AI Edge Gallery ist eine kostenlose, quelloffene App von Google zum lokalen Ausführen von Open-Source-LLMs (v.a. Gemma) direkt auf Endgeräten – ohne Cloud-Anbindung. Sie basiert auf dem LiteRT-LM-Framework und bietet Funktionen wie Chat mit "Thinking Mode", Bildverständnis ("Ask Image"), Audio-Transkription ("Audio Scribe") sowie Modell-Benchmarking. Ursprünglich im Mai 2025 für Android gestartet, folgten iOS (App Store) und seit Juni 2026 auch eine macOS-Desktop-Version. Der Quellcode ist auf GitHub unter Apache-2.0-Lizenz verfügbar.
Momentum-Verlauf
04.04.03.07.
Features
| Deployment (Self-host/Cloud) | 100% On-Device / Self-host, vollständig offline, keine Internetverbindung nötig |
| Durchsatz/Latenz | Geräteabhängig (CPU/GPU/NPU); MTP-Speculative-Decoding macht Gemma 4 bis zu 3x schneller bei Inferenz |
| Lizenz | Apache License, Version 2.0 (Open Source) |
| Plattform | Android 12+, iOS 17+, macOS (neu seit Juni 2026) |
| Preis | Kostenlos (Free) |
| Protokoll-Kompatibilität | LiteRT-LM CLI 'serve'-Befehl startet OpenAI-kompatiblen Server (Standard-Port 9379, /v1/chat/completions) |
| Release-Datum | Android: 21. Mai 2025 (GitHub-Launch); macOS-Version: 3./4. Juni 2026 |
| Unterstützte Modelle/Provider | Gemma 4 (E2B/E4B/12B), Gemma 3n, weitere Open-Source-LLMs von Hugging Face (z.B. Qwen2.5, Phi-4-mini, DeepSeek-R1-Distill) |