

Google AI Edge Gallery
#11 in Local LLM Runtimesgoogle · 12× · last seen Jun 30, 2026
13
Momentum
Google AI Edge Gallery ist eine kostenlose, quelloffene App von Google zum lokalen Ausführen von Open-Source-LLMs (v.a. Gemma) direkt auf Endgeräten – ohne Cloud-Anbindung. Sie basiert auf dem LiteRT-LM-Framework und bietet Funktionen wie Chat mit "Thinking Mode", Bildverständnis ("Ask Image"), Audio-Transkription ("Audio Scribe") sowie Modell-Benchmarking. Ursprünglich im Mai 2025 für Android gestartet, folgten iOS (App Store) und seit Juni 2026 auch eine macOS-Desktop-Version. Der Quellcode ist auf GitHub unter Apache-2.0-Lizenz verfügbar.
Momentum trend
04.04.03.07.
Features
| Deployment (Self-Hosted/Cloud) | 100% on-device / self-hosted, fully offline, no internet connection required |
| Throughput/Latency | Device-dependent (CPU/GPU/NPU); MTP speculative decoding makes Gemma 4 up to 3x faster at inference |
| License | Apache License, Version 2.0 (open source) |
| Platform | Android 12+, iOS 17+, macOS (new since June 2026) |
| Price | Free |
| Protocol Compatibility | LiteRT-LM CLI 'serve' command starts an OpenAI-compatible server (default port 9379, /v1/chat/completions) |
| Release Date | Android: May 21, 2025 (GitHub launch); macOS version: June 3-4, 2026 |
| Supported Models/Providers | Gemma 4 (E2B/E4B/12B), Gemma 3n, other open-source LLMs from Hugging Face (e.g., Qwen2.5, Phi-4-mini, DeepSeek-R1-Distill) |