

Gemini Robotics-ER 1.6
#27 in Robotik & Embodied AIgoogle · v1.6 · seit 2026-04-14 · 10× · zuletzt 30. Juni 2026
Gemini Robotics-ER 1.6 ist ein Vision-Language-Modell (VLM) von Google DeepMind, das auf der Gemini 3.0 Flash-Architektur basiert und speziell für verkörpertes Schlussfolgern (Embodied Reasoning) in Robotikanwendungen entwickelt wurde. Es agiert als hochrangiger Planungs- und Reasoning-Layer für Roboter, der räumliche Logik, Aufgabenplanung und Erfolgserkennung ermöglicht. Das Modell verarbeitet Bild-, Video- und Audioeingaben sowie natürlichsprachliche Befehle und kann nativ Tools wie Google Search und VLA-Modelle (Vision-Language-Action) aufrufen. Es ist das sicherste Robotikmodell von Google DeepMind bis dato und wurde mit signifikanten Verbesserungen gegenüber dem Vorgänger ER 1.5 veröffentlicht.
Features
| Deployment-Modell | Cloud-API (Hosted/Managed) über Gemini API und Google AI Studio; aktuell im Preview-Status; kein On-Premises- oder Self-Hosted-Betrieb dokumentiert |
| Plattform | Gemini API, Google AI Studio (Preview); Modellname: gemini-robotics-er-1.6-preview; Kontext-Fenster: 128k Token (Input), 64k Token (Output); basiert auf Gemini 3.0 Flash; trainiert auf Google TPUs |
| Release-Datum | 14. April 2026 |