

Starchild-1
#91 in Frontier-Sprachmodelleodyssey · v1 · seit 2026-05-17 · 13× · zuletzt 30. Juni 2026
Starchild-1 ist ein von Odyssey vorgestelltes multimodales Weltmodell, das als Preview veröffentlicht wurde. Es generiert autoregressiv synchronisierte Audio- und Videoinhalte in Echtzeit und reagiert dabei kontinuierlich auf gestreamte Text-, Sprach- und Aktionseingaben der Nutzer. Anders als klassische Sprachmodelle lernt es direkt aus großskaligen Videodaten (Pixel, Bewegung, Aktionen) statt aus Text, und wird von Odyssey als erstes echtzeitfähiges multimodales Weltmodell bezeichnet. Konkrete Angaben zu Kontextfenster, Benchmark-Prozentwerten oder Token-Preisen liegen auf der offiziellen Seite nicht vor, da es sich um ein Audio-Video-Weltmodell und kein klassisches LLM mit Token-Pricing handelt.
Features
| Lizenz | Closed-Weights / proprietär, Zugriff nur über Vendor-API bzw. Produkt |
| Multimodalität | Audio + Video, autoregressiv synchronisiert generiert, reagiert auf Text-, Sprach- und Aktionseingaben in Echtzeit |
| Plattform | Web-Preview/API bei Odyssey (odyssey.ml), Technical Report unter starchild.odyssey.ml |
| Release-Datum | 17. Mai 2026 (Preview) |