

Lyra 2.0
#17 in KI-Inferenz-Hardwarenvidia · v2.0 · seit 2026-04-15 · 14× · zuletzt 30. Juni 2026
Lyra 2.0 ist ein von NVIDIA Research (Spatial Intelligence Lab) veröffentlichtes Framework zur Erzeugung persistenter, begehbarer 3D-Welten aus einem einzelnen Bild und einer nutzerdefinierten Kamerabahn. Das System basiert auf einem 14-Milliarden-Parameter-Videodiffusionsmodell (WAN-14B), löst per-Frame-3D-Geometrie-Caching das Problem des "räumlichen Vergessens" und trainiert mit selbstverstärkten Historien gegen "zeitliches Driften". Die generierten Walkthrough-Videos werden per Feed-Forward-Rekonstruktion in 3D-Gaussian-Splats und Meshes umgewandelt, die u.a. in NVIDIA Isaac Sim für Robotik-Simulationen exportiert werden können. Der Quellcode ist unter Apache-2.0-Lizenz auf GitHub verfügbar, die Modellgewichte selbst unterliegen jedoch einer restriktiveren NVIDIA-internen Forschungsliz
Features
| Lizenz | Modellgewichte: NVIDIA Internal Scientific Research and Development Model License (kein Produktionseinsatz, keine kommerzielle Nutzung, keine Weitergabe). Quellcode: Apache 2.0. |
| Plattform | NVIDIA GPU-beschleunigte Systeme (H100, GB200); bevorzugtes Betriebssystem Linux; CUDA-Frameworks; kein verwalteter Inferenz-Endpunkt vorhanden – lokaler Betrieb auf eigener Hardware erforderlich |
| Preis | Kostenlos (Modellgewichte auf Hugging Face, Quellcode auf GitHub; kein kommerzielles Inferenz-Endpoint) |
| Release-Datum | 15. April 2026 (Paper, Modellgewichte und Inferenz-Code; 4-Step-DMD-Distillation-LoRA am 17. April 2026) |
| Speicher | Modell-Checkpoint-Größe: 97 GB (Hugging Face Repository). Modellparameter: 14 Milliarden (basierend auf Wan-2.1-14B). Training: 32 H100-Nodes, ~24 Milliarden Token Trainingsverbrauch. |