

Nemotron-3
#26 in Frontier-Sprachmodellenvidia · v3 · seit 4. Juni 2026 · 45× · zuletzt 29. Juni 2026
Nemotron 3 Ultra ist NVIDIAs größtes und leistungsstärkstes Modell der Nemotron-3-Familie: ein offenes 550-Milliarden-Parameter Mixture-of-Experts-Modell mit 55 Milliarden aktiven Parametern pro Forward-Pass, das auf einer hybriden Mamba-Transformer-Architektur (LatentMoE) mit Multi-Token-Prediction basiert. Es wurde am 4. Juni 2026 veröffentlicht (angekündigt bei Computex 2026) und ist auf agentische Workflows, Langzeit-Reasoning sowie hohen Durchsatz bei geringen Inferenzkosten ausgelegt. Das Modell wird vollständig offen (Gewichte, Trainingsdaten, Rezepte) unter der OpenMDW-1.1-Lizenz bereitgestellt und unterstützt ein Kontextfenster von bis zu 1 Million Token.
Features
| Key-Benchmark (%) | Artificial Analysis Intelligence Index: 48 (bzw. 47,7) – höchster Wert eines US-Open-Weight-Modells (Stand Juni 2026) |
| Kontextfenster (Token) | bis zu 1.000.000 Token |
| Lizenz | OpenMDW License Agreement v1.1 (offene Gewichte, Daten & Trainingsrezepte) |
| Multimodalität | Text-only (Input/Output); kein natives Bild-, Audio- oder Videoverständnis |
| Plattform | NVIDIA GPUs (Hopper, Blackwell, Ampere); Deployment via vLLM, SGLang, TensorRT-LLM, NIM Microservices, Hugging Face |
| Preis pro 1M Token | ca. $0,50 Input / $2,20–2,50 Output pro 1M Token (variiert je nach Hosting-Anbieter) |
| Release-Datum | 4. Juni 2026 (Ankündigung 1. Juni 2026, Computex Taipei) |