Synthszr Charts — die großen AI-Marken im Wettkampf ums Podium

Nemotron-3

#26 in Frontier-Sprachmodelle

nvidia · v3 · seit 4. Juni 2026 · 45× · zuletzt 29. Juni 2026

Momentum

Nemotron 3 Ultra ist NVIDIAs größtes und leistungsstärkstes Modell der Nemotron-3-Familie: ein offenes 550-Milliarden-Parameter Mixture-of-Experts-Modell mit 55 Milliarden aktiven Parametern pro Forward-Pass, das auf einer hybriden Mamba-Transformer-Architektur (LatentMoE) mit Multi-Token-Prediction basiert. Es wurde am 4. Juni 2026 veröffentlicht (angekündigt bei Computex 2026) und ist auf agentische Workflows, Langzeit-Reasoning sowie hohen Durchsatz bei geringen Inferenzkosten ausgelegt. Das Modell wird vollständig offen (Gewichte, Trainingsdaten, Rezepte) unter der OpenMDW-1.1-Lizenz bereitgestellt und unterstützt ein Kontextfenster von bis zu 1 Million Token.

Momentum-Verlauf

04.04.03.07.

Features

Key-Benchmark (%)	Artificial Analysis Intelligence Index: 48 (bzw. 47,7) – höchster Wert eines US-Open-Weight-Modells (Stand Juni 2026)
Kontextfenster (Token)	bis zu 1.000.000 Token
Lizenz	OpenMDW License Agreement v1.1 (offene Gewichte, Daten & Trainingsrezepte)
Multimodalität	Text-only (Input/Output); kein natives Bild-, Audio- oder Videoverständnis
Plattform	NVIDIA GPUs (Hopper, Blackwell, Ampere); Deployment via vLLM, SGLang, TensorRT-LLM, NIM Microservices, Hugging Face
Preis pro 1M Token	ca. $0,50 Input / $2,20–2,50 Output pro 1M Token (variiert je nach Hosting-Anbieter)
Release-Datum	4. Juni 2026 (Ankündigung 1. Juni 2026, Computex Taipei)

Nemotron-3

Features

Belege (45)

Weitere Produkte in dieser Kategorie: Frontier-Sprachmodelle

Subscribe free. Unsubscribe the second it sucks.