

Vera Rubin
#2 in KI-Trainings-Hardwarenvidia · seit Zweite Jahreshälfte 2026 (Partnersysteme); volle Serienproduktion seit Anfang 2026 · 13× · zuletzt 30. Juni 2026
NVIDIA Vera Rubin ist die nächste Generation der rack-skalierten KI-Infrastrukturplattform von NVIDIA und der Nachfolger von Blackwell. Sie besteht aus sieben co-designten Chips (u.a. Rubin-GPU, Vera-CPU, NVLink-6-Switch, ConnectX-9-SuperNIC, BlueField-4-DPU, Spectrum-6-Ethernet-Switch und Groq-3-LPU), die in fünf rack-skalierten Systemen zu einem einzigen KI-Supercomputer kombiniert werden. Die Plattform befindet sich seit Anfang 2026 in voller Serienproduktion; erste Partnersysteme (u.a. bei AWS, Google Cloud, Microsoft Azure, OCI und CoreWeave) sollen ab der zweiten Jahreshälfte 2026 verfügbar sein. Kernkomponente ist das Vera Rubin NVL72-Rack mit 72 Rubin-GPUs und 36 Vera-CPUs, das auf HBM4-Speicher und den TSMC-3-nm-Prozess setzt.
Features
| Fertigungsprozess (nm) | TSMC 3 nm Prozess (Rubin-GPU und Vera-CPU) |
| Plattform | Vera Rubin NVL72: 72 Rubin-GPUs + 36 Vera-CPUs, NVLink 6, ConnectX-9, BlueField-4, Spectrum-6/Quantum-X800 |
| Preis | Kein offizieller NVIDIA-Listenpreis veröffentlicht (Drittquellen schätzen DGX-Rack ca. $3,5–4 Mio.) |
| Rechenleistung (FLOPS/TOPS) | 3,6 EFLOPS NVFP4-Inferenz und 2,5 EFLOPS Training pro NVL72-Rack; 50 PFLOPS NVFP4 pro GPU |
| Release-Datum | Partnersysteme ab H2 2026; volle Serienproduktion seit Q1 2026 |
| Speicher | 288 GB HBM4 pro GPU (22 TB/s Bandbreite); 20,7 TB HBM4 + 54 TB LPDDR5X pro NVL72-Rack |
| Verfügbarkeit | Volle Serienproduktion seit Anfang 2026; Cloud-Verfügbarkeit (AWS, Google Cloud, Azure, OCI, CoreWeave u.a.) ab H2 2026 |