

Trainium
#1 in KI-Trainings-Hardwareamazon · seit Dezember 2025 (Trainium3) · 16× · zuletzt 30. Juni 2026
100
Momentum
Trainium ist ein spezialisierter KI-Beschleunigungschip von AWS für Training und Inferenz großer Sprachmodelle. Die aktuelle Generation (Trainium3) wurde im Dezember 2025 auf TSMC 3nm-Prozess hergestellt und bietet 2,52 PFLOPs FP8-Rechenleistung pro Chip mit 144 GB HBM3e-Speicher. AWS positioniert Trainium als kosteneffiziente Alternative zu NVIDIA-Chips mit Einsparungen von 30-50% im Gesamtkostenbudget für Kunden.
Momentum-Verlauf
04.04.03.07.
Features
| Fertigungsprozess (nm) | 3 nm (Trainium3, erster 3nm-AWS-Chip); Trainium2: 5 nm; Trainium1: 7 nm |
| Lizenz | Neuron Kernel Interface (NKI) Compiler unter Apache 2.0 Open Source; Chip/Hardware selbst proprietär, nur als AWS-Cloud-Dienst nutzbar |
| Plattform | Amazon EC2 (Trn1/Trn2/Trn3 Instanzen & UltraServer), programmierbar via AWS Neuron SDK, kompatibel mit PyTorch, JAX, Hugging Face, vLLM |
| Preis | Trn3: ca. $1,80/Chip-Stunde (Drittquelle); Trn1.32xlarge ab $21,50/h On-Demand |
| Rechenleistung (FLOPS/TOPS) | Trainium3: 2,52 PFLOPS FP8 pro Chip; Trn3 UltraServer (144 Chips): bis zu 362 PFLOPS FP8/MXFP8 |
| Release-Datum | Trainium3 / Trn3 UltraServer GA: 2. Dezember 2025 (AWS re:Invent 2025) |
| Speicher | 144 GB HBM3e pro Chip, 4,9 TB/s Bandbreite; UltraServer bis 20,7 TB HBM3e, 706 TB/s aggregierte Bandbreite |
| Verfügbarkeit | Trainium3/Trn3 UltraServers allgemein verfügbar (GA) seit 2. Dezember 2025 über AWS EC2 |