

DeepSeek-V2
#54 in Open-Source-Sprachmodelledeepseek · v2 · seit Mai 2024 · 2× · zuletzt 30. Juni 2026
7
Momentum
DeepSeek-V2 ist ein Sprachmodell von DeepSeek. Das Produkt wurde im Mai 2024 entwickelt.
Momentum-Verlauf
04.04.03.07.
Features
| Benchmark-Score (MMLU/ähnlich) | MMLU (5-shot): 78,5 % (DeepSeek-V2 Base); Chat-Variante: 78,1 % MMLU laut DeepSeek-Coder-V2-Paper |
| Inferenz-Geschwindigkeit | Generierungs-Throughput >50.000 Tokens/s (auf 1 Node mit 8× H800 GPUs, FP8-Präzision); Prompt-Input-Throughput >100.000 Tokens/s; entspricht 5,76× dem Durchsatz von DeepSeek 67B |
| Kontextfenster | 128.000 Tokens |
| Modellgröße (Parameter) | 236B Gesamt-Parameter (MoE); 21B aktivierte Parameter pro Token |
| Preis-Tier | API (zum Zeitpunkt des Releases): ca. $0,14/M Input-Tokens und $0,28/M Output-Tokens; Open-Weights-Modell kostenlos verfügbar (DeepSeek License Agreement, kommerzielle Nutzung erlaubt) |
| Speicher-Anforderung | Vollmodell (BF16): mind. 8× 80 GB GPUs empfohlen (z. B. 8× H800/H100); mit 4-Bit-Quantisierung ca. 136 GB VRAM (Multi-GPU erforderlich) |