DeepSeek-V2

#54 in Open-Source-Sprachmodelle

deepseek · v2 · seit Mai 2024 · 2× · zuletzt 30. Juni 2026

Momentum

DeepSeek-V2 ist ein Sprachmodell von DeepSeek. Das Produkt wurde im Mai 2024 entwickelt.

Momentum-Verlauf

04.04.03.07.

Features

Benchmark-Score (MMLU/ähnlich)	MMLU (5-shot): 78,5 % (DeepSeek-V2 Base); Chat-Variante: 78,1 % MMLU laut DeepSeek-Coder-V2-Paper
Inferenz-Geschwindigkeit	Generierungs-Throughput >50.000 Tokens/s (auf 1 Node mit 8× H800 GPUs, FP8-Präzision); Prompt-Input-Throughput >100.000 Tokens/s; entspricht 5,76× dem Durchsatz von DeepSeek 67B
Kontextfenster	128.000 Tokens
Modellgröße (Parameter)	236B Gesamt-Parameter (MoE); 21B aktivierte Parameter pro Token
Preis-Tier	API (zum Zeitpunkt des Releases): ca. $0,14/M Input-Tokens und $0,28/M Output-Tokens; Open-Weights-Modell kostenlos verfügbar (DeepSeek License Agreement, kommerzielle Nutzung erlaubt)
Speicher-Anforderung	Vollmodell (BF16): mind. 8× 80 GB GPUs empfohlen (z. B. 8× H800/H100); mit 4-Bit-Quantisierung ca. 136 GB VRAM (Multi-GPU erforderlich)