Synthszr Charts — die großen AI-Marken im Wettkampf ums Podium
synthszr charts
deepseek

DeepSeek-V2

#54 in Open-Source-Sprachmodelle

deepseek · v2 · seit Mai 2024 · 2× · zuletzt 30. Juni 2026

7
Momentum

DeepSeek-V2 ist ein Sprachmodell von DeepSeek. Das Produkt wurde im Mai 2024 entwickelt.

Momentum-Verlauf
04.04.03.07.

Features

Benchmark-Score (MMLU/ähnlich)MMLU (5-shot): 78,5 % (DeepSeek-V2 Base); Chat-Variante: 78,1 % MMLU laut DeepSeek-Coder-V2-Paper
Inferenz-GeschwindigkeitGenerierungs-Throughput >50.000 Tokens/s (auf 1 Node mit 8× H800 GPUs, FP8-Präzision); Prompt-Input-Throughput >100.000 Tokens/s; entspricht 5,76× dem Durchsatz von DeepSeek 67B
Kontextfenster128.000 Tokens
Modellgröße (Parameter)236B Gesamt-Parameter (MoE); 21B aktivierte Parameter pro Token
Preis-TierAPI (zum Zeitpunkt des Releases): ca. $0,14/M Input-Tokens und $0,28/M Output-Tokens; Open-Weights-Modell kostenlos verfügbar (DeepSeek License Agreement, kommerzielle Nutzung erlaubt)
Speicher-AnforderungVollmodell (BF16): mind. 8× 80 GB GPUs empfohlen (z. B. 8× H800/H100); mit 4-Bit-Quantisierung ca. 136 GB VRAM (Multi-GPU erforderlich)

Belege (2)

Weitere Produkte in dieser Kategorie: Open-Source-Sprachmodelle

Subscribe free. Unsubscribe the second it sucks.

High-signal news across AI, business, UX, and tech. Every morning.