

V4-Pro
#28 in Frontier-Sprachmodelledeepseek · v4 · seit 24. April 2026 (Preview) · 27× · zuletzt 30. Juni 2026
DeepSeek V4-Pro ist das Flaggschiff-Sprachmodell der DeepSeek-V4-Reihe (Preview-Release), ein Mixture-of-Experts-Modell mit 1,6 Billionen Gesamtparametern und 49 Milliarden aktiven Parametern pro Token. Es unterstützt ein Kontextfenster von 1 Million Token und ist unter der MIT-Lizenz als Open-Weight-Modell auf Hugging Face verfügbar. Das Modell nutzt eine neue Hybrid-Attention-Architektur (Compressed Sparse Attention + Heavily Compressed Attention), die bei 1M-Token-Kontext nur 27 % der Inferenz-FLOPs und 10 % des KV-Caches von DeepSeek-V3.2 benötigt. Drei konfigurierbare Reasoning-Modi (Non-Think, Think High, Think Max/Max) erlauben das Abwägen zwischen Latenz und Analysetiefe.
Features
| Key-Benchmark (%) | SWE-bench Verified: 80,6 % | LiveCodeBench: 93,5 % | GPQA Diamond: 90,1 % | Codeforces: 3206 Rating (jeweils V4-Pro-Max, vendor-reported) |
| Kontextfenster (Token) | 1.048.576 Token (1M); max. Output: 384.000 Token |
| Lizenz | MIT License (Open Weight) |
| Multimodalität | Nur Text (kein Bild-Input im aktuellen Preview-Release) |
| Plattform | DeepSeek API (deepseek-v4-pro), chat.deepseek.com (Expert Mode), Open Weights auf Hugging Face (deepseek-ai/DeepSeek-V4-Pro); kompatibel mit OpenAI ChatCompletions & Anthropic API |
| Preis pro 1M Token | Input (cache miss): $0,435 | Input (cache hit): $0,003625 | Output: $0,87 (nach permanenter 75%-Rabattierung; Listenpreis: $1,74/$3,48) |
| Release-Datum | 24. April 2026 (Preview-Release) |