

DeepSeek-V3.1
#186 in Frontier-Sprachmodelledeepseek · v3.1 · seit 2025-08-21 · 11× · zuletzt 30. Juni 2026
DeepSeek-V3.1 ist ein hybrides Frontier-Sprachmodell von DeepSeek mit 671 Milliarden Gesamtparametern (37B aktiv pro Token, MoE-Architektur), das im August 2025 veröffentlicht wurde. Es ist das erste DeepSeek-Modell, das „Thinking"- und „Non-Thinking"-Modus in einem einzigen Checkpoint vereint und damit Eigenschaften eines Chat- und eines Reasoning-Modells kombiniert. Das Modell wurde auf einem erweiterten Langkontext-Training bis zu 128K Token aufgebaut und auf Tool-Use sowie agentische Workflows optimiert. Es ist unter der MIT-Lizenz als Open-Weight-Modell verfügbar und wird zusätzlich über die DeepSeek-API sowie Drittanbieter bereitgestellt.
Features
| Kontextfenster (Token) | 128K Token (nativer Kontext via zwei-phasigem Long-Context-Training: 630B Token für 32K-Phase, 209B Token für 128K-Phase); auf OpenRouter als 163.840 Token verfügbar |
| Lizenz | MIT License (Open-Weight, kommerzielle Nutzung erlaubt, Self-Hosting möglich) |
| Multimodalität | Nur Text (kein natives Bild-, Audio- oder Video-Input); unterstützt strukturierten JSON-Output, Function/Tool Calling, Code- und Search-Agents |
| Preis | Kostenlos nutzbar über chat.deepseek.com (Web-App); API: Pay-per-Token ab $0,21/1M Input-Token (je nach Anbieter); Open-Weight-Download kostenlos (Self-Hosting) |
| Preis pro 1M Token | Ab $0,21 / 1M Input-Token, $0,79 / 1M Output-Token (via OpenRouter/DeepInfra); DeepSeek direkt (Stand März 2026): $0,27 Input / $1,10 Output pro 1M Token |
| Release-Datum | 21. August 2025 |