

DeepSeek V3.2
#17 in Open-Source-Sprachmodelledeepseek · v3.2 · seit 2025-12-01 · 30× · zuletzt 30. Juni 2026
DeepSeek-V3.2 ist ein Open-Weight-Sprachmodell auf Basis einer Mixture-of-Experts-Architektur (MoE) mit 685 Milliarden Gesamtparametern, von denen je Token nur 37 Milliarden aktiviert werden. Das Modell führt DeepSeek Sparse Attention (DSA) als neuen Aufmerksamkeitsmechanismus ein, der den Rechenaufwand bei langen Kontexten deutlich reduziert. Es wurde am 1. Dezember 2025 veröffentlicht, unterstützt integriertes „Thinking"-Reasoning direkt im Tool-Use-Modus und steht unter der MIT-Lizenz zur kommerziellen Nutzung bereit. Im Vergleich zu Vorgängermodellen schließt es die Lücke zwischen Open-Source- und geschlossenen Frontier-Modellen erheblich.
Features
| Kontextfenster (Token) | 163.840 Token (max. Kontextlänge; laut offiziellem Tech-Report: 128K native, erweitert auf ~163K) |
| Lizenz | MIT License (Modellgewichte und Code) |
| Multimodalität | Nur Text (kein natives Bild-/Audio-/Video-Input); dediziertes multimodales Modell ist DeepSeek-VL2 (separates Produkt) |
| Plattform | DeepSeek Web, App, API (deepseek-chat); Modellgewichte auf Hugging Face & GitHub; unterstützte Inference-Frameworks: SGLang, vLLM (Day-0-Support); auch auf Microsoft Azure Foundry verfügbar |
| Preis | Kostenlos nutzbar über DeepSeek Web & App; API: ab $0,028/1M Input-Token (Cache Hit) bis $0,28/1M Input-Token (Cache Miss), $0,42/1M Output-Token |
| Preis pro 1M Token | $0,28 / 1M Input-Token (Cache Miss); $0,028 / 1M Input-Token (Cache Hit, 90 % Rabatt); $0,42 / 1M Output-Token – via DeepSeek Official API |
| Release-Datum | 1. Dezember 2025 |