

Qwen 3 Coder 30B
#25 in Open-Source-Sprachmodellealibaba · v3 · coder 30b · seit 2025-07-31 · 3× · zuletzt 02. Juli 2026
26
Momentum
Qwen 3 Coder 30B ist ein spezialisiertes Code-Modell von Alibaba. Laut den Auszügen fungiert es als dedizierter Code-Spezialist mit einem Preis von $0,35 pro Million Token.
Momentum-Verlauf
04.04.03.07.
Features
| Inferenz-Geschwindigkeit | Ca. 101,8 Tokens/Sek. (Alibaba-API, gemessen von Artificial Analysis; Median vergleichbarer Modelle: 98,3 t/s); TTFT: 2,73 s (Alibaba-API) |
| Kontextfenster | 262.144 Tokens nativ (laut offiziellem Hugging-Face-Modell-Card); erweiterbar auf bis zu 1 Mio. Tokens via YaRN |
| Modellgröße (Parameter) | 30,5 Mrd. Gesamtparameter (MoE); davon 3,3 Mrd. aktiv pro Inferenz-Forward-Pass (128 Experten, 8 aktiv) |
| Speicher-Anforderung | Ca. 21,9 GB VRAM bei Q4_K_M-Quantisierung (empfohlen: ≥26 GB VRAM); ca. 67 GB VRAM bei FP16-Volldichte; min. 18,6 GB RAM für GGUF Q4_K_M |