Synthszr Charts — die großen AI-Marken im Wettkampf ums Podium
synthszr charts

LLaDA

#38 in Open-Source-Sprachmodelle

unknown · seit 2025-02-14 · 2× · zuletzt 30. Juni 2026

13
Momentum

LLaDA ist ein Sprachmodell, das auf diffusionsbasierten Methoden zur Textgenerierung basiert. Das Besondere an LLaDA ist, dass es demonstriert hat, dass diffusionsbasierte Ansätze in große Sprachmodelle skaliert werden können.

Momentum-Verlauf
04.04.03.07.

Features

Benchmark-Score (MMLU/ähnlich)MMLU 5-shot: 65,9 (LLaDA 8B Base) — übertrifft LLaMA3 8B Base (65,4) bei gleichen Trainings-Tokens (2,3T); GSM8K: 70,7; Math: 27,3; HumanEval: 33,5
KontextfensterNativ bis 8.192 Tokens (8k); LongBench-Tests zeigen, dass 8k das unterstützte Kontextfenster ist – bei 4k und 8k evaluiert, darüber hinaus gehende Inhalte werden abgeschnitten
Modellgröße (Parameter)8 Milliarden Parameter (8B), trainiert von Grund auf (from scratch)
Preis-TierKostenlos / Open Source (Apache-2.0-lizenziert, Gewichte auf HuggingFace unter GSAI-ML/LLaDA-8B-Base und GSAI-ML/LLaDA-8B-Instruct öffentlich verfügbar)

Belege (2)

Weitere Produkte in dieser Kategorie: Open-Source-Sprachmodelle

Subscribe free. Unsubscribe the second it sucks.

High-signal news across AI, business, UX, and tech. Every morning.