Synthszr Charts — die großen AI-Marken im Wettkampf ums Podium

Qwen2.5-VL-7B

#34 in Multimodale Modelle

alibaba · v2.5 · vl 7b · seit 2025-01-28 · 2× · zuletzt 29. Juni 2026

Momentum

Qwen2.5-VL-7B ist ein Sprachmodell von Alibaba mit Vision-Language-Fähigkeiten. Es wird für die Verarbeitung von Bildfolgen eingesetzt und kann durch optimierte Encoding-Strategien seinen Token-Verbrauch erheblich reduzieren.

Momentum-Verlauf

04.04.03.07.

Features

Preis pro Unit	Open-Source (Gewichte kostenlos via Hugging Face / ModelScope); API via OpenRouter: $0,20/Mio. Input-Token, $0,20/Mio. Output-Token (Listenpreis Stand 2025, Drittanbieter)
Vision-Language Benchmark-Score	DocVQA: 95,7 % \| ChartQA: 87,3 % \| OCRBench: 86,4 % \| Android Control Low_EM: 91,4 % (Quelle: llm-stats.com); übertrifft laut offiziellem Blog GPT-4o-mini in mehreren Aufgaben

Belege (2)

Weitere Produkte in dieser Kategorie: Multimodale Modelle

Gemini 3.5100
GPT-4o96
Gemini Omni Flash93
Gemini 3.192
Gemini Spark90
Gemini Omni88
Gemini 373
Gemini 2.571
ChatGPT-Images-2.056
Miso One33
Apple Foundation Models32
Brain2Qwerty28

Features

Belege (2)

Weitere Produkte in dieser Kategorie: Multimodale Modelle

Subscribe free. Unsubscribe the second it sucks.