

MAI-Image-2
#13 in KI-Bildbearbeitungmicrosoft · v2 · seit 19. März 2026 · 17× · zuletzt 30. Juni 2026
25
Momentum
MAI-Image-2 ist Microsofts zweite Generation eines eigenentwickelten Text-zu-Bild-Modells, basierend auf einer Flow-Matching-Diffusionsarchitektur mit 10–50 Milliarden Nicht-Embedding-Parametern. Das Modell ist auf Fotorealismus, zuverlässiges Text-Rendering in Bildern und komplexe kreative Workflows ausgerichtet. Es wurde am 19. März 2026 im MAI Playground und in Microsoft Foundry veröffentlicht und debütierte als Top-3-Modellfamilie auf dem Arena.ai-Leaderboard. API-Zugang ist über Microsoft Foundry verfügbar; das Modell wird außerdem in Copilot, Bing Image Creator und PowerPoint eingesetzt.
Momentum-Verlauf
04.04.03.07.
Features
| Fine-tuning | Nicht für MAI-Image-2 dokumentiert/verfügbar; Weight-Tuning erstmals für MAI-Image-2.5 angekündigt (Build 2026) |
| Generierungszeit | 2–4 Sek. (typisch, Foundry API, P50); MAI-Image-2-Efficient: ~13,7 Sek. P50-Median laut offiz. Benchmark |
| Lizenz | Produktspezifische Nutzungsbedingungen je Plattform (MAI Playground Terms, Foundry Public Preview Terms) – keine Open-Source-Lizenz |
| Max-Auflösung | 1024 × 1024 px (max.); auch 1365×768 (Landscape) und 768×1365 (Portrait) verfügbar |
| Plattform | Microsoft Foundry (API), MAI Playground, Copilot, Bing Image Creator, PowerPoint |
| Preis | $5 / 1M Text-Input-Token; $33 / 1M Image-Output-Token (Foundry API) |
| Release-Datum | 19. März 2026 (MAI Playground & Foundry Public Preview) |