

SubQ
#2 in LLM-Inferenz & Servingsubquadratic · seit 2026-05-05 · 16× · zuletzt 30. Juni 2026
SubQ ist das erste kommerzielle LLM des Miami-Startups Subquadratic, das auf einer vollständig sub-quadratischen Sparse-Attention-Architektur (SSA, "Subquadratic Selective Attention") basiert und dadurch Rechenkosten linear statt quadratisch mit der Kontextlänge skaliert. Das Modell wurde am 5. Mai 2026 vorgestellt und bietet ein Kontextfenster von bis zu 12 Millionen Token in der Forschungsversion, während die produktiv über die API verfügbare Version ("SubQ 1M-Preview") aktuell auf 1 Million Token begrenzt ist. Subquadratic bietet SubQ über eine OpenAI-kompatible REST-API, einen CLI-Coding-Agenten (SubQ Code) sowie ein kostenloses Recherche-Tool (SubQ Search) an; alle Produkte befanden sich zum Start in privater Beta mit Warteliste. Konkrete, offiziell bestätigte Preisangaben pro Token l
Features
| Protokoll-Kompatibilität | OpenAI-kompatible API-Endpunkte (HTTP). Drop-in-Replacement für bestehende OpenAI/Anthropic-Client-Bibliotheken ohne SDK-Änderungen. Unterstützt Streaming und Tool Use. |
| Release-Datum | 5. Mai 2026 (Launch aus Stealth, private Beta via subq.ai) |