

Deepgram
#6 in Transkription (STT)deepgram · seit 2025-02-12 · 11× · zuletzt 30. Juni 2026
22
Momentum
Deepgram ist eine kommerzielle Voice-AI-Plattform, deren Kernangebot eine Speech-to-Text-API (STT) darstellt. Das aktuell führende Modell Nova-3 wurde im Februar 2025 eingeführt und unterstützt über 45 Sprachen für Batch- und Echtzeit-Streaming-Transkription. Daneben bietet Deepgram die Modelle „Flux" (konversationelles STT mit Turn-Detection), Text-to-Speech (Aura-2) sowie eine Voice-Agent-API. Deployment erfolgt als Cloud-API oder Self-Hosted (On-Premises). Voice-Cloning ist kein angebotenes Feature.
Momentum-Verlauf
04.04.03.07.
Features
| Latenz | Transkript in unter 300 ms (P50-Median laut Anbieter). Deepgram gibt <300 ms als Zielwert für Streaming-STT an. |
| Lizenz | Proprietär/kommerziell (SaaS). Self-Hosted-Option für Enterprise erfordert separaten API-Key und Distribution Credentials. |
| Plattform | Cloud-API (REST + WebSocket) sowie Self-Hosted (On-Premises via Container-Images). SDKs für JavaScript, Python, .NET, Go, Java. |
| Release-Datum | Nova-3 (aktuelles Flagship-Modell): 12. Februar 2025 |