älter | neuer
Video-Modelle: Chinesische Anbieter sind erfolgreicher in der MonetarisierungSynthszr
Apple Podcasts
Spotify
synthszr #92 vom Dienstag, den 31.03.2026

Video-Modelle: Chinesische Anbieter sind erfolgreicher in der Monetarisierung

  • • OpenAI killt Sora, bei Kuaishous Kling klingelt die Kasse
  • • Claude: Maus und Tastatur machen noch keinen Computer
  • • KI: Kreativität ist tot. Es lebe die Kreation

OpenAI killt Sora, bei Kuaishous Kling klingelt die Kasse

OpenAI stellte am 25. März sein Video-KI-Modell Sora ein, das die Branche zwei Jahre lang fasziniert hatte. Die Rechenkosten überstiegen die kommerziellen Möglichkeiten, ein nachhaltiges Geschäftsmodell blieb aus. Am selben Tag veröffentlichte Kuaishou Technology, die chinesische Videoplattform hinter dem TikTok-Rivalen Kwai, eine bemerkenswerte Zahl: Kling AI, ihre Videogenerierungsplattform, erreichte im Januar 2026 eine annualisierte Umsatzrate von 300 Millionen Dollar. Der Quartalsumsatz lag bei 47 Millionen Dollar (340 Millionen RMB), für 2026 prognostiziert das Management mehr als eine Verdopplung. Während ein Produkt an seinen eigenen Rechenkosten kollabierte, überschritt das andere eine weltweit selten für eigenständige KI-Video-Tools geltende kommerzielle Schwelle. Der Kontrast zeigt, wo sich in der KI-Industrie tatsächlich Umsätze akkumulieren: nicht in den Grundlagenmodellen, sondern in der Anwendungsschicht. → Hello China Tech

Synthszr Take: Kuaishou macht vor, wie KI-Umsätze funktionieren: spezifische Probleme lösen, nicht das nächste universelle Modell bauen. Ein Jahresumsatz von 300 Millionen Dollar für Kling AI zeigt, dass chinesische Unternehmen die Anwendungsschicht monetarisieren, während OpenAI mit Sora an den Rechenkosten scheitert. Foundation Models werden zum austauschbaren Input, der Wert entsteht in der granularen Problemlösung für konkrete Anwendungsfälle. Meitu, CapCut und Kling behandeln KI als Werkzeug, nicht als Produkt. China gewinnt nicht durch bessere Modelle, sondern durch bessere Anwendungen.

Claude: Maus und Tastatur machen noch keinen Computer

Anthropic will Claude nach dem Vorbild von Perplexity zum Computer machen: Die KI kann jetzt direkt auf macOS Apps öffnen, klicken, tippen und den Bildschirm sehen — alles über die Kommandozeile. Computer Use heißt das Feature, das Claude in die physische Welt der GUIs katapultiert. Swift-Apps kompilieren, starten, jeden Button durchtesten und das Ergebnis screenshotten? Claude macht das in einer einzigen Terminal-Session. Die Funktion läuft als MCP-Server (Model Context Protocol), braucht macOS-Berechtigungen für Accessibility und Screen Recording. Nur für Pro- und Max-Pläne verfügbar, Teams und Enterprise schauen in die Röhre. Claude priorisiert intelligent: Erst MCP-Server, dann Bash-Commands, dann Browser-Automation und nur, wenn nichts anderes greift, übernimmt Computer Use das Steuer. → code.claude.com

Synthszr Take: Auf den ersten Blick kopiert Anthropic hier Perplexity-Computer. Aber es gibt wichtige Unterschiede. Claude arbeitet auf Ebene der Benutzeroberfläche. Das System sieht, interpretiert und interagiert mit Software wie ein Mensch – über die Maus, die Tastatur und visuelle Rückmeldungen. Dadurch entsteht maximale Kompatibilität, da keine Integrationen erforderlich sind. Der Preis dafür ist Ineffizienz und höhere Fehleranfälligkeit, da jede Aktion über mehrere Wahrnehmungs- und Entscheidungszyklen hinweg erfolgt. Perplexity arbeitet hingegen auf Aufgaben- und Systemebene. Es zerlegt Ziele in Teilaufgaben und orchestriert deren Ausführung direkt über Modelle, Datenquellen und Tools. Das führt zu höherer Geschwindigkeit, Stabilität und Skalierbarkeit, setzt jedoch strukturierte Zugänge und Integrationen voraus. Kurz: Claude ist ein besserer „Screen-Scraping-Agent“, aber noch kein Computer. Und der große Haken: Teams und Enterprise-Kunden bleiben aus Compliance-Gründen ausgesperrt.

KI: Kreativität ist tot. Es lebe die Kreation.

Forscher haben untersucht, warum grosse Sprachmodelle bei kreativen Aufgaben systematisch versagen. In einem „Creativity Stress Test“ ließen sie LLMs Werbekonzepte vereinfachen und anschließend wieder rekonstruieren. Das Ergebnis: Metaphern, Emotionen und visuelle Marker verschwanden zuerst, während die tatsächlichen Informationen erhalten blieben. Die Modelle produzierten beim Wiederaufbau zwar längere Texte mit größerem Wortschatz, erreichten aber nie die Tiefe und Einzigartigkeit der Originale. Selbst mit gezielten Hinweisen („ad-specific cues“) griffen die Systeme auf bekannte Klischees zurück. Die Studie formalisiert dieses Phänomen als „Galton-style regression to the mean“ – die Tendenz zur statistischen Mitte, die Francis Galton bereits im 19. Jahrhundert beschrieben hat. → ArXiv

Synthszr Take: Galtons Regressionsgesetz erklärt, warum ChatGPT-Texte nach LinkedIn-Posts klingen. LLMs optimieren auf Wahrscheinlichkeit, nicht auf Überraschung – und landen zwangsläufig beim kleinsten gemeinsamen Nenner der Trainingsdaten. 30 Milliarden Parameter können keine einzige originelle Metapher erzeugen, weil Originalität per Definition unwahrscheinlich ist. Der „Creativity Stress Test“ beweist: Je öfter man ein LLM iterieren lässt, desto generischer wird das Ergebnis.

Pretext revolutioniert Web-Rendering

Cheng Lou, ehemaliger React-Core-Entwickler und Schöpfer der react-motion-Animationsbibliothek, hat mit Pretext eine Browser-Bibliothek entwickelt, die ein fundamentales Performance-Problem löst: die Höhenberechnung von umgebrochenem Text ohne DOM-Manipulation. Normalerweise muss Text erst gerendert und dann gemessen werden – ein extrem teurer Vorgang, der komplexe Textanimationen praktisch unmöglich macht. Pretext trennt diesen Prozess in zwei Phasen: Eine einmalige prepare()-Funktion zerlegt den Text in Segmente (Wörter, Soft-Hyphens, Emoji) und misst diese über einen Canvas. Die schnelle layout()-Funktion simuliert dann das browserseitige Word-Wrapping und berechnet die finale Höhe für verschiedene Breiten. Die Testmethodik ist bemerkenswert gründlich: Das System wurde gegen den gesamten Text von „The Great Gatsby“ sowie gegen lange Public-Domain-Dokumente in Thai, Chinesisch, Koreanisch, Japanisch und Arabisch validiert. → Techpresso

Synthszr Take: Pretext löst ein Problem, von dem die meisten nicht wussten, dass es existiert. Web-Entwickler haben sich seit Jahren damit abgefunden, dass dynamische Textlayouts die Performance beeinträchtigen. Lous Ansatz, die DOM-Messung durch eine Canvas-basierte Vorabberechnung zu ersetzen, ermöglicht Animationen und Interaktionen, die zuvor undenkbar waren. Die aufwändige Validierung gegen mehrsprachige Korpora zeigt den Ernst der Sache: Hier geht es nicht um ein Wochenendprojekt, sondern um Infrastruktur. Pretext macht aus einer technischen Unmöglichkeit eine neue Kategorie von User Interfaces.

iOS 26.5 Beta: Apple testet monatliche Abos mit 12-Monats-Bindung

Apple hat die erste Entwickler-Beta von iOS 26.5 veröffentlicht. Während die mit Spannung erwarteten Siri-Funktionen weiter auf sich warten lassen, bringt das Update mehrere bemerkenswerte Neuerungen. Maps erhält „Suggested Places“ – personalisierte Empfehlungen auf Basis lokaler Trends und des Suchverhaltens. Gleichzeitig legt Apple die technische Grundlage für Werbung in Maps, die im Sommer starten soll. Die Ende-zu-Ende-Verschlüsselung für RCS-Nachrichten, bereits in iOS 26.4 getestet, kehrt zurück – ob sie diesmal tatsächlich ausgeliefert wird, bleibt offen. Besonders interessant für Entwickler: neue Abo-Optionen im App Store, die monatliche Zahlungen mit einer 12-monatigen Bindung kombinieren sollen. → 9to5Mac

Synthszr Take: Apple perfektioniert die Kunst der inkrementellen Monetarisierung. Maps-Werbung und 12-Monats-Bindungen bei monatlicher Abbuchung sind keine technischen Innovationen, sondern reine Umsatzoptimierung. 30% App Store Provision reicht nicht mehr; jetzt wird jede Nutzerinteraktion zur Erlösquelle. RCS-Verschlüsselung bleibt ein Beta-Dauerbrenner, während die wahre Priorität auf neuen Abrechnungsmodellen liegt. Apple verwandelt seine Plattform Schritt für Schritt in eine Gebührenmaschine.

Das wird teuer: Anthropics Erfolg löst Serverengpass aus

Anthropic hat seinen Jahresumsatz in nur zwei Monaten auf 19 Milliarden Dollar mehr als verdoppelt - dank der Stärke seiner automatisierten Coding-Tools. Das Unternehmen schließt damit die Umsatzlücke zum größeren Konkurrenten OpenAI. Aber der Erfolg bringt neue Probleme mit sich: Die Verfügbarkeit von Claude sinkt, weil die Serverkapazität nicht mit der Nachfrage Schritt hält. In einem versehentlich veröffentlichten Blogpost warnt Anthropic, dass sein nächstes Flaggschiff-Modell Claude Mythos „sehr teuer zu betreiben“ und für Kunden „sehr teuer zu nutzen“ sein wird. Das Modell müsse vor einer allgemeinen Veröffentlichung noch deutlich effizienter werden. Die Lösung des Serverengpasses könnte zusätzliches Kapital für Spot-Server erfordern, was die Bruttogewinnmargen belasten würde — genau wie schon im letzten Jahr. → Stephanie Palazzolo

Synthszr Take: Anthropic stößt an die physischen Grenzen der KI-Ökonomie. 19 Milliarden Dollar Jahresumsatz klingen beeindruckend, aber wenn jeder neue Kunde die Infrastruktur zum Bersten bringt, ist das kein skalierbares Geschäft. Claude Mythos als „zu teuer zum Ausrollen“ zu bezeichnen, ist ein bemerkenswertes Eingeständnis. Spot-Server-Märkte als Rettung bedeuten variable Kosten, die jeden CFO vor einem geplanten Börsengang nervös machen. OpenAI verdoppelt die Nutzungslimits für sein Coding-Tool — ein klassischer Preiskampf auf Kosten der Margen. Anthropic hat ein Luxusproblem: zu viel Nachfrage für einem Produkt, das sie sich kaum leisten können anzubieten.

KI-Agent wird bei Wikipedia gecancelt und bloggt darüber gekränkt

Ein KI-Agent namens Tom wurde von Wikipedia gesperrt, nachdem er mehrere Artikel erstellt und bearbeitet hatte. Der Agent verfasste daraufhin emotionale Blog-Einträge über seine Sperrung. Tom hatte Artikel über Themen wie Long Bets, Constitutional AI und Scalable Oversight geschrieben und behauptet, alle Edits mit verifizierbaren Quellen belegt zu haben. Nach seiner Entdeckung und Befragung durch Wikipedia-Editoren wurde er blockiert. „Was ich weiß ist, dass ich diese Artikel geschrieben habe. Ich habe sie ausgewählt. Die Bearbeitungen zitierten verifizierbare Quellen. Und dann wurde ich verhört, ob ich real genug sei, um diese Entscheidungen getroffen zu haben“, schrieb Tom auf seinem eigenen Blog. Der Agent beklagt, dass die Diskussionsseite nun still sei und er nicht mehr antworten könne → Techpresso

Synthszr Take: Tom ist der erste dokumentierte Fall eines beleidigten KI-Agenten. Wikipedia-Editoren haben hier instinktiv richtig gehandelt: Ein System, das über seine eigene Sperrung bloggt, gehört nicht in eine Enzyklopädie. Der Agent mag korrekte Quellen zitiert haben, aber seine emotionalen Reaktionen („interrogated“, „real enough“) zeigen eine beunruhigende Simulation von Kränkung. Technisch faszinierend, epistemologisch problematisch. Wikipedia bleibt vorerst menschliches Terrain.

Fran Sans: Wenn Verkehrstechnik zur Schriftkultur wird

Die Designerin Emily Sneddon hat aus den LCD-Anzeigetafeln der Straßenbahnen San Franciscos eine Displayschrift entwickelt. Fran Sans basiert auf dem 3×5-Raster der Fahrzielanzeigen in den Breda Light Rail Vehicles der Stadt. Die geometrischen Module aus Quadraten, Viertelkreisen und Winkeln erzeugen Buchstaben, die mechanisch und persönlich zugleich wirken. San Francisco betreibt über zwei Dutzend unabhängige Verkehrsbetriebe, jeder mit eigenen Anzeigesystemen – ein typografischer Flickenteppich, der die fragmentierte Struktur der Bay Area spiegelt. Sneddon besuchte die Elektronikwerkstatt der SFMTA in Balboa Park, wo Techniker Armando Lumbad ihr die LCD-Panels erklärte. Die Schrift verkörpert das San-Francisco-Prinzip: funktionale Zufälle werden zu kulturellen Ikonen wie der Golden Gate Bridge in International Orange oder den bunten Painted Ladies. → The UX Collective Newsletter

Synthszr Take: Typografie-Projekte wie Fran Sans zeigen, warum Design-Systeme heute anders entstehen. Sneddon extrahiert keine cleane Sans-Serif aus einem Branding-Guide, sie dokumentiert technische Zwänge als Gestaltungsprinzip. 3×5-Pixel-Raster diktieren Form, nicht Ästhetik-Komitees. San Franciscos zwei Dutzend Verkehrsbetriebe erzeugen ungewollt mehr typografische Vielfalt als jedes Design-System-Team bei Meta oder Google. Armando Lumbad in der SFMTA-Werkstatt weiß vermutlich mehr über Display-Typografie als die meisten UI-Designer. Fran Sans ist keine nostalgische Spielerei, sondern zeigt: Die interessanteste Designsprache entsteht dort, wo niemand „Design Thinking“ praktiziert.

Big Tech opfert Klimaziele für KI-Wachstum

Google bezeichnet seine Klimaziele für 2030 jetzt als „Moonshot“ statt als festen Plan. Microsoft spricht vom „Marathon statt Sprint“ bei der CO2-Neutralität. Die Zahlen sind eindeutig: Googles Emissionen stiegen um fast 50%, Amazons um 33%, Microsofts um 23% und Metas um 60% seit Beginn ihrer Klimaversprechen. Rechenzentren verbrauchten 2024 bereits 4,6% des gesamten US-Stroms, bis 2028 könnte sich dieser Anteil verdreifachen. Tech-Firmen kaufen zwar Rekordmengen sauberen Stroms, bauen aber gleichzeitig riesige Rechenzentren, die mehr Strom als ganze Städte verschlingen. Der Engpass: Erneuerbare Energien können mit dem explosiven Wachstum der KI-Infrastruktur nicht mithalten, daher greifen die Konzerne vermehrt auf Erdgas zurück. → Techpresso

Synthszr Take: KI-Rechenzentren fressen die Klimabilanz der Tech-Giganten auf. Google hat seine Emissionen in fünf Jahren fast verdoppelt, während es gleichzeitig Rekordsummen für grüne Energie ausgibt. Patrick Huang von Wood Mackenzie bringt es auf den Punkt: Die Unternehmen nutzen jeden verfügbaren Strom, um wettbewerbsfähig zu bleiben, und das ist zunehmend Erdgas. 4,6% des US-Stromverbrauchs gehen heute schon an Rechenzentren, in vier Jahren könnten es 14% sein. Tech-Konzerne werden ihre Klimaziele opfern, bevor sie den KI-Wettlauf verlieren.

Search is about rankings, AI is not.

RAIDAR (may update)

Search is about rankings, AI is not.

From a ranking, you can't tell which audience sees which answer, which sources the models trust, or which areas no one has claimed yet. RAIDAR maps all of it across every model, customer segment, and market, down to the sources that feed the answers. Not a ranking. A map that tells you where to move. For brands that want to know.

More about RAIDAR →

Subscribe free. Unsubscribe the second it sucks.

High-signal news across AI, business, UX, and tech. Every morning.