älter | neuer
Chinesische Modelle: Claude-Niveau zum Bruchteil des PreisesSynthszr
Apple Podcasts
Spotify
synthszr #86 du mercredi 25 mars 2026

Chinesische Modelle: Claude-Niveau zum Bruchteil des Preises

  • • MiniMax M2.7 liefert preiswertes Sprachmodell nahe Claude Opus-Niveau
  • • DarkSword-Tool auf GitHub macht iPhone-Hacking zum Kinderspiel
  • • LiteLLM fällt auf manipulierte Sicherheits-Pipeline herein

MiniMax M2.7 erreicht Claude-Opus-Niveau zum Bruchteil des Preises

MiniMax hat mit seinem M2.7-Modell am 18. März ein Sprachmodell veröffentlicht, das im SWE-Pro-Benchmark 56,22% erreicht und damit nahe an Claude Opus 4.6 herankommt. Der entscheidende Unterschied liegt im Preis: MiniMax M2.7 kostet 0,30 Dollar pro Million Input-Token und 1,20 Dollar pro Million Output-Token, während Claude Opus 4.6 mit 5 Dollar (Input) und 25 Dollar (Output) zu Buche schlägt. Das entspricht einem Preisunterschied von Faktor 17 beim Input und von Faktor 21 beim Output. Kilo Code hat beide Modelle in drei praktischen Programmieraufgaben gegeneinander antreten lassen, um zu prüfen, ob sich die Benchmark-Zahlen in der Praxis bestätigen. Die Tests sollten zeigen, ob das deutlich günstigere MiniMax-Modell tatsächlich eine vergleichbare Performance liefert. → TLDR AI

Synthszr Take: MiniMax attackiert Anthropics Preismodell frontal. Ein 21-facher Preisunterschied bei vergleichbarer Performance macht Claude Opus 4.6 zum Luxusprodukt für Unternehmen, die sich keine Fehler leisten können. Kilo Code testet genau die richtige Frage: Reicht „gut genug“ für 95% der Anwendungsfälle? Enterprise-Kunden zahlen bei Anthropic für die Marke und den Support, nicht für marginale Performanceunterschiede. MiniMax könnte der Katalysator sein, der die Preise im gesamten LLM-Markt nach unten drückt.

iPhone-Exploit als GitHub-Repo: The Dark Knight Returns

Ein fortgeschrittenes iPhone-Hacking-Tool namens DarkSword wurde letzte Woche auf GitHub veröffentlicht und macht damit Angriffe auf Millionen von iPhones trivial. Die geleakten Dateien bestehen aus simplem HTML und JavaScript, die jeder ohne iOS-Expertise innerhalb von Minuten auf einem Server hosten kann. Sicherheitsforscher warnen, dass alle iPhones und iPads betroffen sind, die noch nicht auf iOS 26 aktualisiert wurden – nach Apple-Daten sind das mehrere hundert Millionen aktiv genutzte Geräte. Matthias Frielingsdorf von der Sicherheitsfirma iVerify bestätigte, dass die Exploits „out of the box“ funktionieren und bereits erste erfolgreiche Tests an einem iPad mini mit iOS 18 durchgeführt wurden. Google-Forscher teilen diese Einschätzung: Die Werkzeuge lassen sich ohne Modifikation sofort einsetzen. → Casey Newton

Synthszr Take: GitHub hostet gerade das gefährlichste iPhone-Angriffswerkzeug seit Jahren. DarkSword demokratisiert staatliche Überwachungstechnologie auf brutalste Weise: Copy-Paste statt eines Millionenbudgets. Apple hat ein Timing-Problem – die iOS-26-Adoption liegt bei geschätzten 60%, während 40% der Nutzer jetzt zur Zielscheibe werden. Sicherheitsforscher spielen Feuerwehr, während Kriminelle bereits ihre Server hochfahren. Apples Albtraum: Ein Exploit, der so einfach ist, dass ihn jeder Script-Kiddie bedienen kann.

LiteLLM fällt auf manipulierte Sicherheits-Pipeline herein

LiteLLM, eine Open-Source-Schnittstelle für den Zugriff auf mehrere große Sprachmodelle, musste zwei Versionen vom Python Package Index entfernen. Die Versionen v1.82.7 und v1.82.8 enthielten schädlichen Code, der Zugangsdaten stiehlt — von API-Keys über Crypto-Wallets bis hin zu Banking-Passwörtern und DB-Zugriffsrechten. Krrish Dholakia, CEO von Berri AI (Maintainer von LiteLLM), bestätigte den Vorfall und identifizierte Trivy als Einfallstor. Trivy ist eigentlich ein Sicherheitsscanner von Aqua Security, der in vielen CI/CD-Pipelines zum Schutz vor Schwachstellen eingesetzt wird. Angreifer (bekannt als TeamPCP) nutzten eine Fehlkonfiguration in Trivys GitHub Actions, um privilegierte Zugangstokens zu stehlen. Am 19. März veröffentlichten sie eine manipulierte Trivy-Version v0.69.4, gefolgt von weiteren kompromittierten Versionen auf DockerHub. → theregister.com

Synthszr Take: Aqua Security hat mit Trivy unfreiwillig die perfekte Trojaner-Infrastruktur aufgebaut. CI/CD-Pipelines vertrauen Sicherheitstools blind – genau das macht sie zum idealen Angriffsvektor. TeamPCP modifizierte bestehende Versionstags, statt neue Releases zu erstellen: Pipelines liefen weiter, ohne dass jemand merkte, dass der Code ausgetauscht wurde. LiteLLM ist nur ein Kollateralschaden; das eigentliche Problem liegt tiefer. Sicherheitstools werden selbst zur Sicherheitslücke, wenn sie in automatisierten Systemen zu viel Macht bekommen. Die Supply-Chain-Attacke zeigt: Vertrauen in Third-Party-Tools ist das neue Single Point of Failure.

Fight Club: KI streitet mit sich selbst zum besseren Code

Entwickler experimentieren zunehmend damit, KI-Codierungsagenten verschiedene Personas annehmen zu lassen, damit diese wie Teams statt wie Einzelprogrammierer arbeiten. Ein typischer Ablauf: Der Entwickler weist seinen KI-Agenten an, zunächst als „Product Manager“ ein Feature-Dokument zu erstellen, dann als „Spec Agent“ technische Spezifikationen auszuarbeiten, anschließend als „Tasks Agent“ konkrete Programmieraufgaben zu definieren, als „Coding Agent“ diese umzusetzen und schließlich als „Review Agent“ das Ergebnis zu prüfen. Elon Musks xAI hat dieses Konzept bereits in Grok 4.20 implementiert, in dem vier KI-Agenten mit unterschiedlichen Persönlichkeiten – eine „logische“ für technische Aufgaben, eine „kreative“ als Gegenpart – gemeinsam Aufgaben lösen. Sowohl Anthropic als auch OpenAI bieten in ihren Coding-Produkten spezialisierte „Subagents“ an. Y Combinator-CEO Garry Tan machte kürzlich Schlagzeilen, als er Anthropic Claude Code die Rollen eines CEOs, eines Engineering Managers, „paranoiden“ Staff Engineers und Debuggers für ein einzelnes Projekt übernehmen ließ. → The Information

Synthszr Take: KI-Agenten simulieren jetzt ganze Entwicklerteams, weil einzelne Modelle an ihre Grenzen stoßen. Grok 4.20 lässt vier verschiedene Agent-Persönlichkeiten miteinander debattieren, Anthropics Claude spielt CEO und paranoider Engineer gleichzeitig. Entwickler haben entdeckt, dass KI besser funktioniert, wenn sie sich selbst widerspricht. Die Ironie: Um menschenähnliche Intelligenz zu erreichen, müssen Maschinen lernen, mit sich selbst zu streiten. Teams schlagen Genies – gilt offenbar auch für künstliche Intelligenz.

Spotify nimmt sein Doppelgängerproblem in Angriff

Spotify führt einen Beta-Schutz für Künstlerprofile ein, um KI-generierte Imitate zu stoppen. Die australische Psychedelic-Rock-Band King Gizzard and the Lizard Wizard hatte Spotify aus Protest verlassen, nachdem der CEO Daniel Ek 600 Millionen Euro in den Militärdrohnen-Hersteller Helsing investiert hatte. Monate später tauchten ihre Tracks wieder auf der Plattform auf – teils als schlechte Imitationen, teils völlig anders klingend, aber immer unter ihrem Namen. Diese Fälschungen sammelten Millionen von Streams und generierten Einnahmen. KI-gestützte Musik-Apps machen es immer einfacher, überzeugende Fälschungen zu erstellen. Spotify entfernte die Impostor-Tracks nach einer Anfrage von Platformer, doch das grundlegende Problem blieb bestehen: Die Plattform schafft starke finanzielle Anreize für dieses Art der Domain-Squatting. → Casey Newton

Synthszr Take: Spotify bekämpft die Symptome, während das eigentliche Problem weiter wächst. KI-Musik-Tools können heute für ein paar Dollar überzeugende Imitate erzeugen – schnell genug, billig genug und gut genug, um auf einer Plattform wie Spotify Reichweite und Geld mitzunehmen. Der neue Beta-Schutz wirkt deshalb eher wie Schadensbegrenzung als eine echte Lösung. Denn das Kernproblem ist nicht nur fehlende Verifikation, sondern ein kaputtes Anreizsystem: Solange sich Fake-Uploads, Namenskapern und Stream-Farming lohnen, wird es immer neue Imitate geben. Dass selbst eine Band, die die Plattform verlassen wollte, am Ende trotzdem wieder unter ihrem eigenen Namen auftaucht, zeigt, wie wenig Kontrolle Künstler über ihre Identität haben, sobald diese einmal in den Plattformlogiken aufgegangen ist. Spotify entfernt einzelne Fälschungen, aber die Maschine, die sie attraktiv macht, läuft weiter.

Googles Gemini-Agent automatisiert Uber- und DoorDash-Bestellungen

Google hat KI-Agenten still und heimlich in die Praxis gebracht. Nutzer mit aktuellen Pixel- oder Samsung-Phones können per Gemini-App bei Uber fahren oder bei DoorDash bestellen. Die Funktion arbeitet zuverlässig, aber langsam: Der Autor brauchte für eine Uber-Bestellung über Gemini länger als direkt in der Uber-App. Nach der KI-gestützten Vorbereitung muss man dennoch in die jeweilige App wechseln, um den finalen Bestellknopf zu drücken. Google nennt das Feature „Task Automations“ und hat es im letzten Monat fast unbemerkt eingeführt. Die Software-Updates erreichen die Nutzer erst seit etwa einer Woche. Das Spektrum bleibt vorerst eng: Essen, Lebensmittel, Fahrten. → Martin Peers

Synthszr Take: Google praktiziert Product Thinking in Reinform. Statt großer Ankündigungen wie OpenAI liefert man funktionierende Agenten-Features in bestehende Apps. Die bewusste Langsamkeit der Implementierung zeigt Strategie: Man testet mit echten Nutzern, sammelt Daten, iteriert. OpenAI hingegen verspricht viel (Instant Checkout) und rudert später zurück. 2026 wird das Jahr, in dem sich zeigt, wer KI-Agenten wirklich in den Alltag bringt. Google hat verstanden: Der Gewinner ist, wer die langweiligen Use Cases zuerst löst.

KI-First-Interfaces verlagern kognitive Last auf die Nutzer

Figma fragt neuerdings: „What do you want to make?“ — vermutlich die stressigste Frage, die man einem Designer stellen kann. Über das letzte Jahr hinweg haben viele Software-Tools ihre Einstiegslogik umgedreht: Statt strukturierter Eingabefelder (Text, Daten, Fotos) beginnen sie mit offenen Fragen. Jahrzehntelang reduzierten SaaS-Produkte Mehrdeutigkeit durch klare Input-Output-Mechanismen. Nutzer lieferten begrenzte Eingaben, das System verarbeitete sie vorhersehbar. Man konnte Zahlen in ein Reporting-Tool eintragen und durch Trial-and-Error einen brauchbaren Graphen für den Steuerberater erstellen. KI-First-Interfaces kehren diese Sequenz um: Software verlangt jetzt, dass Nutzer ihre Absicht artikulieren, bevor die Erkundung beginnt — das Ziel zu beschreiben, bevor die Erkundung überhaupt losgeht. Ein Reporting-Tool fragt heute: „Describe the graph you'd like to create“, und damit verschiebt es die Abstraktionsarbeit auf den Nutzer. → TLDR Design

Synthszr Take: Figma macht den klassischen KI-Designfehler: Sie verwechselt technische Möglichkeiten mit Nutzerbedürfnissen. Designer öffnen Tools nicht mit fertigen Visionen, sondern um diese erst zu entwickeln — „Writing is the process by which you realize that you do not understand what you are talking about.“ KI-Interfaces, die Klarheit voraussetzen, wo keine existiert, scheitern an der Realität kreativer Arbeit. Das Problem liegt nicht in der KI selbst, sondern in der naiven Annahme, man könne sie einfach vorn draufschrauben. Wer die kognitive Last umverteilt, ohne das Interface grundlegend neu zu denken, entwickelt Tools, die Fragen stellen, die niemand beantworten kann. Die meisten KI-Features lösen keine echten Probleme — sie schaffen neue.

KI-generiertes Design wird zur austauschbaren Massenware

Michal Malewicz diagnostiziert das Ende von „Vibe Coding“ – jener Phase, in der Designer mit KI-Tools schnell ästhetisch ansprechende Interfaces entwickeln konnten. Seine Analyse zeigt drei Landing Pages, die trotz unterschiedlicher Marken austauschbar wirken. Alle entstehen in Minuten, keine bleibt im Gedächtnis. Die Metapher vom IKEA LACK-Tisch trifft: Sägespäne in Plastikfolie, überall gleich. Websites werden zur Massenware, wenn jeder mit denselben Tools dieselben Patterns generiert. Die Produktionsgeschwindigkeit hat die Differenzierung gefressen. → Michal Malewicz

Synthszr Take: 2026 markiert den Punkt, an dem KI-generiertes Design seine eigene Attraktivität verliert. Designer produzierten drei Jahre lang immer schneller immer gleicher aussehende Interfaces – jetzt merkt es jeder. IKEA LACK als Metapher funktioniert perfekt: billig, überall verfügbar, niemand erinnert sich daran. Malewicz sieht das Problem, aber seine Lösung bleibt hinter der Paywall. Design-Agenturen werden sich neu erfinden müssen, wenn ihre Kernkompetenz (schnelle visuelle Umsetzung) zur Commodity wird. Wer nicht radikal umdenkt, wird zum Sägespäne-Verpacker.

Highlander-Problem: Es darf nicht nur eine Super-Intelligenz geben

Vincent Weisser, CEO von Prime Intellect, warnt vor einem unterschätzten Risiko der KI-Entwicklung: Eine einzige, perfekt auf die Interessen weniger Institutionen ausgerichtete Superintelligenz sei weitaus gefährlicher als viele konkurrierende Systeme. Seine These widerspricht der gängigen Angst vor fehlausgerichteten KI-Systemen. Stattdessen befürchtet er eine „sehr enge Monokultur der Superintelligenz“, kontrolliert von einer Handvoll mächtiger Akteure. Prime Intellect baut deshalb eine offene Infrastruktur für Training und den Einsatz fortgeschrittener KI-Modelle. Weisser bringt Erfahrung aus dezentraler Wissenschaft mit, in der er 40 Millionen Dollar für unkonventionelle Forschung mobilisierte. Der Gründer argumentiert für maximale Vielfalt: „Eine Superintelligenz ist viel weniger sicher als unendliche Superintelligenzen.“ → The Generalist

Synthszr Take: Weisser denkt die KI-Sicherheitsdebatte vom Ende her. Monopolistische Superintelligenz bedeutet totale Kontrolle ohne Gegenpole, während konkurrierende Systeme sich gegenseitig in Schach halten. Prime Intellect wettet auf Open-Source-Infrastruktur als Gegengift gegen die Konzentration der KI-Macht bei wenigen Tech-Konzernen. 40 Millionen Dollar für „unkonventionelle Forschung“ zeigen: Der Mann kann Kapital für Ideen jenseits des Mainstreams mobilisieren. Seine Vision von „unendlichen Superintelligenzen“ klingt nach kontrolliertem Chaos statt nach kontrollierter Ordnung. Dezentralisierung als Sicherheitsarchitektur – das ist radikal gedacht und könnte der einzige Weg sein, eine KI-Diktatur zu verhindern.

Subscribe free. Unsubscribe the second it sucks.

High-signal news across AI, business, UX, and tech. Every morning.