Das Ende der subventionierten KI-Cloud-Preise — erste strukturelle Brüche werden sichtbar
GitHub Copilot hat Opus in der vergangenen Woche aus seinem Pro-Tarif entfernt. Anthropic drosselte Claude Pro Code während der US-amerikanischen Stoßzeiten, und der Wachstumschef bezeichnete es als „Experiment". Zwei unabhängige, am selben Tag veröffentlichte Quellen argumentieren, es handle sich nicht um eine Servicepanne — sondern um die erste sichtbare Phase einer strukturellen Preiskorrektur, die in der gesamten Cloud-KI-Branche im Gange ist.
Was die Quelle tatsächlich beschreibt
Tim Carambat (Anything LLM, 28. April) dokumentiert das Enshitification-Muster mit Präzision: GitHub Copilot Pro nimmt keine neuen Anmeldungen mehr an, hat Nutzungslimits gestrichen und Opus entfernt, während nur noch Claude 4.7 verbleibt — „das schwächste Modell." Claude Pro Max soll laut Prognosen innerhalb weniger Monate 500 Dollar monatlich erreichen, da der aktuelle 20-Dollar-Tarif keine ausreichenden Compute-Margen mehr trägt. Für Unternehmen folgenreicher ist der Übergang vom Pro-Seat- zum Pro-Token-Abrechnungsmodell. In Gesprächen mit Unternehmen von 30.000 bis 50.000 Mitarbeitenden kartiert Carambat das Planungsrisiko direkt: Pro-Seat ist kalkulierbar; Tokenkosten sind nicht gedeckelt. Drei Cent pro E-Mail-Zusammenfassung, multipliziert über 50.000 Mitarbeitende im Jahresverlauf, ergibt eine Verbindlichkeit ohne Obergrenze. „Zu einem günstigeren Anbieter zu wechseln", so Carambat, „versetzt dich lediglich bei einem anderen Vermieter auf Null."
Die Finanzkennzahlen hinter der Degradierung sind ebenso eindeutig. Mandar Khardes Analyse (GoPubby, 27. April) öffnet die Bücher: OpenAI verbrannte 2025 rund 9 Milliarden Dollar gegen 13 Milliarden Dollar Umsatz und prognostiziert für 2026 Verluste von 14 Milliarden Dollar — mit Inferenzkosten von 12 Milliarden Dollar allein bei Microsoft bis November 2025. Anthropics Bruttomarge ist auf rund 40 % gesunken, gegenüber einem Zielwert von 50 %. Die Subvention, die die aktuellen Preise ermöglicht, stammt von Microsoft, Amazon, Nvidia und SoftBank, die gleichzeitig finanzieren, liefern und von denselben Laboren kaufen. Khardes Fazit: Die Branche ist einen Liquiditätsereignis entfernt von einer ungeordneten 10-fachen Neupreisgestaltung.
Strategische Einschätzung
Teams, die KI-Budgets für 2026–27 planen, sollten aktuelle Token-Tarife gegen ein 5- bis 10-faches Repricing-Szenario stresstesten — die Subvention, die die heutigen Preise ermöglicht, ist struktureller, nicht permanenter Natur. Lokale Inferenz (Qwen 3.5 0.8B, 128K Kontext, Consumer-Hardware) ist inzwischen ausgereift genug, um als Compute-Absicherung für Produktivitäts- und Coding-Workloads zu dienen.


