KI-Rendite unter Druck: Token-Kosten treffen auf harte Zahlen

Die Rechenschaftspflicht gegenüber dem KI-ROI im Unternehmensbereich kommt schneller als Hyperscaler-Aktienkurse suggerieren. Innerhalb eines einzigen Monats: Uber verbrauchte sein gesamtes KI-Budget für 2026, Microsoft stornierte den Großteil seiner Claude Code-Lizenzen aus Kostengründen, und ein Fortune-20-CEO ordnete eine „drastische Senkung" des Token-Verbrauchs an, nachdem 200 Millionen Dollar Ausgaben nur bescheidene Einsparungen erbracht hatten. Die Financial Times errechnet negative implizite Renditen auf KI-Investitionen für vier von fünf großen Hyperscalern — selbst unter der Annahme von Nullkosten.

Was die Quellen tatsächlich besagen

@ThierryBorgeat's viraler X-Thread katalogisiert die Belege der letzten 30 Tage. Microsoft stornierte den Großteil seiner Claude Code-Lizenzen und nannte die Kosten als Grund; Uber erschöpfte sein gesamtes KI-Budget 2026 in vier Monaten, wobei der COO öffentlich erklärte, die Kosten seien „schwerer zu rechtfertigen." Ein Konto von Vivek Garipalli schildert den Fall eines Fortune-20-CEOs, der 1 Milliarde Dollar an KI-getriebenen Betriebskosteneinsparungen beauftragte — das Team gab 200 Millionen Dollar für Token aus und lieferte bescheidene Verbesserungen im Kundenservice sowie einen leicht reduzierten Einstellungsbedarf im Engineering. Die Token-Ausgaben wurden seither „drastisch gesenkt". Eine separate, über Axios überlieferte Anekdote berichtet von einem Unternehmen, das in einem einzigen Monat 500 Millionen Dollar für Claude ausgab, nachdem es versäumt hatte, Nutzungsgrenzen für Mitarbeiter einzuführen — eine Zahl, die Gary Marcus und Ethan Mollick öffentlich als bei jeder realistischen Mitarbeiterzahl unplausibel bezeichneten.

Auf der Angebotsseite brachen H200-GPU-Mietpreise innerhalb von drei Wochen von 7 auf 4 Dollar pro Stunde ein — ein Rückgang von 43 Prozent, der auf eine nachlassende Infrastrukturnachfrage hindeutet. Die Panmure-Liberum-Analyse der FT zeichnet das strukturelle Bild: Modelliert man Hyperscaler-KI-Investitionen gegen projizierte Einnahmen 2025–2030 unter Nullkostenannahmen, erzielt nur Amazon eine positive Rendite (+7,2 Prozent). Microsoft liegt bei –9,2 Prozent, Alphabet bei –15,7 Prozent, Meta bei –28,8 Prozent, Oracle bei –35,6 Prozent. Reale Renditen — unter Berücksichtigung von GPU-Abschreibung, Stromkosten und Personalaufwand — sind schlechter. Die Aktien notieren auf Allzeithochs.

Der YouTube-Batch ergänzt einen zweiten unabhängigen Datenpunkt: Lev Selectors wöchentliche KI-Übersicht vermerkt, dass Microsoft Ingenieure bereits von direkten Claude Code-Lizenzen auf GitHub Copilot CLI umleitet, um Ausgaben zu steuern, während Goldman Sachs einen 24-fachen Anstieg des gesamten Token-Verbrauchs bei skalierenden Agenten-Workloads prognostiziert — was bedeutet, dass sinkende Pro-Token-Preise den Anstieg der Gesamtrechnung nicht verhindern werden.

Strategische Einordnung

Die Frage lautet nicht mehr, ob KI Ergebnisse liefert — das tut sie häufig —, sondern ob sie dies schnell genug tut, um die aktuellen Token-Kosten zu rechtfertigen. Builder sollten harte Nutzungsgrenzen einführen, Modelle je Agent auf ihre Aufgabe abstimmen (Frontier-Modelle für Planung, günstigere Modelle für die Ausführung) und explizite ROI-Schwellen definieren, bevor Workloads skalieren. Ubers Lektion: Budget aufgebraucht, Ergebnisse bescheiden, Geduld des Managements erschöpft.