Unternehmen, die das vergangene Jahr damit verbracht haben, ihre Mitarbeiter so intensiv wie möglich zur Nutzung von KI-Tools anzuhalten, kämpfen nun mit der Kostenkontrolle.
CFOs fordern nun messbare Renditen auf die stetig steigenden API-Rechnungen und gefährden damit die Wachstumsprognosen von OpenAI, Anthropic und anderen Anbietern großer Sprachmodelle.

Unternehmen drosseln nun ihre KI-Ausgaben, da CFOs eine Rechtfertigung für die anschwellenden API-Rechnungen fordern. Diese Kehrtwende markiert das Ende dessen, was die Branche als „Tokenmaxxing" bezeichnet hat – und die Korrektur kommt schnell.
Amazon hat kürzlich eine interne Rangliste abgeschafft, die die KI-Nutzung der Mitarbeiter verfolgte, nachdem die Führungsebene zu dem Schluss gekommen war, dass das System mehr KI-gestützte Beschäftigung ohne Mehrwert als nützliche Ergebnisse produzierte. „Bitte nutzt KI nicht um der KI willen", sagte ein Amazon SVP zu den Mitarbeitern.
Uber hat sein gesamtes KI-Coding-Budget für 2026 in vier Monaten verbraucht, und Meta verschickte ein internes Memo an rund 6.000 Mitarbeiter, in dem es einen „exponentiellen Anstieg" der KI-Nutzung ansprach und warnte, dem Unternehmen drohten interne KI-Kosten in Milliardenhöhe. Uber hat seitdem eine monatliche Ausgabenobergrenze von 1.500 US-Dollar pro Mitarbeiter für KI-Coding-Tools eingeführt.
Der Beratungsriese Accenture hatte Mitarbeiter zuvor gewarnt, sie könnten „Beförderungen riskieren zu verpassen", wenn sie KI-Tools nicht einsetzen würden. Nun versucht Accenture, Mitarbeiter davon abzuhalten, KI für triviale Aufgaben zu verwenden.
In einem geleakten Audio aus einem internen Meeting ist ein Accenture-Manager zu hören, der sagt, die KI-Ausgaben seien „sehr unberechenbar geworden". Derselbe Manager sagte, die Führungsebene auf „CFO-, COO- und CIO-Ebene stellt immer noch die Frage, ob sie einen Mehrwert aus dem erzielen, was wir ausgeben."
Adam McDaniel und Markus Eisele von International Business Machines (IBM) argumentierten in einer aktuellen Analyse, dass Token-Minimierung genauso schlecht sei wie Tokenmaxxing, weil beides den Token-Verbrauch zum Hauptziel macht, anstatt sich auf Geschäftsergebnisse zu konzentrieren.
IBM befürwortet, was es „Valuemaxxing" nennt – ein Ansatz, der sich auf die Messung abgeschlossener Aufgaben, eingesparter Zeit und vermiedener Nacharbeiten konzentriert, anstatt auf verbrauchte Token.
OpenAI und Anthropic haben ihre Wachstumspläne auf der Annahme aufgebaut, dass Unternehmen immer mehr Token verbrauchen würden.
OpenAI hat Anfang dieses Jahres die Marke von 25 Milliarden US-Dollar beim annualisierten Umsatz überschritten und bewertet sich selbst mit 1 Billion US-Dollar, während Anthropic einige Milliarden Dollar darunter bewertet wird. Beide Unternehmen verbrennen Kapital für Rechenleistung, Forschung und Personal und hoffen, dass die Unternehmensadoption sie profitabel machen wird.
Unternehmen reservieren teure Flaggschiff-Modelle jedoch bereits für komplexe Aufgaben und nutzen kleinere, günstigere Alternativen für Routineaufgaben. Einige verlagern Workloads auf Open-Source-Modelle, die auf ihrer eigenen Infrastruktur ohne Token-Gebühren laufen.
Die International Data Corporation (IDC) prognostiziert, dass bis 2028 70 % der führenden KI-gesteuerten Unternehmen mehrere Modelle nutzen werden, anstatt sich auf einen einzigen Anbieter zu verlassen. Das würde KI zu einer Ware machen, bei der Anbieter eher über den Preis als nur über die Leistungsfähigkeit konkurrieren.
Die Kostenfrage wird so schnell jedoch nicht verschwinden. Selbst OpenAIs CEO Sam Altman hat eingeräumt, dass die Kosten von KI in diesem Jahr zu einem „riesigen Problem" für Kunden geworden sind.
Wenn Sie das lesen, sind Sie bereits einen Schritt voraus. Bleiben Sie es mit unserem Newsletter.


