Les entreprises qui ont passé l'année à pousser leurs employés à utiliser les outils d'IA aussi intensément que possible peinent désormais à maîtriser les coûts.
Les directeurs financiers (CFO) exigent maintenant de voir des retours mesurables sur des factures d'API en constante augmentation, menaçant les projections de croissance d'OpenAI, d'Anthropic et d'autres fournisseurs de grands modèles de langage.

Les entreprises réduisent désormais leurs dépenses en IA, les CFO exigeant une justification face à des factures d'API qui s'envolent. Ce revirement marque la fin de ce que l'industrie a baptisé le « tokenmaxxing », et la correction s'opère rapidement.
Amazon a récemment démantelé un classement interne qui suivait l'utilisation de l'IA par les employés, après que la direction a conclu que le système générait davantage de travail superflu piloté par l'IA que de résultats utiles. « Ne veuillez pas utiliser l'IA juste pour utiliser l'IA », a déclaré un vice-président senior d'Amazon à ses équipes.
Uber a épuisé l'intégralité de son budget de codage IA pour 2026 en quatre mois, et Meta a envoyé un mémo interne à environ 6 000 employés signalant ce qu'il a qualifié d'« augmentation exponentielle » de l'utilisation de l'IA, avertissant que l'entreprise faisait face à des milliards de dollars de coûts internes liés à l'IA. Uber a depuis imposé un plafond de dépenses mensuel de 1 500 $ par employé sur les outils de codage IA.
Le géant du conseil Accenture avait précédemment averti ses employés qu'ils pourraient « risquer de rater des promotions » s'ils ne parvenaient pas à adopter les outils d'IA. Désormais, Accenture tente d'empêcher son personnel d'utiliser l'IA pour des tâches triviales.
Un enregistrement audio divulgué d'une réunion interne a capturé un dirigeant d'Accenture déclarant que les dépenses en IA « deviennent très imprévisibles ». Le même dirigeant a indiqué que les responsables au « niveau CFO, COO et CIO se posent encore la question de savoir s'ils obtiennent de la valeur de ce que nous dépensons ».
Adam McDaniel et Markus Eisele d'International Business Machines (IBM) ont soutenu dans une analyse récente que la minimisation des tokens est tout aussi néfaste que le tokenmaxxing, car les deux font de la consommation de tokens l'objectif principal plutôt que de se concentrer sur les résultats commerciaux.
IBM préconise ce qu'il appelle le « valuemaxxing », qui se concentre sur la mesure des tâches accomplies, du temps économisé et du travail de reprise évité, plutôt que sur les tokens consommés.
OpenAI et Anthropic ont élaboré leurs plans de croissance sur l'idée que les entreprises continueraient à consommer de plus en plus de tokens.
OpenAI a dépassé 25 milliards de dollars de revenus annualisés plus tôt cette année, tout en évaluant sa propre valorisation à 1 000 milliards de dollars, tandis qu'Anthropic est valorisé quelques milliards de dollars de moins. Les deux sociétés brûlent des liquidités dans le calcul, la recherche et le recrutement, tout en espérant que l'adoption par les entreprises les rendra rentables.
Mais les entreprises réservent déjà les modèles phares coûteux aux travaux complexes et utilisent des alternatives moins chères pour les tâches routinières. Certaines migrent leurs charges de travail vers des modèles open source fonctionnant sur leur propre infrastructure, sans frais par token.
L'International Data Corporation (IDC) prédit que d'ici 2028, 70 % des entreprises leaders piloté par l'IA utiliseront plusieurs modèles plutôt que de s'appuyer sur un seul fournisseur. Cela transformerait l'IA en une marchandise où les fournisseurs se concurrencent sur le prix plutôt que sur la seule capacité.
La question financière n'est toutefois pas près de disparaître. Même le PDG d'OpenAI, Sam Altman, a reconnu que le coût de l'IA est devenu un « énorme problème » pour les clients cette année.
Si vous lisez ceci, vous avez déjà une longueur d'avance. Conservez-la grâce à notre newsletter.


