Одна компания только что сожгла полмиллиарда долларов за месяц, потому что кто-то забыл прикрутить лимиты к API. Попытался разобраться в том, кто сколько тратит на ИИ в крупных компаниях и что делает с чеками в сотни миллионов за кодинг-агентов.
Axios взял интервью у известного на рынке AI-консультанта. Его клиент дал инженерам безлимитный доступ к Claude, и через тридцать дней пришёл счёт на полмиллиарда. Звучит как анекдот про некомпетентного менеджера, но корпоративную Америку сейчас правда трясёт от биллингового шока, и финдиректора экстренно режут косты.
Кто как выживает
Microsoft к 30 июня принудительно сносит Claude Code у тысяч инженеров из команд Windows, Office и Surface и пересаживает их на свой GitHub Copilot. Официальная причина — в безопасности и контроле. Неофициальная: 30 июня у них конец финансового года. Ребята лучше всех на рынке понимают, сколько стоят токены в промышленных масштабах — Microsoft один из крупнейших клиентов Anthropic. Когда корпорация силой отбирает у разработчиков тулзу, которая нравится им больше собственной, дело не в лояльности бренду. Дело в деньгах.
CTO Uber Правин Нага рассказал The Information, что заложенные на 2026 год ИИ-деньги потратили за четыре месяца. Использование Claude среди 5000 инженеров подскочило с 32% до 84%, около 70% коммитов теперь начинает ИИ, а личные счета доходят до двух тысяч долларов в месяц.
> «Я снова сижу с табличками, потому что бюджет, который я закладывал, уже израсходовали» — Правин Нага, CTO Uber
Amazon убрал всем сторонние инструменты. 80% штата перевели на внутренний Kiro и сделали его использование частью KPI. Инженеры доказывали, что Claude работает лучше. И были правы. По данным Financial Times, ИИ-агент снёс продакшен-окружение, два таких сбоя стоили компании 6,3 млн потерянных заказов, и теперь синьоры проверяют код руками.
Дженсен Хуанг (CEO Nvidia) заявляет, что будет «глубоко обеспокоен», если инженер с зарплатой $500 тысяч сожжёт за год токенов меньше чем на $250 тысяч. У них там новый спорт под названием tokenmaxxing — гонка за максимальным потреблением токенов. Один CTO рассказал Axios, что его люди спрашивали у модели погоду, чтобы выполнить KPI.
Salesforce — пример, где цифры действительно сходятся. Марк Бениофф (CEO Salesforce) сократил поддержку с 9000 до 5000 человек, расходы на саппорт упали на 17%, а Agentforce закрывает половину клиентских разговоров с тем же уровнем удовлетворённости, что и люди.
Часть компаний компенсирует счета увольнениями. CEO CloudBees сказал Axios, что сокращение штата для многих — единственный рычаг, чтобы отбить счёт за ИИ.
Почему счёт всё равно растёт
Агентный режим заставляет модель думать часами, она плодит параллельные сессии, перечитывает огромные куски кода, проверяет сама себя — Opus 4.8 в dynamic workflow может запускать сотни агентов.
Цена за токен падает примерно вдесятеро каждые полтора года, но потребление растёт быстрее, поэтому счёт всё равно ползёт вверх.
GitHub ещё в ноябре приостанавливал регистрации на Copilot Pro, потому что агентные нагрузки клиентов сжигали больше, чем стоила их же подписка. С 1 июня он отменяет фикс и переводит всех на оплату за объём.
Корпоративный ИИ-софт в США за полгода подорожал на 20–37% по данным Tropic. Gartner ждёт $2,5 трлн расходов на ИИ в этом году при росте 69% — хотя полностью окупаются всего 28% проектов.
Новая профессия
На рынке появляется FinOps-менеджер для LLM — финансист, для которого единица бюджета не рабочее место и не пользователь, а то, сколько модель потратила за ночь. Метрикой успеха становится не экономия, а доказанная польза для бизнеса.
Времена шальных токенов закончились — больше не будет советов типа «а давайте дадим всем безлимит и посмотрим, что будет». Начинается время квот, лимитов и счётчиков над душой у каждого инженера.