Биллинговый шок: корпорации теряют контроль над расходами на ИИ

Клиент одного AI-консультанта сжёг полмиллиарда долларов за месяц из-за безлимитного доступа к Claude; Microsoft принудительно снимает тысячи инженеров с Claude Code к 30 июня, а CTO Uber признаётся, что весь ИИ-бюджет на 2026 год ушёл за четыре месяца.

Автор: Michael Kokin ·

Одна компания только что сожгла полмиллиарда долларов за месяц, потому что кто-то забыл прикрутить лимиты к API. Попытался разобраться в том, кто сколько тратит на ИИ в крупных компаниях и что делает с чеками в сотни миллионов за кодинг-агентов.

Axios взял интервью у известного на рынке AI-консультанта. Его клиент дал инженерам безлимитный доступ к Claude, и через тридцать дней пришёл счёт на полмиллиарда. Звучит как анекдот про некомпетентного менеджера, но корпоративную Америку сейчас правда трясёт от биллингового шока, и финдиректора экстренно режут косты.

Кто как выживает

Microsoft к 30 июня принудительно сносит Claude Code у тысяч инженеров из команд Windows, Office и Surface и пересаживает их на свой GitHub Copilot. Официальная причина — в безопасности и контроле. Неофициальная: 30 июня у них конец финансового года. Ребята лучше всех на рынке понимают, сколько стоят токены в промышленных масштабах — Microsoft один из крупнейших клиентов Anthropic. Когда корпорация силой отбирает у разработчиков тулзу, которая нравится им больше собственной, дело не в лояльности бренду. Дело в деньгах.

CTO Uber Правин Нага рассказал The Information, что заложенные на 2026 год ИИ-деньги потратили за четыре месяца. Использование Claude среди 5000 инженеров подскочило с 32% до 84%, около 70% коммитов теперь начинает ИИ, а личные счета доходят до двух тысяч долларов в месяц.

> «Я снова сижу с табличками, потому что бюджет, который я закладывал, уже израсходовали» — Правин Нага, CTO Uber

Amazon убрал всем сторонние инструменты. 80% штата перевели на внутренний Kiro и сделали его использование частью KPI. Инженеры доказывали, что Claude работает лучше. И были правы. По данным Financial Times, ИИ-агент снёс продакшен-окружение, два таких сбоя стоили компании 6,3 млн потерянных заказов, и теперь синьоры проверяют код руками.

Дженсен Хуанг (CEO Nvidia) заявляет, что будет «глубоко обеспокоен», если инженер с зарплатой $500 тысяч сожжёт за год токенов меньше чем на $250 тысяч. У них там новый спорт под названием tokenmaxxing — гонка за максимальным потреблением токенов. Один CTO рассказал Axios, что его люди спрашивали у модели погоду, чтобы выполнить KPI.

Salesforce — пример, где цифры действительно сходятся. Марк Бениофф (CEO Salesforce) сократил поддержку с 9000 до 5000 человек, расходы на саппорт упали на 17%, а Agentforce закрывает половину клиентских разговоров с тем же уровнем удовлетворённости, что и люди.

Часть компаний компенсирует счета увольнениями. CEO CloudBees сказал Axios, что сокращение штата для многих — единственный рычаг, чтобы отбить счёт за ИИ.

Почему счёт всё равно растёт

Агентный режим заставляет модель думать часами, она плодит параллельные сессии, перечитывает огромные куски кода, проверяет сама себя — Opus 4.8 в dynamic workflow может запускать сотни агентов.

Цена за токен падает примерно вдесятеро каждые полтора года, но потребление растёт быстрее, поэтому счёт всё равно ползёт вверх.

GitHub ещё в ноябре приостанавливал регистрации на Copilot Pro, потому что агентные нагрузки клиентов сжигали больше, чем стоила их же подписка. С 1 июня он отменяет фикс и переводит всех на оплату за объём.

Корпоративный ИИ-софт в США за полгода подорожал на 20–37% по данным Tropic. Gartner ждёт $2,5 трлн расходов на ИИ в этом году при росте 69% — хотя полностью окупаются всего 28% проектов.

Новая профессия

На рынке появляется FinOps-менеджер для LLM — финансист, для которого единица бюджета не рабочее место и не пользователь, а то, сколько модель потратила за ночь. Метрикой успеха становится не экономия, а доказанная польза для бизнеса.

Времена шальных токенов закончились — больше не будет советов типа «а давайте дадим всем безлимит и посмотрим, что будет». Начинается время квот, лимитов и счётчиков над душой у каждого инженера.