Китайские AI-модели обогнали американские по использованию

Так-Так. Китайские AI-модели обогнали американские по объёму использования. По данным OpenRouter, модели DeepSeek и MiniMax с прошлого месяца потребляют больше токенов, чем западные конкуренты. Более низкие цены делают своё дело.

MiniMax и Moonshot берут $2–3 за миллион выходных токенов, Claude Sonnet 4.5 — около $15. Для чатбота это терпимо, но AI-агенты сжигают на порядки больше: простая задача по коду может потребовать 20 миллионов токенов. При таких объёмах шестикратная разница в цене очень даже ощутима.

Один гонконгский разработчик рассказывает FT, что раньше работал только с Claude, но при нынешних объёмах это обходилось бы в $900 в день. Теперь 80% задач он отдаёт китайскому Kimi, а Claude оставляет для сложного. Выходит $50 вместо $900.

Пока AI-индустрия тратила основные деньги на обучение моделей, это была гонка за лучший бенчмарк. Но когда миллионы агентов круглосуточно генерируют ответы, главной статьёй расхода становится инференс — то есть само производство токенов. Токен превращается в базовый ресурс, как киловатт-час (вспоминаем знаменитую цитату Альтмана): выигрывает не тот, кто построил самую умную модель, а тот, кто дает дешевый и стабильный инференс.

Alibaba, кстати, уже создала отдельное подразделение — Token Hub — под руководством CEO компании. Они хотят стать платформой, через которую идет поток инференса, — как AWS для облачных вычислений.

→ Financial Times