Токен-рационирование ИИ в 2026: как бизнес режет расходы

В июне 2026 компании переходят от стимулирования «максимально используйте ИИ» к обратной задаче — остановить расходование токенов на рутинные операции. TechCrunch пишет, что Accenture, по данным 404 Media, пытается ограничить траты сотрудников даже на базовые действия вроде преобразования PDF в презентационные слайды. Для бизнеса это означает простую развилку: либо ИИ остается инструментом для экономии времени и денег, либо превращается в бесконтрольную строку расходов. Проверка на сегодня тоже проста: можете ли вы назвать хотя бы три ИИ-задачи, которые действительно окупаются, и три, которые просто сжигают бюджет?

Что именно произошло

Сюжет здесь не про очередной «прорыв ИИ», а про смену управленческой логики. Еще недавно компании подталкивали сотрудников активнее пользоваться ИИ: по сообщению TechCrunch, некоторые даже строили внутренние таблицы лидеров, чтобы поднимать использование. Теперь тот же рынок приходит к выводу, что токены тратятся слишком легко, а отдача от них далеко не всегда видна.

В кейсе Accenture, который пересказывает 404 Media на основе утечки аудио с внутренней встречи, речь идет именно о приземленных задачах: не о сложном аналитическом сценарии, а о повседневной рутине вроде конвертации PDF в слайды. И это важная деталь. Если компания начинает экономить на таких операциях, значит, проблема уже не в «нехватке доступа к ИИ», а в том, что доступ был выдан слишком широко и без границы по смыслу задачи.

По словам Джастиса Квака, руководителя стратегии agentic AI в Accenture, компания дошла до точки, где ИИ становится «материальным» для структуры затрат, а расходы — непредсказуемыми. Он также говорит, что руководство на уровне CFO, COO и CIO уже задает не вопрос «используют ли люди ИИ», а вопрос «получаем ли мы ценность за то, что тратим». Именно здесь tokenmaxxing заканчивается и начинается токен-рационирование.

Почему это меняет бюджет и контроль

Для финансового директора токены — это не абстракция, а переменная стоимость каждого действия. Пока ИИ используют точечно, расход выглядит приемлемым. Как только он становится привычным способом делать даже простые задачи, счет начинает расти быстрее, чем польза. В этом и суть проблемы Accenture: дорогой инструмент тратится на работу, которая не создает пропорциональной ценности.

TechCrunch связывает эту историю с более широким разговором о «AI selloff» и давлением на AI-зависимый бизнес. Но для обычной компании важнее другое: если не видно, где именно тратятся токены, бюджет становится непредсказуемым. А непредсказуемый ИИ-бюджет почти всегда превращается в спор между подразделениями: бизнес хочет удобства, финансы — лимита, ИТ — контроля, а руководители — понятного эффекта.

Что меняется для управленца

Что меняется	Почему важно бизнесу	Что проверить
ИИ перестает быть «свободной привилегией»	Без границ сотрудники легко тратят токены на рутину	Есть ли лимит по отделу, роли или сценарию
Руководство требует не активности, а эффекта	Высокое использование само по себе не дает пользы	Можно ли связать расход с результатом задачи
Непредсказуемый счет становится операционным риском	Финансы не любят расходы, которые нельзя объяснить заранее	Видит ли CFO/COO динамику потребления вовремя
Базовые задачи уходят в дорогой канал	PDF-to-slides и похожие операции могут «съедать» бюджет	Не дешевле ли оставить их в шаблонах или обычном ПО
Стимулы к «большему использованию» вредят дисциплине	Лидерборды и поощрение объема подталкивают к лишним тратам	Не поощряется ли у вас объем вместо пользы

Смысл таблицы не в том, чтобы запретить ИИ. Смысл в другом: компания должна перестать считать токены чем-то безымянным. Как только цена одного «удобного» действия становится видимой, меняется и политика доступа.

Как превратить лимиты в рабочий процесс

Если компания хочет ограничивать расходы без хаоса, ей нужен не общий лозунг «экономим», а простой процесс. Он должен отвечать на четыре вопроса: что можно делать через ИИ, кто за это платит, где проходит лимит и что происходит, когда лимит достигнут.

Практически это выглядит так:

Разделите задачи по ценности.
Не «разрешено/запрещено ИИ вообще», а «что именно решает дорогую задачу». Конвертация PDF в слайды — это обычно не стратегический кейс. Анализ больших массивов текста, подготовка черновика сложного документа, извлечение структуры из длинных материалов — уже другая история.
Назначьте владельца расходов.
Если токены оплачиваются централизованно, но расходуют их все подряд, никто не чувствует цену. У каждого отдела должен быть понятный бюджетный контур или хотя бы отчетность по использованию.
Впишите ИИ в маршрут задачи, а не в привычку сотрудника.
Не надо, чтобы «любую мелочь» люди первым делом несли в ИИ. Для типовых операций должен быть стандартный ответ: шаблон, обычный офисный инструмент, ручной процесс или ограниченный ИИ-сценарий.
Замените соревнование по использованию соревнованием по эффекту.
Когда компания поощряет объем запросов, она получает больше шума и больше счета. Когда поощряется экономия времени на конкретной задаче, появляется шанс сохранить пользу без лишнего расхода.
Определите, кто останавливает перерасход.
Если лимит достигнут, система должна не просто «падать», а переводить запрос на ручной путь или на согласование. Иначе экономия не работает.

Главная ошибка здесь — пытаться срезать расходы постфактум, когда бюджет уже сгорел. Токен-рационирование работает только тогда, когда оно встроено в процесс до запуска задачи.

Что проверить перед запуском

Прежде чем вводить ограничения, компании стоит ответить на несколько прикладных вопросов. Они выглядят скучно, но именно они отличают управляемую экономию от демонстративного запрета.

Какие 5–10 ИИ-задач у сотрудников встречаются чаще всего?
Какие из них действительно экономят время, а какие просто удобнее старого способа?
Можно ли увидеть расход по отделам, ролям или типам задач?
Кто утверждает исключения, если лимит уже почти выбран?
Есть ли у сотрудников альтернативный путь для типовых операций?
Не конфликтует ли новый лимит с прежними стимулами вроде внутренних рейтингов активности?

Если на эти вопросы нет ответов, вводить общий жесткий лимит рано. В таком случае вы не управляете ИИ-расходом, а просто переносите его в тень: люди начнут искать обходные способы, личные аккаунты или неформальные согласования. Это не экономия, а потеря контроля.

Еще один важный момент: по своей природе кейс Accenture основан на утечке внутренней встречи, которую пересказывает 404 Media, а TechCrunch уже делает из нее более широкий вывод о переходе к token rationing. Значит, сам факт смены подхода к расходам можно считать надежным сигналом для рынка, но конкретные внутренние детали одной компании нельзя автоматически переносить на всех. У большой консалтинговой группы одна структура затрат, у продуктовой команды — другая, у банка — третья.

Где схема ломается и что может пойти не так

У токен-рационирования есть три типовых риска.

Первый риск — слишком грубый запрет.
Если ограничить ИИ по принципу «чем меньше, тем лучше», компания потеряет не расход, а полезные сценарии. Сотрудники перестанут использовать ИИ там, где он действительно ускоряет работу.

Второй риск — неправильная метрика.
Если смотреть только на количество токенов, можно прийти к абсурду: одинаковый расход будет считаться одинаково хорошим или плохим, хотя один запрос приносит готовый черновик стратегии, а другой — бесполезный пересказ. Нужна связь между расходом и бизнес-результатом.

Третий риск — конфликт стимулов.
Сначала сотрудников учат «использовать ИИ больше», потом внезапно наказывают за избыточное использование. Если компания за

Источники

Генерация изображения

Модель: flux-schnell
Провайдер: replicate