Схема AI-петли: управляющий агент ставит задачу исполнителю, проверяет результат и контролирует расход токенов

AI-петли в 2026: агенты запускают агентов — как контролировать стоимость

ИИ-инструменты 26 июня 2026 г.

22 июня 2026 года создатель Claude Code Борис Черный выступил на конференции и заявил: переход от ручного написания кода к агентам был большим шагом, но переход к агентам, которые запускают других агентов, — шаг сопоставимого масштаба. Речь идёт об AI-петлях — механизме, при котором одна модель ставит задачу другой, та выполняет работу и возвращает результат, а управляющий агент проверяет качество и либо принимает результат, либо запускает цикл заново. Для владельца бизнеса это означает, что часть рутинной работы по улучшению кода, контента или внутренних процессов может выполняться непрерывно, без участия человека, — но счёт за токены при этом тоже становится непрерывным.

Главный вопрос, который должен задать себе руководитель: готовы ли вы платить за бесконечный цикл улучшений, если не можете заранее назвать его конечную стоимость.

Что именно произошло: от разовых поручений к непрерывному фону

До сих пор работа с AI-агентами строилась по модели «дал задание — проверил результат». Вы формулируете промпт, агент выполняет работу, вы принимаете или отправляете на доработку. Это дискретный процесс с явным началом и концом.

AI-петля меняет саму логику взаимодействия. Вместо цепочки «человек → агент → результат» возникает конструкция «агент-менеджер → агент-исполнитель → проверка → повтор». Управляющий агент не просто делегирует задачу — он оценивает результат и принимает решение, достаточно ли он хорош, или цикл нужно повторить. Именно такую схему Борис Черный описал в своём выступлении: в его собственной работе один агент непрерывно ищет способы улучшить архитектуру кода, другой — выявляет дублирующиеся абстракции и предлагает их унификацию. Оба оформляют pull request так же, как это сделал бы разработчик-человек.

Ключевое слово здесь — «непрерывно». Поскольку кодовая база постоянно меняется, агенты никогда не останавливаются. Это не разовая оптимизация, а постоянно работающий фоновый процесс.

Почему это меняет расчёт затрат и контроль над проектом

Классическая модель «человек ставит задачу агенту» даёт предсказуемый бюджет: вы знаете, сколько задач запустили, и можете примерно оценить расход токенов. AI-петля ломает эту предсказуемость. Управляющий агент сам решает, когда остановиться, — и это решение недетерминированно. В классическом программировании рекурсивная функция имеет явное условие выхода. В агентной петле условие выхода определяет сама модель, и она может счесть результат недостаточным десять, двадцать или пятьдесят раз подряд.

Исследователь OpenAI Ноам Браун ранее в июне 2026 года сформулировал принцип, который объясняет, почему это работает: современные модели способны решить практически любую задачу, если предоставить им достаточно вычислительных ресурсов. AI-петля — это практическая реализация данного принципа. Вы не ограничиваете модель одним проходом, а даёте ей возможность «дожимать» результат до приемлемого качества.

Проблема в том, что «достаточно ресурсов» — понятие растяжимое. Для задач типа улучшения кодовой базы, где каждое улучшение инкрементально, модель может продолжать находить микрооптимизации бесконечно. Черный привёл пример: агенты, улучшающие архитектуру, работают постоянно, потому что код меняется, и всегда есть что улучшать. Счёт за токены в такой модели не имеет потолка.

Что такое Ralph Loop и почему это работает даже в простых сценариях

Один из самых популярных и при этом обманчиво простых паттернов агентных петель — Ralph Loop, названный в честь персонажа Ральфа Виггама. Механика выглядит так: модель выполняет задачу, затем суммирует всё сделанное и задаёт себе вопрос — достигнута ли цель? Если нет — цикл повторяется.

Это решение проблемы, с которой сталкивается любой, кто давал AI-агенту сложное задание: модель «теряется» на длинной дистанции, начинает отклоняться от исходной задачи или зацикливается на несущественных деталях. Ralph Loop возвращает её к цели, заставляя заново оценить прогресс.

Для бизнеса это означает, что даже относительно простые агентные петли могут дать прирост качества без сложной инженерной инфраструктуры. Вы не строите многоуровневую систему из десятка специализированных агентов — вы даёте одному агенту механизм самопроверки. Это снижает порог входа, но не отменяет проблему неконтролируемого расхода токенов: каждый цикл проверки стоит денег.

Что должно насторожить: три неочевидных риска

Первый риск — отсутствие потолка затрат. В отличие от чат-ботов, где вы платите за каждый запрос и видите счёт, агентная петля может работать часами, и вы узнаете стоимость постфактум. Для Anthropic, который зарабатывает на продаже токенов, это выгодно. Для всех остальных — потенциально болезненно.

Второй риск — качество результата не гарантировано ростом затрат. Модель может крутиться в петле, внося изменения, которые субъективно кажутся ей улучшениями, но не создают реальной ценности для продукта. Без метрик качества, заданных человеком, вы рискуете оплатить множество итераций, которые не приближают вас к бизнес-цели.

Третий риск — накопление ошибок. Если управляющий агент принимает решение о качестве на основе неполных или неверных критериев, каждый следующий цикл может уводить результат всё дальше от желаемого. В классической разработке code review выполняет человек. В агентной петле эту функцию берёт на себя модель — и её ошибка размножается с каждым циклом.

Как прагматично запустить AI-петлю и не разориться на токенах

Прагматичный подход — не запускать бесконечный цикл, а задать ему жёсткие бизнес-ограничения. Вот три правила, которые стоит внедрить до первого запуска.

Первое: лимит итераций. Определите максимальное количество циклов, после которого петля останавливается независимо от самооценки модели. Для задач рефакторинга кода разумный лимит — 5–7 итераций. Для генерации контента — 3–4. Если за это количество попыток модель не достигла приемлемого качества, результат должен уйти на проверку человеку.

Второе: бюджетный порог. Задайте максимальную стоимость одного запуска петли в токенах или в деньгах. Современные API позволяют отслеживать расход в реальном времени. При достижении порога петля должна останавливаться и отправлять уведомление.

Третье: метрика приёмки, заданная человеком. Модель не должна сама решать, хорош ли результат. Вы должны определить конкретный измеримый критерий: например, «время ответа API не увеличилось», «количество строк кода сократилось на X%», «текст содержит не более Y грамматических ошибок». Без такого критерия вы доверяете модели оценку её собственной работы — а это ненадёжно.

С чего начать на этой неделе: чек-лист для руководителя

Вот что можно сделать уже сейчас, чтобы оценить применимость AI-петель в вашем проекте, не потратив бюджет впустую:

  • [ ] Выберите одну задачу, где качество важнее скорости: рефакторинг модуля, вычитка документации, поиск дублирующегося кода.
  • [ ] Определите измеримый критерий успеха. Не «стало лучше», а конкретный показатель, который можно проверить автоматически.
  • [ ] Задайте лимит в 5 итераций и бюджетный порог в 10 долларов на один запуск.
  • [ ] Запустите петлю на тестовой среде, не на продакшене. Проверьте, сколько итераций потребовалось и какой получился счёт.
  • [ ] Сравните результат с тем, что сделал бы разработчик за те же деньги. Если разработчик за 50 долларов делает то же самое за час, а петля потратила 30 долларов и 20 минут, — это рабочий инструмент. Если петля потратила 200 долларов и результат сомнительный, — вы получили важный сигнал о неприменимости подхода к данной задаче.
  • [ ] Примите решение: масштабировать на другие задачи, скорректировать лимиты или отложить до улучшения моделей.

Что изменится в ближайшие полгода: прогноз на основе текущих тенденций

Тренд на увеличение test-time compute, о котором говорил Ноам Браун, будет только усиливаться. Модели становятся способны решать всё более сложные задачи при достаточных вычислительных ресурсах, и агентные петли — естественный способ эти ресурсы задействовать. Можно ожидать, что к концу 2026 года появятся стандартизированные фреймворки для управления петлями с встроенными механизмами бюджетирования и контроля качества.

Одновременно вырастет и стоимость ошибки. Компании, которые запустят петли без лимитов, рискуют получить счета, сопоставимые с зарплатой разработчика, но без гарантированного результата. Компании, которые внедрят петли с жёсткими бизнес-правилами, получат инструмент непрерывного улучшения, работающий 24/7.

Ключевое решение, которое предстоит принять каждому руководителю: вы используете AI-петли как замену человеку или как усилитель человека. Во втором случае человек задаёт критерии, проверяет ключевые результаты и принимает финальное решение. В первом — вы доверяете модели полный цикл и принимаете связанные с этим риски.

Генерация изображения

  • Модель: gpt-5.4-image-2
  • Провайдер: openrouter

Теги