Как запускать ИИ-агентов надолго: уроки Cursor про планировщиков, исполнителей и судью

Большинство людей оценивает ИИ-агента по короткой задаче: написал ли он функцию, исправил ли ошибку, собрал ли небольшой интерфейс. Но настоящая ценность автономных агентов видна в другой точке: могут ли они долго работать над большой задачей, не теряя фокус, не путая цель и не превращая проект в набор случайных правок.

В архиве журнала был сильный пример из блога Cursor про масштабирование агентов. Команда описывает эксперименты, где агенты работали долго: строили сложные системы, мигрировали кодовую базу и ускоряли реальную продуктовую часть. Важен не только масштаб эксперимента. Важна архитектура: агентская работа была разделена на роли и циклы.

Что произошло

По описанию Cursor, один из рабочих вариантов выглядел как конвейер. Планировщики анализируют кодовую базу и формируют задачи. Исполнители берут отдельные задачи и решают их, не пытаясь держать всю картину проекта. В конце цикла отдельный агент-судья решает, стоит ли продолжать работу. Следующая итерация начинается с чистого листа.

Это важная мысль для любой команды, которая пытается использовать агентов не только в коде. Долгая автономная работа требует не «самого умного помощника», а правильного разделения труда. У человека в голове смешаны стратегия, память, вкус, проверка и ответственность. У агентской системы эти роли лучше разнести.

Роль	Что делает	Почему нельзя смешивать
Планировщик	разбирает цель и делает список задач	иначе исполнитель начинает сам менять смысл работы
Исполнитель	решает одну ограниченную задачу	так меньше хаоса и пересечений
Судья	проверяет результат и решает, продолжать ли цикл	исполнитель плохо оценивает собственную работу
Человек	задает цель, границы и принимает риск	ответственность нельзя спрятать внутрь модели

Какой метод из этого следует

Метод можно перенести из разработки в бизнес-процессы. Если агент должен готовить отчет, обновлять сайт, проверять документы или вести контент-производство, ему нужен не один чат, а цикл работы.

Сначала отдельный шаг планирования: что должно измениться и какие материалы нужны. Потом исполнение: одна задача за раз. Потом проверка: что получилось, чем подтверждено, какие тесты или критерии пройдены. Потом решение: продолжать, остановиться, передать человеку или начать новый цикл.

Мы уже писали про суб-агентов в Claude Code и про правила работы с ИИ в коде. История Cursor добавляет к этому еще один уровень: автономность — это не свобода модели, а управляемый цикл с ролями.

Rich block render error: mapping values are not allowed here
  in "<unicode string>", line 2, column 14:
    title: Cursor: Scaling agents
                 ^

label: первоисточник
title: Cursor: Scaling agents
url: https://cursor.com/blog/scaling-agents
description: В статье Cursor описывает эксперименты с длительной работой агентов и разделением ролей между планировщиками, исполнителями и проверкой.

Где это применить вне кода

В редакции планировщик может выбирать темы и готовить источник-пакет, исполнитель пишет черновик, проверяющий ищет слабые места, а публикационный слой ставит материал в очередь. В продажах планировщик разбивает подготовку предложения, исполнитель собирает разделы, проверяющий ищет несоответствия требованиям. В юридической работе один агент вытаскивает условия, другой сравнивает с политикой, третий собирает список рисков.

Разница между «чат помог» и «агентская система работает» появляется именно здесь. Если задача повторяется, ее можно превратить в цикл. Если цикл можно проверить, его можно улучшать.

1
Шаг 1
Когда использовать: задача большая, повторяемая и не помещается в один короткий ответ.
2
Шаг 2
Что подать на вход: цель, материалы, критерии качества, список разрешенных действий и условия остановки.
3
Шаг 3
Что сделать по шагам: выделить планировщика, исполнителя, проверяющего и человека, который принимает риск.
4
Шаг 4
Какой результат получить: агентский цикл, который можно запускать много раз и улучшать по следу работы.
5
Шаг 5
Как проверить качество: смотреть не только финальный результат, но и план, действия, ошибки, проверки и причины продолжения.
6
Шаг 6
Когда не использовать: если задача разовая, малая или требует мгновенного человеческого решения.
7
Шаг 7
Какой навык собрать: диспетчер агентского цикла, который создает план, раздает задачи и собирает отчет проверки.

Что сделать сегодня

Возьмите одну задачу, которую вы хотите «отдать агенту», и не начинайте с промпта. Сначала разложите ее на роли. Кто планирует? Кто исполняет? Кто проверяет? Какие файлы нужны? Какие команды разрешены? Где агент должен остановиться и спросить человека?

Если на эти вопросы нет ответа, агент пока не готов к долгой автономной работе. Но это хорошая новость: вам не нужно ждать следующую модель. Можно усилить уже доступные модели правильной системой вокруг них.

Как запускать ИИ-агентов надолго: уроки Cursor про план и проверку

Что произошло

Какой метод из этого следует

Где это применить вне кода

Что сделать сегодня

Источники