Как запускать ИИ-агентов надолго: уроки Cursor про план и проверку

Большинство людей оценивает ИИ-агента по короткой задаче: написал ли он функцию, исправил ли ошибку, собрал ли небольшой интерфейс. Но настоящая ценность автономных агентов видна в другой точке: могут ли они долго работать над большой задачей, не теряя фокус, не путая цель и не превращая проект в набор случайных правок.

В архиве журнала был сильный пример из блога Cursor про масштабирование агентов. Команда описывает эксперименты, где агенты работали долго: строили сложные системы, мигрировали кодовую базу и ускоряли реальную продуктовую часть. Важен не только масштаб эксперимента. Важна архитектура: агентская работа была разделена на роли и циклы.

Что произошло

По описанию Cursor, один из рабочих вариантов выглядел как конвейер. Планировщики анализируют кодовую базу и формируют задачи. Исполнители берут отдельные задачи и решают их, не пытаясь держать всю картину проекта. В конце цикла отдельный агент-судья решает, стоит ли продолжать работу. Следующая итерация начинается с чистого листа.

Это важная мысль для любой команды, которая пытается использовать агентов не только в коде. Долгая автономная работа требует не «самого умного помощника», а правильного разделения труда. У человека в голове смешаны стратегия, память, вкус, проверка и ответственность. У агентской системы эти роли лучше разнести.

РольЧто делаетПочему нельзя смешивать
Планировщикразбирает цель и делает список задачиначе исполнитель начинает сам менять смысл работы
Исполнительрешает одну ограниченную задачутак меньше хаоса и пересечений
Судьяпроверяет результат и решает, продолжать ли циклисполнитель плохо оценивает собственную работу
Человекзадает цель, границы и принимает рискответственность нельзя спрятать внутрь модели

Какой метод из этого следует

Метод можно перенести из разработки в бизнес-процессы. Если агент должен готовить отчет, обновлять сайт, проверять документы или вести контент-производство, ему нужен не один чат, а цикл работы.

Сначала отдельный шаг планирования: что должно измениться и какие материалы нужны. Потом исполнение: одна задача за раз. Потом проверка: что получилось, чем подтверждено, какие тесты или критерии пройдены. Потом решение: продолжать, остановиться, передать человеку или начать новый цикл.

Мы уже писали про суб-агентов в Claude Code и про правила работы с ИИ в коде. История Cursor добавляет к этому еще один уровень: автономность — это не свобода модели, а управляемый цикл с ролями.

Rich block render error: mapping values are not allowed here
  in "<unicode string>", line 2, column 14:
    title: Cursor: Scaling agents
                 ^

label: первоисточник
title: Cursor: Scaling agents
url: https://cursor.com/blog/scaling-agents
description: В статье Cursor описывает эксперименты с длительной работой агентов и разделением ролей между планировщиками, исполнителями и проверкой.

Где это применить вне кода

В редакции планировщик может выбирать темы и готовить источник-пакет, исполнитель пишет черновик, проверяющий ищет слабые места, а публикационный слой ставит материал в очередь. В продажах планировщик разбивает подготовку предложения, исполнитель собирает разделы, проверяющий ищет несоответствия требованиям. В юридической работе один агент вытаскивает условия, другой сравнивает с политикой, третий собирает список рисков.

Разница между «чат помог» и «агентская система работает» появляется именно здесь. Если задача повторяется, ее можно превратить в цикл. Если цикл можно проверить, его можно улучшать.

  1. 1
    Шаг 1

    Когда использовать: задача большая, повторяемая и не помещается в один короткий ответ.

  2. 2
    Шаг 2

    Что подать на вход: цель, материалы, критерии качества, список разрешенных действий и условия остановки.

  3. 3
    Шаг 3

    Что сделать по шагам: выделить планировщика, исполнителя, проверяющего и человека, который принимает риск.

  4. 4
    Шаг 4

    Какой результат получить: агентский цикл, который можно запускать много раз и улучшать по следу работы.

  5. 5
    Шаг 5

    Как проверить качество: смотреть не только финальный результат, но и план, действия, ошибки, проверки и причины продолжения.

  6. 6
    Шаг 6

    Когда не использовать: если задача разовая, малая или требует мгновенного человеческого решения.

  7. 7
    Шаг 7

    Какой навык собрать: диспетчер агентского цикла, который создает план, раздает задачи и собирает отчет проверки.

Что сделать сегодня

Возьмите одну задачу, которую вы хотите «отдать агенту», и не начинайте с промпта. Сначала разложите ее на роли. Кто планирует? Кто исполняет? Кто проверяет? Какие файлы нужны? Какие команды разрешены? Где агент должен остановиться и спросить человека?

Если на эти вопросы нет ответа, агент пока не готов к долгой автономной работе. Но это хорошая новость: вам не нужно ждать следующую модель. Можно усилить уже доступные модели правильной системой вокруг них.

Источники

  1. Cursor: Scaling agents
  2. Claude Code: sub-agents