Как запускать ИИ-агентов надолго: уроки Cursor про план и проверку
Большинство людей оценивает ИИ-агента по короткой задаче: написал ли он функцию, исправил ли ошибку, собрал ли небольшой интерфейс. Но настоящая ценность автономных агентов видна в другой точке: могут ли они долго работать над большой задачей, не теряя фокус, не путая цель и не превращая проект в набор случайных правок.
В архиве журнала был сильный пример из блога Cursor про масштабирование агентов. Команда описывает эксперименты, где агенты работали долго: строили сложные системы, мигрировали кодовую базу и ускоряли реальную продуктовую часть. Важен не только масштаб эксперимента. Важна архитектура: агентская работа была разделена на роли и циклы.
Что произошло
По описанию Cursor, один из рабочих вариантов выглядел как конвейер. Планировщики анализируют кодовую базу и формируют задачи. Исполнители берут отдельные задачи и решают их, не пытаясь держать всю картину проекта. В конце цикла отдельный агент-судья решает, стоит ли продолжать работу. Следующая итерация начинается с чистого листа.
Это важная мысль для любой команды, которая пытается использовать агентов не только в коде. Долгая автономная работа требует не «самого умного помощника», а правильного разделения труда. У человека в голове смешаны стратегия, память, вкус, проверка и ответственность. У агентской системы эти роли лучше разнести.
| Роль | Что делает | Почему нельзя смешивать |
|---|---|---|
| Планировщик | разбирает цель и делает список задач | иначе исполнитель начинает сам менять смысл работы |
| Исполнитель | решает одну ограниченную задачу | так меньше хаоса и пересечений |
| Судья | проверяет результат и решает, продолжать ли цикл | исполнитель плохо оценивает собственную работу |
| Человек | задает цель, границы и принимает риск | ответственность нельзя спрятать внутрь модели |
Какой метод из этого следует
Метод можно перенести из разработки в бизнес-процессы. Если агент должен готовить отчет, обновлять сайт, проверять документы или вести контент-производство, ему нужен не один чат, а цикл работы.
Сначала отдельный шаг планирования: что должно измениться и какие материалы нужны. Потом исполнение: одна задача за раз. Потом проверка: что получилось, чем подтверждено, какие тесты или критерии пройдены. Потом решение: продолжать, остановиться, передать человеку или начать новый цикл.
Мы уже писали про суб-агентов в Claude Code и про правила работы с ИИ в коде. История Cursor добавляет к этому еще один уровень: автономность — это не свобода модели, а управляемый цикл с ролями.
Rich block render error: mapping values are not allowed here
in "<unicode string>", line 2, column 14:
title: Cursor: Scaling agents
^
label: первоисточник
title: Cursor: Scaling agents
url: https://cursor.com/blog/scaling-agents
description: В статье Cursor описывает эксперименты с длительной работой агентов и разделением ролей между планировщиками, исполнителями и проверкой.Где это применить вне кода
В редакции планировщик может выбирать темы и готовить источник-пакет, исполнитель пишет черновик, проверяющий ищет слабые места, а публикационный слой ставит материал в очередь. В продажах планировщик разбивает подготовку предложения, исполнитель собирает разделы, проверяющий ищет несоответствия требованиям. В юридической работе один агент вытаскивает условия, другой сравнивает с политикой, третий собирает список рисков.
Разница между «чат помог» и «агентская система работает» появляется именно здесь. Если задача повторяется, ее можно превратить в цикл. Если цикл можно проверить, его можно улучшать.
- 1Шаг 1
Когда использовать: задача большая, повторяемая и не помещается в один короткий ответ.
- 2Шаг 2
Что подать на вход: цель, материалы, критерии качества, список разрешенных действий и условия остановки.
- 3Шаг 3
Что сделать по шагам: выделить планировщика, исполнителя, проверяющего и человека, который принимает риск.
- 4Шаг 4
Какой результат получить: агентский цикл, который можно запускать много раз и улучшать по следу работы.
- 5Шаг 5
Как проверить качество: смотреть не только финальный результат, но и план, действия, ошибки, проверки и причины продолжения.
- 6Шаг 6
Когда не использовать: если задача разовая, малая или требует мгновенного человеческого решения.
- 7Шаг 7
Какой навык собрать: диспетчер агентского цикла, который создает план, раздает задачи и собирает отчет проверки.
Что сделать сегодня
Возьмите одну задачу, которую вы хотите «отдать агенту», и не начинайте с промпта. Сначала разложите ее на роли. Кто планирует? Кто исполняет? Кто проверяет? Какие файлы нужны? Какие команды разрешены? Где агент должен остановиться и спросить человека?
Если на эти вопросы нет ответа, агент пока не готов к долгой автономной работе. Но это хорошая новость: вам не нужно ждать следующую модель. Можно усилить уже доступные модели правильной системой вокруг них.