Роботизированная рука LeRobot 101 под управлением AI-агента в пилоте с code-as-policy: захват объекта и риск перегрева моторо

Code-as-policy для робототехники: как AI-агент удешевляет пилот и где проверить риск перед стартом

ИИ-инструменты 26 июня 2026 г.

Журналист WIRED подключил AI-агент OpenClaw к готовой роботической руке LeRobot 101 из экосистемы HuggingFace: система помогла настроить соединения, откалибровать суставы, написать скрипт для захвата красного шарика и затем поддержала обучение модели, которая начала поднимать предметы. Для бизнеса это важно не как эффектный трюк, а как сдвиг точки входа в робототехнику: первый рабочий пилот становится дешевле и доступнее, но цена ошибки тоже становится видимой — неправильная калибровка уже может перегреть моторы. Практический вывод такой: если вы думаете о физической автоматизации, сначала проверяйте, можно ли ограничить задачу, обезопасить железо и измерить результат, а не сразу заказывать «большую» интеграцию.

Что именно произошло на практике

Суть эксперимента проста и поэтому показательная. Автор взял не абстрактную симуляцию, а реальную руку LeRobot 101. У этой платформы две части: управляющая рука, которой человек двигает через ручку и курок, и ведомая рука с камерой, повторяющая движение. На таких платформах удобно собирать данные через телеуправление: человек двигает контроллер, а модель учится по изображению повторять это действие.

Дальше подключили AI-агента. OpenClaw вместе с Codex помогли пройти то, что обычно съедает часы у новичка: подключение, калибровку, настройку и первый рабочий код. В результате получился не «универсальный интеллект», а несколько очень конкретных вещей: рука сделала взмах, затем научилась закрывать захват, когда видела красный шарик, а потом стала помогать обучать модель, которая уже могла поднимать предметы.

Это и есть главная перемена. Раньше между идеей и демонстрацией стояла плотная инженерная прослойка. Теперь часть этой прослойки начинает писать сама модель, если ей дать понятный контур задачи и контролируемое оборудование.

Почему это меняет цену, срок и риск пилота

Для владельца или руководителя проекта важен не термин code-as-policy сам по себе, а изменение экономики пилота. Подход «код как политика» означает, что модель пишет не просто объяснение, а исполнимый код поведения робота: как соединиться, как откалибровать, как распознать объект, как двигать захват, как оценить ошибку после прогона.

Это сдвигает стоимость в трех местах:

  1. Меньше редкой экспертизы на старте. Не нужно сразу нанимать узкого робототехника только ради первого теста.
  2. Быстрее проверка гипотезы. Можно быстрее понять, есть ли вообще смысл автоматизировать конкретную операцию.
  3. Выше риск на железе. Если модель ошиблась в настройке, ошибка становится физической: в статье моторы уже перегревались из-за неверных параметров.

Ниже — короткая рамка для решения.

Что меняется Почему важно бизнесу Что проверить
Настройку и часть кода берет на себя AI-агент Сокращается путь до первого рабочего прототипа Есть ли четкая граница задачи и безопасные параметры
Данные собирают через телеуправление на открытой платформе Можно быстро получить свой датасет под конкретную операцию Повторяемо ли движение и одинаков ли объект
Обучение идет по схеме code-as-policy Модель управляет не «словами», а процедурой Кто утверждает скрипт и как ловятся ошибки
Бенчмарки вроде CaP-X сравнивают кодовые модели для роботов Выбор модели нельзя делать по общему чату или маркетингу Есть ли тест именно на вашей задаче, а не «в среднем по больнице»

Главная деловая мысль здесь такая: робототехнический пилот можно удешевить, если использовать AI как ускоритель инженерного цикла, но нельзя отменить контроль качества и безопасность. Экономия появляется не от магии, а от более короткого цикла «собрал — проверил — поправил».

Как проверить, подходит ли этот подход вашему участку

Не всякая операция годится для code-as-policy. Подход хорошо работает там, где есть повторяемый объект, ограниченная зона, понятный визуальный сигнал и допустимый человеческий контроль. Если задача каждый раз выглядит по-новому, если цена ошибки высока или если предметы непредсказуемы, пилот быстро превратится в дорогую игру с калибровкой.

Перед стартом полезно ответить на пять вопросов:

  • объект одинаковый по форме, размеру и расположению;
  • камера видит его стабильно;
  • ошибка не ломает линию и не портит дорогой товар;
  • человек может остановить процесс в любой момент;
  • успех можно измерить в процентах захвата, времени цикла или числе ручных вмешательств.

Если на два-три пункта ответ «нет», робототехнический эксперимент лучше не начинать с автономии. Начинать нужно с простой телемеханики и сборки данных. В статье именно это и сработало: сначала человек много помогал системе, потом модель стала полезнее.

Где ломается модель и где прячется риск

Самая неприятная часть истории — не красный шарик, а перегрев моторов. Автор несколько часов пытался подключить и откалибровать руку, и один неправильный режим почти повредил оборудование. Это важнее любой красивой демонстрации, потому что показывает реальную цену «галлюцинации» в физическом мире.

У такого подхода есть четыре типовых риска:

  • Неверные настройки железа. Ошибка в параметрах может повредить привод или ускорить износ.
  • Хрупкость кода. Модель может написать рабочий фрагмент, но промахнуться в деталях библиотеки или драйвера.
  • Зависимость от конкретной платформы. То, что сработало на LeRobot 101, не обязано сразу заработать на другой руке.
  • Переоценка бенчмарка. CaP-X и CaP-Gym важны, но они не заменяют ваш реальный участок, свет, камеру и товар.

Отдельно стоит отметить результат CaP-X: в этой работе кодовые модели для роботов сравнивали не по красоте текста, а по способности управлять действиями. И там сильнее оказался Gemini, а не Claude или ChatGPT. Для бизнеса это сигнал не о «победе модели», а о другом: выбирать нужно не самый известный чат-бренд, а тот вариант, который лучше работает с визуальными и физическими задачами именно в вашем контуре.

Как работать по схеме code-as-policy без лишнего героизма

Практический сценарий для компании выглядит не как «включили ИИ и забыли», а как короткий управляемый цикл.

  1. Выберите одну простую операцию. Например, захват одного типа объекта на фиксированном столе.
  2. Поставьте открытый или тестовый контур. На старте лучше брать платформу вроде LeRobot, где проще увидеть, что именно пошло не так.
  3. Снимите телеуправляемые примеры. Это дает модели базу для обучения без дорогого ручного программирования каждого движения.
  4. Попросите AI сгенерировать не только код, но и проверку. В статье агент не просто писал скрипт, а помогал смотреть на ошибку после каждого прогона.
  5. После каждого запуска фиксируйте результат. Не «похоже, стало лучше», а конкретный процент успеха, количество сбоев и температуру/нагрузку железа.
  6. Сразу задайте стоп-условие. Если растет температура, сбивается калибровка или падает точность, пилот останавливается.

Такой режим дисциплинирует ожидания. Он позволяет использовать AI не как замену инженеру, а как ускоритель рутины: подключение, черновой код, первичная отладка, повторные прогоны. Именно в этой зоне сейчас и лежит практическая польза.

Что делать на этой неделе

Если вы хотите проверить подход без лишних затрат, не начинайте с большого проекта. Возьмите один рабочий сценарий и пройдите по короткому списку.

  • Опишите одну повторяемую операцию. Не «автоматизировать склад», а, например, «захватить и переложить один тип предмета».
  • Оцените цену ошибки. Что случится, если рука промахнется, уронит объект или уйдет в неверную калибровку?
  • Проверьте, есть ли безопасная платформа для теста. Лучше открытая или учебная рука, чем дорогой промышленный узел.
  • Назначьте человека, который останавливает пилот. Без владельца безопасности эксперимент быстро разъедетcя.
  • Определите метрику успеха. Процент успешных захватов, время цикла, число ручных исправлений.
  • Запустите сначала телеуправление, а не автономию. Сначала данные и повторяемость, потом умный код.

Если после этого задача выглядит стабильной, можно переходить к code-as-policy и пробовать, насколько AI ускоряет сборку и отладку. Если нет — это тоже полезный результат: вы сэкономили железо и время команды.

Источники

Генерация изображения

  • Модель: gpt-5-image
  • Провайдер: openrouter

Теги