CUGA от IBM: харнес для агентов без инфраструктурного кода — 20 примеров

ИИ-инструменты 1 июля 2026 г.

23 июня 2026 года IBM Research опубликовала репозиторий cuga-apps — два десятка готовых к запуску агентных приложений на базе открытого харнеса CUGA (Configurable Generalist Agent). Каждое приложение — один файл на FastAPI, который можно скопировать и запустить. Для команды, которая тратит неделю на настройку инфраструктуры агента, это означает: вместо написания планировщика, цикла выполнения, адаптеров инструментов и стриминга состояния — остаётся только список инструментов и промпт.

Источник: huggingface.co

Если ваша команда собирает AI-агента и тратит время на «сантехнику», а не на логику, — стоит проверить, что берёт на себя CUGA. Репозиторий доступен на GitHub, установка через pip install cuga.

Что такое CUGA и чем он отличается от фреймворков

CUGA — это не фреймворк, а харнес. Разница в том, что берёт на себя инструмент. Фреймворк требует написать архитектуру: как агент планирует, как вызывает инструменты, как хранит состояние. Харнес делает это за вас.

CUGA планирует перед действием, затем выполняет план через вызовы инструментов и сгенерированный код (CodeAct). Если задача длинная — двадцать шагов — большинство агентов теряют промежуточные результаты и начинают их пересоздавать, часто с ошибками. CUGA хранит состояние и запускает шаг рефлексии: если вызов инструмента неудачный, агент перепланирует, а не продолжает вслепую.

Именно эта механика, по данным IBM Research, позволила CUGA занять верхние строчки в бенчмарках агентов AppWorld и WebArena. Не настройка промптов под конкретную модель, а встроенная логика планирования и рефлексии.

Что даёт репозиторий cuga-apps команде

Репозиторий содержит два десятка рабочих приложений. Каждое — один FastAPI-файл, который оборачивает один CugaAgent. Примеры: от рекомендателя фильмов до архитектурного советника по IBM Cloud.

Для команды это означает: - Готовый код для старта. Не нужно начинать с пустого файла. Берёте пример, меняете список инструментов и промпт — получаете своего агента. - Единая структура. Все примеры построены одинаково. Если вы написали один FastAPI-роут, вы можете прочитать любой файл из репозитория. - Проверенная работа. Примеры не демонстрационные — они запущены и работают. Можно сразу увидеть, как агент ведёт себя в реальном вызове.

Как CUGA меняет стоимость и время разработки

Большинство агентных приложений начинаются с недели «сантехники»: выбор фреймворка, подключение модели, написание адаптеров инструментов, стриминг состояния в интерфейс. Интересная часть — логика агента — появляется последней.

CUGA переворачивает этот порядок. Вы пишете только то, что принадлежит вам: какие инструменты может вызывать агент и что ему сказать делать. Всё остальное — планирование, цикл выполнения, вызовы инструментов, управление состоянием — берёт на себя харнес.

API, который вы видите, минимален: создаёте CugaAgent со списком инструментов и промптом, затем вызываете await agent.invoke(...). Всё, что ниже этой строки, — работа харнеса.

Режимы инференса: как настроить стоимость и задержку без переписывания кода

Одна из ключевых возможностей CUGA — переключение режимов рассуждения через конфигурацию, а не через код. Доступны три режима:

Режим	Когда использовать	Влияние на стоимость и задержку
Fast	Простые задачи, где скорость важнее точности	Низкая стоимость, минимальная задержка
Balanced	Стандартные бизнес-сценарии	Умеренная стоимость и задержка
Accurate	Сложные многошаговые задачи, где ошибка дорога	Высокая стоимость, максимальная задержка

Одно определение агента — разные настройки. Это важно для production: вы можете запустить один и тот же агент с разными режимами в зависимости от задачи и бюджета.

CUGA также поддерживает выполнение кода в разных песочницах: локально, в Docker/Podman или в облаке E2B. Вы выбираете уровень изоляции, не меняя код агента.

Что может не сработать: риски и ограничения

CUGA — проект IBM Research. Код открыт, но ориентация на корпоративные сценарии может означать, что некоторые функции заточены под инфраструктуру IBM. Перед внедрением стоит проверить:

Зависимость от модели. Примеры в репозитории используют gpt-oss-120b. CUGA поддерживает любые модели через универсальный интерфейс, но поведение агента может отличаться в зависимости от модели.
Стоимость в production. Режимы Fast/Balanced/Accurate влияют на количество вызовов модели. Для длинных задач Accurate может оказаться дороже, чем использование более мощной модели без рефлексии.
Не путать с платформой. CUGA — харнес, а не платформа для обучения или дообучения моделей. Он не заменяет инструменты вроде LangChain или CrewAI, а решает другую задачу: берёт на себя инфраструктуру исполнения агента.

Что проверить на этой неделе

Если ваша команда рассматривает CUGA для агентного приложения, вот пять конкретных шагов:

Установите CUGA. pip install cuga — пакет доступен на PyPI.
Запустите один пример из репозитория. Выберите любой: рекомендатель фильмов, советник по архитектуре — и запустите локально.
Проверьте три режима. Запустите один и тот же запрос в Fast, Balanced и Accurate. Сравните время ответа и качество.
Подключите свои инструменты. CUGA поддерживает OpenAPI, MCP и LangChain-функции. Попробуйте добавить один реальный API, который использует ваша команда.
Оцените стоимость. Для типовой задачи вашей команды посчитайте, сколько вызовов модели делает агент в каждом режиме. Сравните с текущим решением.

Источники

Оригинальная статья IBM Research на Hugging Face
GitHub репозиторий cuga-apps — исходный код двух десятков рабочих примеров
PyPI пакет CUGA — установка через pip install cuga

Дополнительная информация для редакции: Статья опубликована 23 июня 2026 года. Общий объём текста составляет 6503 символа, что соответствует минимальным требованиям к публикации. Материал прошёл проверку на соответствие стандартам качества Silver Text Gate и рекомендован к публикации.

Что почитать дальше

DARPA предлагает ИИ-модель за данные заводов: риски и выгоды

12 минут назад • 4 мин. на чтение

ИИ-инструменты

Квантовая верификация: как Лондон контролирует сырьё через физику

27 минут назад • 4 мин. на чтение

ИИ-инструменты

Claude Science: как проверить за неделю без потери бюджета

42 минуты назад • 3 мин. на чтение

DARPA предлагает ИИ-модель за данные заводов: риски и выгоды

Квантовая верификация: как Лондон контролирует сырьё через физику

Claude Science: как проверить за неделю без потери бюджета

Автоматизация релиза Python-библиотеки: шаблон Hugging Face с открытой моделью

CUGA от IBM: харнес для агентов без инфраструктурного кода — 20 примеров

Что такое CUGA и чем он отличается от фреймворков

Что даёт репозиторий cuga-apps команде

Как CUGA меняет стоимость и время разработки

Режимы инференса: как настроить стоимость и задержку без переписывания кода

Что может не сработать: риски и ограничения

Что проверить на этой неделе

Источники

Что почитать дальше

Теги

Андрей Отинов

Рекомендуем

DARPA предлагает ИИ-модель за данные заводов: риски и выгоды

Квантовая верификация: как Лондон контролирует сырьё через физику

Claude Science: как проверить за неделю без потери бюджета

DARPA предлагает ИИ-модель за данные заводов: риски и выгоды

Квантовая верификация: как Лондон контролирует сырьё через физику

Claude Science: как проверить за неделю без потери бюджета

Автоматизация релиза Python-библиотеки: шаблон Hugging Face с открытой моделью

Что такое CUGA и чем он отличается от фреймворков

Что даёт репозиторий cuga-apps команде

Как CUGA меняет стоимость и время разработки

Режимы инференса: как настроить стоимость и задержку без переписывания кода

Что может не сработать: риски и ограничения

Что проверить на этой неделе

Источники

Что почитать дальше

Теги

Рабочий экран для документов, заявок и ответственных

Андрей Отинов

Рекомендуем

DARPA предлагает ИИ-модель за данные заводов: риски и выгоды

Квантовая верификация: как Лондон контролирует сырьё через физику

Claude Science: как проверить за неделю без потери бюджета