Почему ИИ не надо очеловечивать: как проектировать агента в Codex

ИИ-агент похож на человека только внешне: он отвечает словами, рассуждает в тексте, может просить уточнения и делать несколько шагов подряд. Из-за этого легко ждать от него человеческих качеств: устойчивой памяти, здравого смысла, интуиции, понимания важного и способности "один раз объяснили - он навсегда понял".

В рабочем процессе это опасная иллюзия. Модель не становится сотрудником только потому, что пишет естественным языком. Она остается вычислительной системой, которой нужны контекст, инструменты, правила, проверка и понятная среда. Если этого нет, агент начинает угадывать.

Google People + AI Guidebook полезен именно этим сдвигом: AI-продукт надо проектировать вокруг человеческих задач, ожиданий, ошибок, доверия и управления. Для Codex это переводится просто: не делайте вид, что агент "сам разберется". Опишите рабочий коридор.

Что здесь меняется

Плохой подход звучит так: "Codex, будь умным и сделай нормально". Хороший подход звучит иначе: "Вот цель, вот файлы, вот что нельзя трогать, вот как проверить, вот формат результата, вот где остановиться".

Это не бюрократия. Это замена мифа о цифровом человеке на инженерную систему.

Главное:

ИИ-агенту не нужно приписывать человеческую память и интуицию. Ему нужно дать среду: контекст, tools, правила, примеры, проверки и границы действий.

Из чего собрать агента

Слой Что дает агенту Что будет без него
Контекст факты, файлы, цель, ограничения агент угадывает задачу
Инструменты чтение файлов, тесты, браузер, API ответ остается разговором
Память устойчивые правила и решения ошибки повторяются
Проверки тесты, ревью, аудит результата уверенный текст без опоры
Запреты зоны, где нельзя действовать самому риск лишних правок и публикаций

В Codex роль такого слоя часто выполняют проектные инструкции. В документации OpenAI про AGENTS.md этот файл описывается как способ передать агенту правила работы с проектом: команды, стиль, проверки, структуру. Это практический антидот к очеловечиванию: не "будь внимателен", а "после правки запусти такой тест; этот каталог не трогай; новые зависимости не добавляй без объяснения".

Почему это важно для бизнеса

В компании агент быстро получает слишком много символической власти. Он пишет письма, готовит документы, меняет код, анализирует заявки, собирает отчеты. Если человек считает его "почти сотрудником", то начинает доверять там, где нужна проверка.

OWASP Top 10 for LLM Applications напоминает о другом языке описания: prompt injection, неправильная обработка вывода, лишняя автономность, утечки, чрезмерное доверие. Это не психологические черты агента. Это свойства системы вокруг модели.

Как применить это в Codex

Минимальный набор для задачи:

  1. Цель: что должно измениться.
  2. Границы: какие файлы и действия не трогать.
  3. Источники: откуда брать факты.
  4. Проверка: какая команда или ручная приемка подтверждает результат.
  5. Отчет: что Codex должен сказать в конце.

Такой формат делает агента не "разумнее", а управляемее. И это важнее. Умная модель без процесса все равно может сделать красивую ошибку. Средняя модель с хорошим контуром часто дает более надежный результат.

В NIST AI Risk Management Framework управление рисками описывается как постоянная работа, а не как разовая настройка. Для ИИ-агента это означает: правила, проверки и границы должны обновляться после реальных ошибок.

Какой навык собирается: проектировать агента как рабочую систему, а не как цифрового человека.