Как принимать результат Codex по доказательствам
Самая опасная форма доверия к ИИ - принимать результат по уверенности ответа. Codex может красиво объяснить, что сделал, но владельцу проекта нужно другое: доказательства. Что именно изменилось, какие проверки запускались, где остался риск, что не получилось и какой следующий шаг требует решения человека.
OpenAI в описании Codex пишет, что агент показывает проверяемые следы действий: терминальные логи, результаты тестов и шаги выполнения. Для не-программиста это можно перевести в практику приемки: просить не просто "готово", а evidence pack - пакет доказательств.
Evidence pack нужен не только для кода. Его можно применять к статье, странице сайта, таблице, клиентскому материалу, исследованию, очереди публикаций или любому рабочему артефакту, где важно не потерять ответственность.
Что должно быть в evidence pack
Хороший пакет доказательств короткий. Он не заваливает человека техническими деталями, но показывает достаточно, чтобы принять или отклонить результат.
Главное:Принимайте результат Codex не по красивому резюме, а по доказательствам: что изменено, какие проверки выполнены, что не удалось, где риск и какое решение нужно принять человеку.
Рабочий запрос
Перед тем как считать работу готовой, собери evidence pack.
Верни:
- краткий итог результата;
- что именно изменено или подготовлено;
- какие проверки ты выполнил;
- какие проверки не удалось выполнить и почему;
- какие риски остались;
- что мне нужно посмотреть вручную;
- решение на выбор: принять, вернуть на доработку, уточнить вводные, отложить.
Не скрывай неудачные проверки.
| Блок | Что в нем должно быть | Зачем человеку |
|---|---|---|
| результат | что готово | понять предмет приемки |
| изменения | какие файлы или части затронуты | увидеть объем |
| проверки | что запускалось или сравнивалось | не верить на слово |
| риски | что осталось спорным | решить, можно ли выпускать |
| отклонения | что не получилось | не прятать слабые места |
| решение | принять, вернуть, уточнить | сохранить ответственность |
Такой запрос меняет тон работы. Codex перестает быть собеседником, которому нужно поверить. Он становится исполнителем, который приносит результат и след проверки. Это спокойнее и для человека, и для проекта.
Где остановиться
Evidence pack не отменяет человеческую приемку. Если речь о публикации, деньгах, клиентском обещании, юридической позиции или доступах, решение остается за человеком. Codex может собрать доказательства и показать риски, но не должен сам превращать "похоже, работает" в "можно выпускать".
Именно так Codex становится must-have для бизнеса: не потому что он всегда прав, а потому что с ним можно сделать работу проверяемой. А проверяемая работа лучше, чем уверенный текст без следов.