Метки зрелости Codex: как понять, что можно запускать в работу, а что оставить в пилоте
Проблема не в новой функции, а в неправильном уровне доверия
Когда команда начинает пользоваться Codex, соблазн понятен: появилась новая возможность, значит ее надо сразу встроить в рабочий процесс. Сегодня это может быть automation, завтра browser, потом plugin, MCP, review, subagent или другой способ передать агенту часть работы.
Но новая функция и рабочий процесс - не одно и то же. Функция может быть полезной, но еще не подходить для production. Или, наоборот, быть достаточно зрелой, но команда все равно использует ее как игрушку, без правил, владельца и проверки результата.
Поэтому перед внедрением полезен простой вопрос: на каком уровне доверия мы сейчас находимся? Не "нравится ли нам функция", а "можно ли давать ей живой процесс, клиентский материал, публикацию, деньги, доступы или репутационный риск".
У Codex для этого есть прямой ориентир: метки зрелости функций.
Что официально означают метки зрелости Codex
В официальной документации OpenAI по Feature Maturity сказано, что некоторые функции Codex поставляются с меткой зрелости. Такая метка помогает понять надежность функции, вероятность изменений и ожидаемый уровень поддержки.
Смысл простой:
| Метка | Как читать для работы |
|---|---|
| Under development | Не использовать в рабочем процессе. Это еще не готовая поверхность. |
| Experimental | Можно пробовать на свой риск, но не строить на этом обязательный контур. |
| Beta | Подходит для оценки и пилотов. Нужно ожидать небольших изменений. |
| Stable | Можно рассматривать для широкого production-использования, но с обычными правилами доступа, проверки и ответственности. |
Эта таблица не заменяет здравый смысл. Она только снимает первую иллюзию: не каждая функция, которую можно включить, уже готова быть частью обязательного процесса.
Как превратить метку в рабочее решение
Для владельца проекта метка зрелости нужна не как справка, а как gate. Перед внедрением нужно решить, в какую зону попадает сценарий:
- Stop: не используем.
- Experiment: пробуем на безопасных примерах.
- Pilot: запускаем ограниченно, с владельцем и датой пересмотра.
- Production: используем в живом процессе, но с проверкой результата и правами доступа.
Например, если команда хочет использовать новую возможность Codex для публикационного процесса, вопрос не в том, "умеет ли агент это сделать". Вопрос в том, что произойдет, если функция изменится, зависнет, поведет себя иначе или потребует ручного подтверждения в неожиданный момент.
Хороший gate не запрещает новое. Он не дает новому попасть не в тот слой ответственности.
Таблица: production, pilot, experiment или stop
Перед запуском удобно собрать короткую таблицу.
| Что проверяем | Stop | Experiment | Pilot | Production |
|---|---|---|---|---|
| Мaturity label | Under development | Experimental | Beta | Stable |
| Где можно использовать | Нигде в процессе | Черновики и тестовые данные | Ограниченный участок | Регулярный рабочий контур |
| Что обязательно | Не включать | Не давать реальные доступы | Владелец, срок, fallback | Проверка, права, журнал решений |
| Что нельзя | Обещать результат | Завязывать клиента или публикацию | Делать невидимой автоматизацией | Снимать человеческую ответственность |
Для ONFF-подобного журнала это особенно важно. Одно дело - попросить Codex набросать структуру статьи. Другое - разрешить автоматике публиковать, ставить посты в очередь, менять визуалы или обновлять живую страницу. Чем ближе действие к внешнему миру, тем строже gate.
Что дать Codex на вход
Codex можно попросить не просто "оценить функцию", а собрать рабочую карту внедрения.
Дайте ему:
- список функций или сценариев, которые команда хочет использовать;
- текущую метку зрелости из официальной документации;
- описание процесса: черновик, внутренний документ, клиентская работа, публикация, финансы, безопасность;
- что считается ошибкой;
- кто проверяет результат;
- как быстро можно откатиться.
Хороший запрос звучит так: "Собери maturity gate для этих Codex-сценариев. Раздели их на stop, experiment, pilot и production. Для каждого укажи риск, владельца проверки, границу пилота и правило отката".
На выходе нужен не совет в стиле "можно попробовать", а таблица, по которой человек принимает решение.
Как проверить результат без программирования
Непрограммист может проверить такую карту по пяти признакам.
Первый: в production не попали функции с меткой Under development или Experimental.
Второй: Beta-сценарии не названы "полностью готовыми". У них есть пилот, дата пересмотра и fallback.
Третий: Stable-функции не получили магического статуса "можно без контроля". У них все равно есть правила доступа, проверки результата и человеческий владелец.
Четвертый: для каждого внешнего действия есть вопрос "что увидит клиент, читатель или пользователь, если это сработает неправильно".
Пятый: у карты есть следующий шаг. Например: "две недели пилота на внутренних материалах", "три успешных прогона перед публикацией", "ручное подтверждение перед отправкой", "возврат к старому процессу при ошибке".
Если этих признаков нет, карта слишком декоративная. Она не управляет риском.
Где остается человеческое решение
Codex может помочь собрать факты, разложить функции по зрелости, сравнить риски и предложить границы пилота. Но решение остается у человека.
Человек решает:
- какой риск допустим для этого процесса;
- где нужен ручной review;
- кому принадлежит результат;
- можно ли использовать функцию на клиентских или публичных материалах;
- когда пилот становится production.
Это особенно важно для автоматизаций. Если процесс работает сам, ошибка тоже может распространяться сама. Метка зрелости помогает не перепутать удобство с ответственностью.
Мини-карта внедрения для команды
Для начала хватит одной страницы.
| Поле | Что записать |
|---|---|
| Сценарий | Что именно Codex должен делать |
| Функция | Какая Codex-поверхность используется |
| Мaturity label | Under development, Experimental, Beta или Stable |
| Режим | Stop, experiment, pilot или production |
| Владелец | Кто принимает результат |
| Проверка | Что человек смотрит перед доверием |
| Fallback | Что делать, если функция изменилась или дала сбой |
| Дата пересмотра | Когда вернуться к решению |
Так Codex перестает быть набором новых кнопок и становится управляемым рабочим инструментом. Новые функции можно пробовать быстрее, но не вслепую. Зрелые функции можно запускать шире, но не без правил. А команда получает общий язык: это не спор "нравится или не нравится", а понятное решение - stop, experiment, pilot или production.