Скриншот помещен в рамку проверки, рядом отделены видимый факт и граница предположения

Скриншот как задача для Codex: как показать проблему и не потерять проверку

ИИ-инструменты 9 июня 2026 г.

Некоторые задачи плохо начинаются с текста. На экране уже все видно: кнопка съехала, таблица странно обрезалась, ошибка закрывает важный блок, график выглядит подозрительно, слайд не читается, макет не совпадает с ожиданием. Человек может потратить десять минут на описание того, что Codex увидел бы за секунду на скриншоте.

Но скриншот не магия. Он показывает только видимое состояние. Если отправить картинку без рамки задачи, Codex может начать угадывать: что находится ниже экрана, какая логика в коде, какие данные были до ошибки, что вы считаете хорошим результатом.

Полезный навык в другом: приложить изображение как доказательство, а не как замену брифа. Скриншот должен отвечать за видимые факты. Текст рядом должен задавать цель, границы, формат результата и точку, где Codex обязан спросить человека.

Почему скриншот ускоряет задачу, но не заменяет контекст

Скриншот хорошо передает форму проблемы. Он снимает лишние слова там, где словами легко ошибиться: "слева", "внизу", "рядом с кнопкой", "после блока с тарифами", "в модальном окне". Для визуальной проверки, ошибки интерфейса, макета, графика, слайда или PDF это часто самый быстрый вход.

Но картинка почти никогда не отвечает на вопрос "что делать дальше". На ней может быть видно, что текст налезает на кнопку. Не видно, можно ли менять дизайн-систему. Видно, что в отчете странная цифра. Не видно, какая выгрузка считается источником истины. Видно, что в приложении ошибка. Не видно, можно ли трогать production.

Поэтому скриншот нужен как первый слой контекста. Он помогает Codex понять видимое состояние, но решение о задаче остается в брифе.

Что именно разрешает документация Codex

В документации Codex описаны image inputs: можно приложить изображения к prompt, вставить картинку в composer или передать файл через CLI с --image или -i. В примерах документации Codex может объяснить ошибку по screenshot.png или суммировать несколько диаграмм.

Отдельно описаны Appshots. Это возможность в Codex app отправить в тред переднее окно приложения. В пакет Appshot входит изображение видимого окна. Документация отдельно напоминает: appshots нужно проверять так же, как обычные скриншоты и документы. Для некоторых приложений Codex может получить только видимую картинку, а не весь скрытый текст или невидимую часть документа.

Это важная граница. Официальный источник подтверждает, что Codex умеет принимать изображение как контекст. Он не говорит, что одно изображение автоматически дает полный контекст системы.

Как приложить изображение так, чтобы Codex не гадал

Хороший ввод состоит из двух частей: изображение и короткий текстовый контракт.

Минимальный вариант:

Посмотри на этот скриншот. Сначала перечисли только то, что реально видно. Потом отдели предположения, которые требуют проверки. После этого предложи план исправления. Код и файлы не меняй, пока я не подтвержу план.

Для интерфейса можно точнее:

На скриншоте мобильная версия страницы /pricing. Проверь видимые проблемы: наложение текста, кнопки, отступы, читаемость, порядок блоков. Верни список проблем с местом на экране и предложи план правок. Не делай выводов о desktop-версии, если ее нет на изображении.

Для ошибки:

На скриншоте ошибка после импорта файла. Объясни, что видно, какие причины можно предположить, какие данные нужны для проверки и какой первый безопасный шаг сделать. Не проси секреты, токены и пароли.

Главная формула простая: "что видно", "что нужно получить", "что нельзя угадывать", "где остановиться".

Какой артефакт просить вместо общего мнения

Если спросить "что думаешь?", Codex вернет мнение. Для работы лучше просить артефакт.

Часть ответа Что должна дать
Видимые факты Только то, что можно проверить на изображении
Возможные причины Версии, которые требуют файла, кода, данных или ссылки
Риск Что нельзя менять или утверждать по одному скриншоту
План Что проверить первым, вторым и третьим
Артефакт Список правок, таблица проблем, отчет, acceptance checklist
Вопросы Что нужно уточнить у человека перед действиями

Такой формат защищает от двух крайностей. Codex не застревает на описании картинки, но и не перепрыгивает сразу к уверенным выводам.

Как проверить ответ без программирования

Проверка начинается не с кода, а с картинки. Прочитайте ответ Codex и сравните его со скриншотом.

Первый вопрос: все ли названное действительно видно? Если Codex пишет про блок, которого нет на изображении, это предположение, а не факт.

Второй вопрос: отделены ли предположения от наблюдений? Фраза "вероятно, проблема в CSS" может быть полезной, если она помечена как версия. Она опасна, если подана как доказанный факт.

Третий вопрос: есть ли критерий готовности? Например: "после правки на новом скриншоте кнопка не перекрыта текстом, заголовок читается, блок тарифов помещается в экран без горизонтальной прокрутки".

Четвертый вопрос: есть ли безопасная остановка? Для рабочей задачи это может быть "сначала верни план", "не меняй исходные файлы", "не публикуй", "не отправляй клиенту", "не трогай production".

Когда одного скриншота недостаточно

Одного изображения мало, если задача зависит от данных, истории действий, скрытых вкладок, кода, прав доступа, нескольких экранов или поведения после клика. Скриншот может показать симптом, но не всегда показывает причину.

В таких случаях нужно добавить источник: файл, ссылку, второй скриншот, экспорт, лог, макет, browser-доступ или точное описание шагов воспроизведения. Если речь о документе или презентации, лучше приложить исходный файл, а не только видимый фрагмент.

Отдельная граница — чувствительные данные. Перед отправкой скриншота проверьте, нет ли на нем токенов, паролей, персональных данных, закрытых клиентских деталей, платежной информации или внутренних ключей. Codex может помочь с анализом, но человек отвечает за то, что попадает во вход.

Практическая карточка скриншота для Codex

Перед отправкой изображения проверьте семь строк.

Изображение: какой скриншот, Appshot или файл приложен.

Цель: что нужно понять или исправить.

Видимые факты: попросите Codex начать только с того, что видно.

Граница: что нельзя утверждать по одному изображению.

Артефакт: список проблем, план, таблица, отчет или checklist.

Проверка: как человек сравнит результат с новым видимым состоянием.

Решение человека: когда Codex должен остановиться и спросить разрешение.

Тогда скриншот становится не иллюстрацией к просьбе "посмотри", а рабочим входом в задачу. Codex видит проблему быстрее, но не получает права угадывать невидимое.

Теги