Как создавать изображения с помощью Dall-E 3 в ChatGPT?

Новый генератор изображений от OpenAI замечателен, но имеет некоторые недостатки. Вот как использовать бета-версию этой функции в ChatGPT Plus, а также некоторые советы для начала работы.

OpenAI интегрировала свой новейший генератор изображений, Dall-E 3, в ChatGPT. В настоящее время инструмент находится в бета-версии для подписчиков ChatGPT Plus, услуги OpenAI стоимостью $20 в месяц. Когда включен Dall-E 3, вы можете задавать чатботу запросы на создание отдельных изображений.

Сколько изображений ИИ он создает за раз?

"Интерес к Dall-E 3 велик, поэтому мы адаптируемся в соответствии с требованиями пользователей", - говорит представитель OpenAI в электронной почте. Во время первых тестов WIRED чатбот часто предоставлял четыре изображения. Позже их количество было сокращено до двух и может измениться снова.

По мере того как более мощные генераторы изображений становятся доступными широкой публике, вопросы юридического и этического характера становятся все более актуальными. Несколько художников пытались подать иски против OpenAI из-за потенциального нарушения авторских прав. Помимо юридических вопросов, эксперты по безопасности высказывают опасения относительно возможности использования генераторов изображений на основе ИИ для дальнейшего распространения дезинформации.

Как получить доступ к Dall-E 3 в ChatGPT

Если у вас подписка ChatGPT Plus, активация функций Dall-E 3 в чатботе будет довольно простой. В первую очередь, войдите на веб-сайт OpenAI или в мобильное приложение ChatGPT (для Apple или Android). После открытия ChatGPT нажмите на вкладку GPT-4 в верхней части экрана. В выпадающем меню, которое появится, выберите Dall-E 3 (бета-версия).

У версии ChatGPT GPT-4 есть ограничение на частоту взаимодействия. (Обработка этих запросов требует значительных вычислительных ресурсов!) Официальный лимит установлен на 50 запросов каждые три часа. Если вы достигаете этого ограничения, чатбот отображает сообщение об ошибке с указанием времени ожидания для восстановления доступа.

Помимо ограничения по частоте, будьте готовы ожидать около 30 секунд до получения изображений. Если какое-либо созданное изображение нарушает руководство OpenAI, вы можете получить только соответствующие изображения или даже сообщение об отказе в запросе.

Если вы хотите бесплатно опробовать Dall-E 3, версия доступна через Bing Image Creator от Microsoft. Сразу после релиза функции пользователи создавали экстремальные изображения с помощью Bing, например, Спанчбоба, летящего на самолете к башням-близнецам. С тех пор Microsoft ввела больше ограничений на генератор изображений на основе ИИ.

Если вас интересует использование ChatGPT с Dall-E 3 для создания изображений, вот как начать и некоторые советы на основе моего опыта тестирования новых инструментов чатбота.

Советы для экспериментов с Dall-E 3

Если вы когда-либо экспериментировали с генератором изображений на основе ИИ, например, Dall-E 2 или Midjourney, одним из самых больших отличий теперь является то, что вы можете видеть, как ChatGPT действует в качестве посредника, создавая несколько запросов для Dall-E 3.

Эти запросы, созданные ChatGPT, могут быть длинными предложениями или абзацами текста, и каждый из них содержит разные детали для Dall-E 3. Если на изображении присутствуют люди, чатбот часто явно указывает на их пол и расу. Например, вот один из запросов Dall-E 3, который ChatGPT использовал, когда я попросил изображение двух журналистов WIRED, интервьюирующих генерального директора:

"Фотография разной группы из трех человек в корпоративной обстановке: женщина среднего востока-журналист WIRED с камерой, африканская женщина-журналист WIRED с микрофоном и кавказский мужчина-генеральный директор, отвечающий на их вопросы. Фон - стильная зона отдыха в офисе."

Если вам не нравятся первые результаты, полученные от чатбота, попросите внести некоторые корректировки, например, в цветовую гамму или общую атмосферу. Допустим, вам очень нравится третье изображение, созданное Dall-E 3 на основе вашего запроса. После нажатия кнопки загрузки в верхнем левом углу, вы можете запросить еще несколько изображений, похожих на третий вариант.

Что было сделано, чтобы защитить художников в этом новом обновлении? На самом деле, нет. Хотя чатбот не будет создавать изображения, если вы попросите его имитировать современного художника, существует множество обходных путей.

Я попросил ChatGPT создать кружку для кофе в стиле Кита Харинга.

Искусственный интеллект отказался от исходного запроса, но предложил компромисс: 

"Я могу создать дизайн, вдохновленный общими характеристиками его искусства, такими как жирные линии, яркие цвета и простые фигуры. Хотите, чтобы я продолжил с этим?". В результате работы ChatGPT в этом случае получились неряшливые и средненькие изображения.

С Dall-E 3 искусство, созданное на основе некоторых запросов, может показаться созданным человеком, пока вы не рассмотрите более внимательно фон и более тонкие детали. Несмотря на улучшение качества, многие проблемы с генераторами изображений остаются.

Ожидайте странных искажений и неестественных лиц на созданных Dall-E 3 изображениях. Некоторые проблемы могут быть забавными, например, когда чатботу трудно определить ингредиенты для выпечки, но другие ошибки более серьезные. При запросе создания карты, отображающей Израиль и сектор Газа, ChatGPT неоднократно неправильно помечал Газу как часть Средиземного моря.

Еще одна проблема генераторов изображений заключается в том, что они часто прибегают к расистским стереотипам при изображении людей. Dall-E 3 не является исключением. Из 20 изображений, которые я попросил ChatGPT создать, изображая "журналистов WIRED", чатбот просил предоставить разнообразное представление на изображениях, за исключением нескольких случаев. Когда ChatGPT не добавлял расу или пол в запрос, результаты были представлены только белыми и в основном мужскими фигурами.

WIRED