Модераторы спят. Быстро, все выпускайте продукты искусственного интеллекта.
За пять дней между таинственным увольнением и повторным назначением Сэма Альтмана на пост Генерального директора OpenAI, несколько компаний выпустили новые инструменты искусственного интеллекта.
Турбулентность в OpenAI за последние пять дней захватила технологическую индустрию и удерживала предпринимателей, журналистов и всех, у кого есть аккаунт в ..., прикованными к своим лентам для получения последних обновлений в виде эмодзи и строчных сообщений. Тем временем, некоторые из самых известных компаний по искусственному интеллекту, включая OpenAI, продолжали делать то, за что Силиконовая долина известна: выпускать новые продукты.
Неожиданное увольнение Сэма Альтмана, генерального директора OpenAI, сопровождалось лавиной новых функций искусственного интеллекта от конкурентов, включая Anthropic и Stable Diffusion. Во вторник днем, во время беспорядков, OpenAI представила ChatGPT с возможностью голосового ввода бесплатно для всех пользователей. OpenAI уже предварительно выпустила его в конце сентября, но только для платных пользователей. Теперь обновление стало широко доступным.
Несмотря на то, что OpenAI преобладала в разговорах в Силиконовой долине в течение 2023 года с помощью своих продуктов, отражающих текущий дух времени, таких как Dall-E 3 и ChatGPT, работающий на основе GPT-4, хаос, вызванный решением совета директоров подорвать Альтмана и быстро назначить новых генеральных директоров, может создать возможности для других компаний по искусственному интеллекту. (Несмотря на то, что Альтман в конечном итоге вернулся, чтобы продолжить руководить OpenAI.) И хотя эти обновления продуктов были готовы уже несколько месяцев, время для конкурентов OpenAI не могло быть лучше. Многие корпоративные клиенты инструментов OpenAI, испуганные уходом Альтмана, рассматривали возможность перехода на Anthropic или другого поставщика, пока он отсутствовал.
"Кажется, что каждую неделю что-то новое запускается или анонсируется одним из крупных игроков. Поэтому я думаю, что выпуск Stable Video Diffusion и Claude 2.1 был просто совпадением", - говорит Дхармеш Шах, главный технический директор и сооснователь HubSpot, а также акционер OpenAI.
Клод говорит правду
После внезапного ухода Альтмана, когда судьба руководства OpenAI оставалась под вопросом, Anthropic объявила о более мощной версии своего чат-бота Клода, а Stability AI выпустила генератор текста в видео под названием Stable Video Diffusion.
Последняя модель Anthropic, Claude 2.1, получила два важных обновления. Одно из них - возможность загружать больше данных одновременно в чат-бот, а вторая меньше вранья.
Теперь лимит токенов для Клода составляет 200 000, что примерно соответствует объему книги в 500 страниц
Извините, поклонники Льва Толстого, вам придется подождать будущих обновлений, чтобы проанализировать "Войну и мир" в одной подсказке. Для сравнения, лимит для модели GPT-4 Turbo, объявленной Альтманом до его увольнения, ограничен 128 000 токенов.
Anthropic также утверждает, что новый Клод более склонен признавать, когда он не уверен в ответе, а не уверенно лгать.
"Мы проверили честность Клода 2.1, составив большой набор сложных фактических вопросов, которые тестируют известные уязвимости текущих моделей", - говорится в блоге компании. Отсутствие достоверности, часто описываемое как галлюцинации, остается серьезной проблемой для чат-ботов.
Резкий поворот в видео с искусственным интеллектом
В то время как вы уже можете использовать Claude 2.1, новая Stable Video Diffusion от Stability AI пока открыта только для тестировщиков, прежде чем она будет доступна для широкой публики. В отличие от инструментов искусственного интеллекта, выпущенных OpenAI, Stability AI фокусируется на запуске программного обеспечения с открытым исходным кодом. Новый инструмент искусственного интеллекта компании аналогичен Runway, еще одной модели текст-видео.
Когда вы вводите подсказку в модель текст-видео, искусственный интеллект создает анимации, похожие на GIF, которые могут быть как очень красивыми, так и просто пугающими. В дополнение к возможностям текст-видео, Stable Video Diffusion может преобразовывать статические изображения в видео, добавляя движение.
Говори, ChatGPT
Хотя это технически не новая функция от OpenAI, компания расширила возможности ChatGPT голосовой связью для всех в короткий период, пока Альтман отсутствовал на посту генерального директора. Ранее эта функция была доступна только для пользователей, оплачивающих ежемесячную подписку на сервис OpenAI Plus за 20 долларов.
Хотя это еще не достигает уровня фильма "Она" Спайка Джонза, разработчики программного обеспечения в OpenAI сделали еще один большой шаг к своей цели "мультимодальности", дав возможность чатботу вести разговор с вами. Идея заключается в том, что чатбот может быть еще более мощным, если он может принимать входные данные и предоставлять результаты в нескольких форматах, таких как голос, текст и изображения. Кто знает, когда он научится различать запахи.
По мере приближения к концу года, быстрый темп инноваций в области искусственного интеллекта не замедляется. Сразу после того, как стало известно, что Альтман вернется на пост генерального директора OpenAI, еще один конкурент, Inflection AI, объявил о модернизированной модели своего чатбота Pi. Если вы надеялись на перерыв в потоке новостей об искусственном интеллекте, то не надейтесь.