Лихорадка ChatGPT достигла Китая

Нейросети 19 июня 2023 г.

Лихорадка ChatGPT достигла Китая, несмотря на юридические и технические барьеры.

Что нового: Спустя два месяца после своего дебюта ChatGPT стал вирусной сенсацией в китайских социальных сетях, сообщает MIT Technology Review. Компании в этой стране спешат заработать на ChatGPT.

Подсказка: OpenAI не поддерживает эту модель в Китае, но пользователи там получают доступ к ней через виртуальные частные сети и оффшорные сервисы, которые взимают плату за каждую подсказку. Сообщается, что чат-бот произвел впечатление на пользователей в Китае своей способностью отвечать на запросы на китайском языке и своим пониманием популярной культуры страны.

Результат: Крупнейшие технологические фирмы страны в последние недели обнародовали планы по предоставлению своих собственных эквивалентных услуг.

  • Baidu анонсировала Wenxin Yiyan (по-английски Ernie Bot), чат-бота, основанного на языковой модели ERNIE компании, и планирует интегрировать его со своей поисковой системой и облачными сервисами.
  • Alibaba разрабатывает неназванный прототип для интеграции со своим корпоративным чат-приложением DingTalk.
  • Интернет-магазин JD.com планирует запустить ChatJD для таких задач, как обслуживание клиентов и создание маркетинговых материалов и финансовых отчетов.
  • NetEase, разработчик онлайн-видеоигр, намерена интегрировать чат-бота в одну из своих самых популярных игр, Justice Online Mobile. Модель будет генерировать настроенные диалоги, персонажей и другие выходные данные.

За новостями: Используя технологии более раннего поколения, Microsoft Research в Китае разработала чат-бота Xiaoice, который продолжает широко использоваться. Совсем недавно Пекинская академия искусственного интеллекта разработала Wu Dao 2.0 с параметрами в 1,75 триллиона. Тем не менее, китайские исследователи сталкиваются с уникальными препятствиями в обработке естественного языка.

Исследования искусственного интеллекта в Китае, как правило, фокусируются на приложениях компьютерного зрения, таких как автономное вождение и распознавание лиц, а не на языковых приложениях.
Крупномасштабные наборы данных на китайском языке трудно скомпилировать. В Интернете гораздо меньше текстов на китайском языке, чем на английском, и часть Интернета, доступная за Большим китайским брандмауэром, ограничена.

В сентябре правительство США ограничило продажи китайским заказчикам высокопроизводительных процессоров, используемых для обучения самых современных систем искусственного интеллекта.
Ужесточение регулирующих мер в отношении некоторых из наиболее процветающих технологических компаний Китая в 2021 году стимулировало более осторожный подход к росту. Ограничения ослабли, но некоторые наблюдатели указывают на сдерживающий эффект для инноваций.
Некоторые более ранние чат-боты столкнулись с правительственными ограничениями на интернет-контент. Еще предстоит выяснить, соответствуют ли правилам большие языковые модели, которые, как хорошо известно, генерируют проблемный вывод.

Почему это важно: ChatGPT, Microsoft Bing chat, Google Bard и другие чат-боты, созданные американскими технологическими компаниями, оптимизированы для английского языка. Китайские технологические компании изо всех сил пытаются извлечь выгоду из потребности общественности в чат-боте, совместимом с их языком и культурой.

Мы думаем: носители китайского языка находят ChatGPT захватывающим, несмотря на относительную неготовность к их языку. Когда модель достаточно велика, большой обучающий корпус позволяет ее обобщать на новые языки, которые могут содержать не так много обучающих данных. Это свойство дает надежду на то, что большие языковые модели будут работать с языками, которые содержат гораздо меньше данных, чем китайский.

Теги

Все представленные на сайте материалы предназначены исключительно для образовательных целей и не предназначены для медицинских консультаций, диагностики или лечения. Администрация сайта, редакторы и авторы статей не несут ответственности за любые последствия и убытки, которые могут возникнуть при использовании материалов сайта.