FeFET-чип для ИИ: один чип вместо двух снижает стоимость инференса

В июне 2026 года исследовательская группа под руководством профессора Чон Хо Ли из Сеульского национального университета (SNU) представила работающий чип на основе сегнетоэлектрической памяти (FeFET), который выполняет две задачи одновременно: генерирует истинно случайные числа и проводит нейросетевые вычисления. Результаты опубликованы в Nature Communications (DOI: 10.1038/s41467-026-72969-6). Для бизнеса, который использует генеративные модели, это означает возможное снижение стоимости инференса за счёт объединения двух чипов в одном — но с оговорками, которые мы разберём ниже.

Что произошло: чип, который считает и «бросает кубик» одновременно

Генеративные модели, от GPT до диффузионных архитектур, требуют двух принципиально разных вычислительных режимов. Первый — детерминированные матричные умножения, которые выполняют GPU и NPU. Второй — вероятностная выборка: модель должна «выбрать» следующий токен или сгенерировать шум, и для этого нужен источник случайности. Обычно эти задачи разнесены на разные чипы: нейросетевой ускоритель и отдельный генератор случайных чисел (TRNG).

Команда SNU создала транзистор с сегнетоэлектрическим затвором (FeFET), который может работать в обоих режимах. В режиме памяти он хранит веса нейросети. В режиме генерации случайности поляризация сегнетоэлектрика создаёт квантово-механический шум, который невозможно предсказать. Один чип — два режима, переключение между которыми занимает наносекунды.

Важно: это не лабораторный прототип. В статье Nature Communications описана работающая микросхема, изготовленная по техпроцессу, совместимому с CMOS. Исследователи продемонстрировали её работу на задаче генерации изображений — классическом сценарии для генеративного ИИ.

Почему это меняет стоимость и архитектуру инференса

Сегодня любой сервер для генеративного ИИ содержит как минимум два типа чипов: ускоритель (GPU, TPU, NPU) и отдельный блок или чип для случайности. Даже если случайность встроена в GPU (как в NVIDIA H100 с блоком TRNG), она занимает площадь кристалла и потребляет энергию.

Объединение функций в одном FeFET-чипе даёт три бизнес-следствия:

  1. Снижение стоимости системы. Один чип вместо двух — меньше компонентов, проще разводка платы, ниже BOM (bill of materials). Для edge-устройств, где каждый квадратный миллиметр на счету, это критично.
  2. Снижение энергопотребления. Сегнетоэлектрическая память энергонезависима: веса модели сохраняются при отключении питания. Для инференса на батарейках (ноутбуки, дроны, медицинские датчики) это означает часы работы вместо минут.
  3. Упрощение безопасности. Аппаратный генератор случайных чисел на отдельном чипе — это дополнительный интерфейс, который можно атаковать. Встроенный FeFET-генератор не имеет внешних соединений для случайности, что снижает поверхность атаки.

Но есть и обратная сторона: производительность одного FeFET-транзистора пока ниже, чем у специализированного GPU при матричных умножениях. Это чип для задач, где важна компактность и энергоэффективность, а не сырая вычислительная мощность.

Что проверить компании перед внедрением

Прежде чем закладывать FeFET-чипы в архитектуру, необходимо ответить на пять вопросов. Мы собрали их в таблицу для быстрой оценки.

Что меняется Почему важно бизнесу Что проверить
Один чип вместо двух Снижение стоимости системы на 20–40% для edge-устройств Есть ли у поставщика рабочая документация по интеграции FeFET в существующую платформу
Энергонезависимость весов Возможность «мгновенного» включения модели без загрузки из DRAM Каковы задержки переключения между режимами памяти и вычислений
Аппаратный TRNG на том же кристалле Упрощение сертификации по стандартам безопасности (FIPS, Common Criteria) Поддерживает ли чип сертифицированные криптографические библиотеки
Совместимость с CMOS Возможность производства на существующих фабриках без переоснащения Какие техпроцессы (28 нм, 14 нм, 7 нм) доступны для FeFET
Отсутствие бенчмарков для LLM Риск, что чип не покажет заявленную производительность на вашей модели Запросить у вендора тесты на вашей архитектуре (Transformer, Mamba, SSM)

Где технология может не оправдать ожиданий

У FeFET есть три ограничения, которые не всегда упоминаются в пресс-релизах.

Первое: скорость записи. Сегнетоэлектрическая память быстрее флеш-памяти, но медленнее SRAM. Если ваша модель требует частого обновления весов (например, при fine-tuning на лету), FeFET может стать узким местом. Для инференса с фиксированными весами это не проблема, но для обучающих контуров — существенно.

Второе: выносливость. Количество циклов перезаписи у FeFET ограничено — порядка 10^10–10^12 циклов. Для инференсного чипа, который годами работает с одними и теми же весами, это избыточно. Но если чип используется как универсальный ускоритель с частой сменой моделей, ресурс может исчерпаться за несколько лет.

Третье: зрелость экосистемы. FeFET-память — не новая технология, но её применение в AI-ускорителях — свежее. Компания Ferroelectric Memory GmbH (FMC) привлекла €100 млн на разработку гибридной памяти, imec сообщает о прорывах в масштабировании, но готовых чипов для LLM-инференса в открытой продаже пока нет. Доступны только инженерные образцы для партнёров.

Что сделать на этой неделе: практический чек-лист

Если вы отвечаете за выбор аппаратного обеспечения для AI-инференса, вот пять шагов, которые можно выполнить сейчас.

  1. Определите сценарий. FeFET-чип имеет смысл для edge-инференса (устройства с батарейным питанием, ограниченным пространством и требованиями к безопасности). Для облачных кластеров с сотнями GPU технология пока не даёт преимущества.
  2. Запросите документацию. Обратитесь к производителям FeFET-памяти (FMC, imec, SNU) с конкретным вопросом: поддерживает ли чип вашу архитектуру модели и какой софтверный стек нужен для интеграции.
  3. Проверьте бенчмарки. В статье Nature Communications приведены тесты на генерации изображений. Запросите у вендора тесты на вашей задаче — классификация, суммаризация, генерация кода. Если тестов нет, считайте технологию неприменимой для вашего случая.
  4. Оцените стоимость владения. Посчитайте TCO (total cost of ownership) для системы на FeFET против текущей конфигурации. Учтите не только цену чипа, но и стоимость разработки драйверов, интеграции в софт и сертификации.
  5. Подпишите NDA для доступа к образцам. Если технология подходит под ваш сценарий, запросите инженерные образцы. Только работа с реальным железом покажет, работает ли обещание в ваших условиях.

Источники

Генерация изображения

  • Модель: flux-schnell
  • Провайдер: replicate