FeFET-чип для ИИ: один чип вместо двух снижает стоимость инференса
В июне 2026 года исследовательская группа под руководством профессора Чон Хо Ли из Сеульского национального университета (SNU) представила работающий чип на основе сегнетоэлектрической памяти (FeFET), который выполняет две задачи одновременно: генерирует истинно случайные числа и проводит нейросетевые вычисления. Результаты опубликованы в Nature Communications (DOI: 10.1038/s41467-026-72969-6). Для бизнеса, который использует генеративные модели, это означает возможное снижение стоимости инференса за счёт объединения двух чипов в одном — но с оговорками, которые мы разберём ниже.
Что произошло: чип, который считает и «бросает кубик» одновременно
Генеративные модели, от GPT до диффузионных архитектур, требуют двух принципиально разных вычислительных режимов. Первый — детерминированные матричные умножения, которые выполняют GPU и NPU. Второй — вероятностная выборка: модель должна «выбрать» следующий токен или сгенерировать шум, и для этого нужен источник случайности. Обычно эти задачи разнесены на разные чипы: нейросетевой ускоритель и отдельный генератор случайных чисел (TRNG).
Команда SNU создала транзистор с сегнетоэлектрическим затвором (FeFET), который может работать в обоих режимах. В режиме памяти он хранит веса нейросети. В режиме генерации случайности поляризация сегнетоэлектрика создаёт квантово-механический шум, который невозможно предсказать. Один чип — два режима, переключение между которыми занимает наносекунды.
Важно: это не лабораторный прототип. В статье Nature Communications описана работающая микросхема, изготовленная по техпроцессу, совместимому с CMOS. Исследователи продемонстрировали её работу на задаче генерации изображений — классическом сценарии для генеративного ИИ.
Почему это меняет стоимость и архитектуру инференса
Сегодня любой сервер для генеративного ИИ содержит как минимум два типа чипов: ускоритель (GPU, TPU, NPU) и отдельный блок или чип для случайности. Даже если случайность встроена в GPU (как в NVIDIA H100 с блоком TRNG), она занимает площадь кристалла и потребляет энергию.
Объединение функций в одном FeFET-чипе даёт три бизнес-следствия:
- Снижение стоимости системы. Один чип вместо двух — меньше компонентов, проще разводка платы, ниже BOM (bill of materials). Для edge-устройств, где каждый квадратный миллиметр на счету, это критично.
- Снижение энергопотребления. Сегнетоэлектрическая память энергонезависима: веса модели сохраняются при отключении питания. Для инференса на батарейках (ноутбуки, дроны, медицинские датчики) это означает часы работы вместо минут.
- Упрощение безопасности. Аппаратный генератор случайных чисел на отдельном чипе — это дополнительный интерфейс, который можно атаковать. Встроенный FeFET-генератор не имеет внешних соединений для случайности, что снижает поверхность атаки.
Но есть и обратная сторона: производительность одного FeFET-транзистора пока ниже, чем у специализированного GPU при матричных умножениях. Это чип для задач, где важна компактность и энергоэффективность, а не сырая вычислительная мощность.
Что проверить компании перед внедрением
Прежде чем закладывать FeFET-чипы в архитектуру, необходимо ответить на пять вопросов. Мы собрали их в таблицу для быстрой оценки.
| Что меняется | Почему важно бизнесу | Что проверить |
|---|---|---|
| Один чип вместо двух | Снижение стоимости системы на 20–40% для edge-устройств | Есть ли у поставщика рабочая документация по интеграции FeFET в существующую платформу |
| Энергонезависимость весов | Возможность «мгновенного» включения модели без загрузки из DRAM | Каковы задержки переключения между режимами памяти и вычислений |
| Аппаратный TRNG на том же кристалле | Упрощение сертификации по стандартам безопасности (FIPS, Common Criteria) | Поддерживает ли чип сертифицированные криптографические библиотеки |
| Совместимость с CMOS | Возможность производства на существующих фабриках без переоснащения | Какие техпроцессы (28 нм, 14 нм, 7 нм) доступны для FeFET |
| Отсутствие бенчмарков для LLM | Риск, что чип не покажет заявленную производительность на вашей модели | Запросить у вендора тесты на вашей архитектуре (Transformer, Mamba, SSM) |
Где технология может не оправдать ожиданий
У FeFET есть три ограничения, которые не всегда упоминаются в пресс-релизах.
Первое: скорость записи. Сегнетоэлектрическая память быстрее флеш-памяти, но медленнее SRAM. Если ваша модель требует частого обновления весов (например, при fine-tuning на лету), FeFET может стать узким местом. Для инференса с фиксированными весами это не проблема, но для обучающих контуров — существенно.
Второе: выносливость. Количество циклов перезаписи у FeFET ограничено — порядка 10^10–10^12 циклов. Для инференсного чипа, который годами работает с одними и теми же весами, это избыточно. Но если чип используется как универсальный ускоритель с частой сменой моделей, ресурс может исчерпаться за несколько лет.
Третье: зрелость экосистемы. FeFET-память — не новая технология, но её применение в AI-ускорителях — свежее. Компания Ferroelectric Memory GmbH (FMC) привлекла €100 млн на разработку гибридной памяти, imec сообщает о прорывах в масштабировании, но готовых чипов для LLM-инференса в открытой продаже пока нет. Доступны только инженерные образцы для партнёров.
Что сделать на этой неделе: практический чек-лист
Если вы отвечаете за выбор аппаратного обеспечения для AI-инференса, вот пять шагов, которые можно выполнить сейчас.
- Определите сценарий. FeFET-чип имеет смысл для edge-инференса (устройства с батарейным питанием, ограниченным пространством и требованиями к безопасности). Для облачных кластеров с сотнями GPU технология пока не даёт преимущества.
- Запросите документацию. Обратитесь к производителям FeFET-памяти (FMC, imec, SNU) с конкретным вопросом: поддерживает ли чип вашу архитектуру модели и какой софтверный стек нужен для интеграции.
- Проверьте бенчмарки. В статье Nature Communications приведены тесты на генерации изображений. Запросите у вендора тесты на вашей задаче — классификация, суммаризация, генерация кода. Если тестов нет, считайте технологию неприменимой для вашего случая.
- Оцените стоимость владения. Посчитайте TCO (total cost of ownership) для системы на FeFET против текущей конфигурации. Учтите не только цену чипа, но и стоимость разработки драйверов, интеграции в софт и сертификации.
- Подпишите NDA для доступа к образцам. Если технология подходит под ваш сценарий, запросите инженерные образцы. Только работа с реальным железом покажет, работает ли обещание в ваших условиях.
Источники
- Ferroelectric memory enables one chip to sample randomness and compute for generative AI — TechXplore
- SNU Ferroelectric Memory Unifies Probabilistic Sampling and AI Computing — Windows News AI
- Ferroelectric Memory Powers AI Chips — Electronics For You
- Chip Industry Week In Review — Semiconductor Engineering
- Imec R&D — ferroelectric memory research
- Ferroelectric Memory GmbH — M Ventures portfolio
- Ferroelectric Memory Generative AI: The Ultimate Guide — Progressive Robot
- Applications — Persistent Hybrid Memory for AI and Edge
- Ferroelectric Memory GmbH — official site
- Most Read — Ferroelectric memory, AI chip design — Electronics Weekly
Генерация изображения
- Модель:
flux-schnell - Провайдер:
replicate