SubQ: прорыв или Theranos? Что показали независимые тесты
Стартап Subquadratic из Майами вышел из режима скрытой разработки в июне 2026 года с заявлением, которое в сообществе ИИ встретили с крайним скепсисом. Компания утверждает, что решила математическое узкое место, которое почти десять лет сдерживало развитие больших языковых моделей. Речь идёт об архитектуре SubQ — модели, которая, по словам разработчиков, работает быстрее, стоит дешевле и потребляет значительно меньше энергии, чем существующие аналоги.
Источник: technologyreview.com
Для инженера или технического руководителя, который выбирает модель для анализа документов или кодовых баз, вопрос стоит так: это реальный прорыв или очередной громкий анонс без подтверждения? Первая реакция сообщества была жёсткой — инженер Dan McAteer назвал SubQ «либо крупнейшим прорывом со времён трансформера, либо AI Theranos».
Через месяц после анонса Subquadratic опубликовал результаты независимых тестов, проведённых компанией Appen. Они подтверждают часть заявлений. Разбираемся, что изменилось, какие риски остаются и что можно проверить уже сейчас.
Что именно заявляет Subquadratic и почему это важно для бизнеса
Subquadratic утверждает, что разработал новый тип LLM, который обходит главное ограничение современных моделей — так называемое «плотное внимание» (dense attention). В трансформерах каждое слово (или токен) умножается на каждое другое слово в обрабатываемом тексте. Для текста длиной 10 000 слов это почти 50 миллионов отдельных умножений. Чем длиннее контекст, тем быстрее растут вычислительные затраты — по квадратичному закону.
SubQ, по заявлению компании, использует другую математическую основу, которая снижает вычислительную сложность. Конкретные технические детали архитектуры пока не раскрыты, но стартап приводит три ключевых показателя:
- Скорость и стоимость: модель быстрее и дешевле любых аналогов на рынке.
- Длина контекста: SubQ способен обрабатывать до 12 раз больше текста за один раз, чем большинство других моделей.
- Качество: на ключевых задачах, включая программирование, SubQ примерно соответствует лучшим моделям Google DeepMind, OpenAI и Anthropic.
Для компании, которая обрабатывает сотни документов или анализирует целые кодовые базы, это означает потенциальное снижение затрат на инфраструктуру и сокращение времени выполнения задач. Однако пока это только заявления.
Независимые тесты Appen: что показала проверка
Subquadratic обратился в Appen — компанию, которая профессионально оценивает модели других разработчиков — с просьбой провести независимое тестирование SubQ. Результаты, по словам директора по исследованиям генеративного ИИ Appen Жанин Синанан-Сингх, подтвердили архитектуру стартапа.
«Это было действительно захватывающе — их архитектура подтвердилась», — сказала Синанан-Сингх в интервью MIT Technology Review. Она добавила, что модели обычно страдают от проблем со скоростью и неэффективностью, и SubQ может стать «game changer».
Важный нюанс: Appen — не академическая лаборатория и не открытый бенчмарк. Это коммерческая компания, которая оказывает услуги по оценке моделей. Полная методология тестирования и условия проведения тестов не раскрыты. Тем не менее, это первый независимый источник, который подтверждает хотя бы часть заявлений Subquadratic.
Где SubQ выигрывает, а где пока уступает
Сам стартап признаёт: SubQ не заменит лучшие существующие модели во всех сценариях. Речь идёт о задачах, где критичны скорость и стоимость при работе с большими объёмами данных.
| Параметр | SubQ (по заявлениям) | Трансформеры (типичные) |
|---|---|---|
| Вычислительная сложность | Сублинейная или линейная | Квадратичная от длины контекста |
| Максимальная длина контекста | До 12× больше | Ограничена памятью GPU |
| Энергопотребление | Значительно ниже | Высокое |
| Качество на задачах кодирования | Сопоставимо с лидерами | Эталон |
| Доступность для тестирования | Ограниченный доступ | Широкий доступ |
Главное ограничение на сегодня — SubQ нельзя протестировать самостоятельно. Модель не выпущена в открытый доступ, и независимые разработчики не могут проверить заявления на своих данных.
Что может пойти не так: риски и неопределённость
История ИИ знает примеры, когда громкие заявления не находили подтверждения при детальной проверке. В случае Subquadratic есть несколько факторов, которые требуют осторожности.
Отсутствие открытого доступа. Пока модель нельзя запустить, протестировать на своих данных или сравнить с альтернативами. Это ключевой риск: без возможности воспроизвести результаты сообщество вынуждено полагаться на заявления компании и один независимый тест.
Неполная методология Appen. Хотя Appen — уважаемый игрок на рынке оценки ИИ, полные условия тестирования, размер тестовой выборки и метрики не опубликованы. Это не позволяет оценить, насколько результаты репрезентативны для реальных бизнес-задач.
Скепсис сообщества. Реакция инженеров и исследователей была крайне настороженной. Формулировка «AI Theranos» — не случайность. Сообщество помнит громкие провалы, когда стартапы обещали революцию, но не могли предоставить работающий продукт.
Долгосрочные заявления. Генеральный директор Subquadratic Джастин Дэнджел заявил: «Мы надеемся, что начинаем новую эру эффективности. Мы не думаем, что через несколько лет кто-то будет строить модели на трансформерах». Это очень сильное утверждение, которое пока не подкреплено ни открытыми публикациями, ни широким внедрением.
Что можно проверить уже сейчас: практический чек-лист
Для технического руководителя, который рассматривает SubQ как потенциальную альтернативу текущим моделям, вот пять шагов, которые можно сделать на этой неделе без перестройки процессов.
- Проверить официальный сайт Subquadratic на предмет публикации технического отчёта или документации. Если архитектура действительно новая, компания рано или поздно должна опубликовать детали.
- Сравнить с существующими альтернативами. На рынке уже есть модели с длинным контекстом (Claude, Gemini) и решения для эффективной обработки документов. Оцените, насколько текущие инструменты закрывают ваши задачи.
- Отследить реакцию сообщества. Подпишитесь на обсуждения в профессиональных каналах. Если SubQ действительно работает, появятся независимые тесты от сторонних разработчиков.
- Оценить стоимость внедрения. Даже если SubQ подтвердит заявления, переход на новую архитектуру потребует времени, обучения команды и, возможно, изменения инфраструктуры. Посчитайте, какой экономический эффект оправдает эти затраты.
- Не принимать решений на основе одного источника. Пока нет открытого доступа, воспроизводимых бенчмарков и независимых академических оценок, SubQ остаётся перспективной, но непроверенной технологией.
Что делать на следующей неделе
Если вы отвечаете за выбор модели в своей компании, сейчас лучшее время для мониторинга, а не для внедрения. Subquadratic пообещал публиковать только верифицированные результаты в будущем — это даёт шанс, что в ближайшие месяцы появятся более полные данные.
Пока же стоит исходить из того, что существующие трансформеры остаются основным рабочим инструментом. SubQ — интересный сигнал, но не готовое решение. Если стартап выполнит обещания и откроет доступ к модели, это может изменить рынок. Если нет — вы ничего не потеряете, дождавшись подтверждений.
Источники
- MIT Technology Review: «A startup claims it broke through a bottleneck that’s holding back LLMs»
- Appen — компания, проводившая независимое тестирование SubQ
- Subquadratic — официальный сайт стартапа
- Реакция Dan McAteer в X/Twitter
Генерация изображения
- Модель:
flux-schnell - Провайдер:
replicate
Темы журнала
Что почитать дальше
- Anthropic под давлением регуляторов: что изменить в работе с Claude в 2026
- Claude Code без Anthropic API: подключение китайских LLM GLM 5 и экономия
- Claude Opus 4.8: почему новая модель Anthropic стала лучшим AI для кодинга
- Claude пишет 80% кода в Anthropic: почему ревью стало узким местом
- MiMo Code vs Claude Code в 2026: неограниченный контекст для больших кодовых баз — стоит ли переходить