OpenAI Jalapeño: как собственный ASIC-чип меняет экономику инференса LLM и ставку на Nvidia
OpenAI разрабатывает специализированный ASIC-чип Jalapeño совместно с Broadcom для снижения капитальных затрат на эксплуатацию больших языковых моделей. По данным artificialintelligence-news.com, в прошлом году поддержание работоспособности ChatGPT обошлось компании в $8,4 млрд, а в текущем году при 900 млн еженедельных пользователей операционные расходы прогнозируются на уровне около $14 млрд. На горизонте восьми лет OpenAI заложила примерно $1,4 трлн на вычислительные мощности при годовой выручке порядка $25 млрд. Для владельца или управленца, выбирающего инфраструктуру для AI-сервисов, это означает: эпоха, когда можно было просто закупать видеокарты и радоваться масштабированию, подходит к концу — и решение «продолжать платить Nvidia» перестаёт быть нейтральным по умолчанию.
Что конкретно происходит и в чём бизнес-последствие
Событие: OpenAI создаёт первый «интеллектуальный процессор», оптимизированный не под общие AI-нагрузки, а под инференс больших языковых моделей. Архитектурный дизайн компания предоставила сама, опираясь на собственные дорожные карты моделей и системы их эксплуатации. Broadcom отвечает за кремниевую инженерию и высокопроизводительную сетевую интеграцию. Физическое производство чипов выполняет TSMC на Тайване, а Celestica собирает платные и стоечные системы. По утверждению OpenAI, ранние лабораторные образцы уже работают с фронтир-нагрузками, включая невыпущенную модель GPT-5.3-Codex-Spark, на целевой частоте и мощности.
Бизнес-последствие здесь двойное. Во-первых, меняется структура затрат: вместо того чтобы платить премиальную наценку за универсальное оборудование, OpenAI пытается привязать железо к конкретным моделям и рабочим сценариям. Во-вторых, меняется рычаг переговоров: компания, которая сама проектирует чип, перестаёт полностью зависеть от чужой ценовой политики. Для любого бизнеса, который строит AI-инфраструктуру не на один год, это сигнал: универсальное оборудование перестаёт быть единственно разумным выбором по умолчанию.
Почему это меняет стоимость, время, риск или контроль прямо сейчас
Ключевая экономическая развилка выглядит так: Nvidia получает примерно 75% маржинальной прибыли на своих высокопроцессорах, а у OpenAI после покрытия массивных операционных расходов остаётся около 33 центов чистой прибыли с каждого доллара выручки. Разрыв огромный. При этом стоимость масштабирования LLM-инференса растёт быстрее, чем успевает окупаться универсальное оборудование.
| Что меняется | Почему важно бизнесу | Что проверить |
|---|---|---|
| Доля затрат на инфраструктуру в выручке AI-сервиса | При операционных расходах около $14 млрд и выручке $25 млрд любая оптимизация отдаёт десятки процентов маржи | Сколько процентов вашей выручки уходит на аренду или амортизацию AI-мощностей |
| Зависимость от универсального вендора | Универсальное железо удобно, но вендор может диктовать цены и приоритеты поставок | Есть ли у вас запасной путь миграции, если цены или доступность изменятся |
| Скорость окупаемости кастомного чипа | Собственный ASIC окупается только при стабильной нагрузке и совпадении архитектуры чипа и моделей | Стабильна ли ваша модельная линейка и паттерн нагрузки на горизонте 2–3 лет |
| Контроль над дорожной картой | Собственный чип позволяет синхронизировать железо и модели, но привязывает вас к собственным решениям | Готовы ли вы жертвовать гибкостью ради предсказуемой стоимости владения |
Практический смысл не в том, чтобы всем срочно проектировать чип. Смысл в том, что стоимость владения AI-инфраструктурой перестала быть «серым» фактором — она стала конкурентным параметром, который нужно считать так же внимательно, как стоимость сырья или фонд оплаты труда.
Что стоит проверить компании, прежде чем менять стратегию
Прежде чем принимать решение о ставке на проприетарное железо или, наоборот, об удержании экосистемы Nvidia, имеет смысл провести четыре конкретных проверки.
1. Удельная стоимость инференса. Посчитайте стоимость одного запроса или одного токена в вашей текущей инфраструктуре с учётом амортизации, энергии, аренды и персонала. Если вы этого не знаете, вы не можете сравнивать варианты.
2. Стабильность модельной линейки. Собственный ASIC выгоден, только если архитектура моделей и паттерн нагрузки достаточно предсказуемы на горизонте нескольких лет. Частая смена моделей или резкое изменение профиля задач может обесценить кастомное железо.
3. Зрелость экосистемы. Универсальное оборудование даёт готовые инструменты, драйверы, поддержку облачных провайдеров и широкую совместимость. Кастомный чип требует собственной экспертизы, цепочки поставок и долгосрочных партнёров.
4. Финансовая устойчивость вендора и партнёров. Сотрудничество с Broadcom и TSMC не устраняет риски цепочки поставок. Любой сбой у контрактного производителя или разработчика может остановить дорожную карту.
Где границы и что может пойти не так
Источник указывает на несколько ограничений, которые важно учитывать при оценке этой стратегии.
- Прогнозы затрат в $14 млрд в год основаны на текущем росте числа пользователей и операционных расходов. Если рост замедлится или эффективность моделей резко улучшится, экономика может измениться.
- Чип оптимизирован под конкретные модели OpenAI. При смене архитектуры модели эффективность кастомного кремния может упасть, а универсальное оборудование в этот момент окажется более гибким выбором.
- Зависимость от Broadcom и TSMC не устраняет риски цепочки поставок. Геополитические ограничения, дефицит мощностей или внутренние сбои у партнёров могут задержать планы.
- Маржинальность Nvidia может снизиться из-за конкуренции, что изменит сравнительную выгоду собственного кремния. Если вендор начнёт снижать цены, окупаемость кастомного чипа станет менее очевидной.
Поэтому нельзя считать собственный чип универсальным ответом на дороговизну инференса. Это инструмент, который работает только при совпадении нескольких условий: стабильная нагрузка, предсказуемая модельная стратегия, готовность инвестировать в долгосрочную разработку и зрелая цепочка партнёров.
Что можно сделать на этой недели
Для владельца, управленца или менеджера продукта, который уже использует LLM-инференс или планирует запуск AI-сервиса, следующий чек-лист можно применить сразу.
- [ ] Посчитайте полную стоимость владения текущей AI-инфраструктурой на один запрос или на единицу бизнес-результата.
- [ ] Сравните эту стоимость с рыночными предложениями облачных провайдеров и альтернативных вендоров.
- [ ] Оцените, насколько стабильна ваша модельная линейка и паттерн нагрузки на горизонте двух-трёх лет.
- [ ] Проверьте, есть ли у вас запасной путь миграции на другое оборудование или другого провайдера.
- [ ] Если рассматриваете кастомное железо, зафиксируйте минимальный горизонт окупаемости и условия, при которых он имеет смысл.
- [ ] Запланируйте повторный пересчёт экономики инференса через 6–12 месяцев с учётом возможного изменения цен у крупных вендоров.