OpenAI Broadcom Jalapeño: зачем OpenAI свой inference-чип

OpenAI и Broadcom показали Jalapeño, первый OpenAI Intelligence Processor для LLM inference. Разбираем, что известно, где vendor-claims и почему важна сеть.

Сэм Альтман и Хок Тань держат демонстрационный образец OpenAI Broadcom Jalapeño Intelligence Processor

Факты проверены 24 июня 2026 года. OpenAI Broadcom Jalapeño - первый OpenAI Intelligence Processor, inference-ускоритель для LLM, который OpenAI разрабатывает вместе с Broadcom. Его задача не заменить все GPU в мире, а удешевить и ускорить массовое обслуживание ChatGPT, Codex, API и будущих агентных продуктов.

Главное в анонсе не само слово «чип». OpenAI показывает, что хочет контролировать больше слоев своей AI-инфраструктуры: модель, вычислительные kernels, обслуживание запросов, сеть, rack-интеграцию и дата-центры. Если раньше гонку вычислений часто описывали как «кто купит больше GPU», Jalapeño переносит разговор ближе к вопросу «кто лучше оптимизирует весь путь токена до пользователя».

Что представили OpenAI и Broadcom

24 июня 2026 года OpenAI и Broadcom представили Jalapeño. OpenAI называет его первым Intelligence Processor и первым ускорителем в многоступенчатой compute-платформе, которую компании строят вместе. По официальному описанию, чип спроектирован вокруг будущего LLM inference, а не переделан из более общего ускорителя для старых AI-нагрузок.

В проекте участвует не только Broadcom. OpenAI пишет, что Celestica помогает с платами, rack-системами, интеграцией и промышленным выпуском. Broadcom отвечает за реализацию silicon, networking и connectivity. Отдельно в анонсе упомянут Tomahawk networking silicon.

Официальная карточка OpenAI и Broadcom к партнёрству по AI-ускорителям
OpenAI и Broadcom оформили партнёрство по custom AI accelerators ещё в октябре 2025 года. Источник: OpenAI.

По данным OpenAI, engineering samples Jalapeño уже запускают ML-нагрузки в лаборатории на целевой частоте и мощности, включая GPT-5.3-Codex-Spark. Финальных бенчмарков при этом нет: OpenAI обещает технический отчёт о производительности в ближайшие месяцы. Поэтому все формулировки про «существенно лучше performance per watt» стоит читать как раннюю оценку OpenAI, а не как независимое сравнение с GPU.

Коротко: что известно сейчас

  • Продукт: Jalapeño, первый OpenAI Intelligence Processor.
  • Фокус: LLM inference, то есть обслуживание запросов к языковым моделям.
  • Партнёры: Broadcom для silicon implementation, networking и connectivity; Celestica для board, rack и system integration.
  • Статус: engineering samples уже работают в лаборатории, но финальные показатели ещё не опубликованы.
  • Сроки: OpenAI говорит о первой deployment-волне к концу 2026 года и дальнейшем расширении в следующие годы.
  • Масштаб: CEO Broadcom Хок Тань говорит о дата-центрах гигаваттного масштаба с Microsoft и другими партнёрами, начиная с 2026 года.

Чем Jalapeño отличается от GPU и TPU

Jalapeño стоит воспринимать как custom ASIC под конкретный класс нагрузки. GPU остаётся универсальной рабочей лошадью для обучения, inference и смешанных задач. TPU и похожие ASIC обычно сильны там, где владелец может заранее подогнать модель, компилятор, память и сеть под свою платформу.

КритерийJalapeñoGPUTPU / другие ASIC
Главная задачаLLM inference для продуктов OpenAI и совместимой отраслевой нагрузкиУниверсальные AI и HPC-нагрузки: обучение, inference, симуляцииОптимизированные workloads внутри конкретной платформы
Сильная сторонаОптимизация под kernels, memory movement, networking и serving-паттерны OpenAIГибкость, зрелая software-цепочка, широкий рынок поставщиковЦена/производительность на заранее выбранных задачах
ОграничениеНет независимых бенчмарков и раскрытых характеристикНе всегда лучший вариант для дешёвого массового inferenceМеньше гибкости, сильная зависимость от платформы владельца
Что сравниватьЗадержку, стоимость токена, стабильность под пиковым спросомДоступность, набор инструментов, стоимость кластераСтоимость владения и качество компилятора/serving-слоя

Здесь важна дисциплина формулировок. Jalapeño не доказал, что «победил GPU»: OpenAI ещё не опубликовала финальные цифры. Но сам выбор направления логичен. На масштабе ChatGPT и API даже небольшое снижение стоимости одного ответа превращается в инфраструктурное преимущество.

Почему Broadcom важна не меньше самого чипа

В inference узкое место не всегда лежит в матричном умножении. Модель надо загрузить, распределить, обслужить тысячи параллельных запросов, передать данные между ускорителями и не потерять задержку на сети. Поэтому в анонсе OpenAI рядом с chip architecture стоят memory systems, networking, scheduling и deployment systems.

Это хорошо стыкуется с прежним материалом Toolarium о том, почему сеть, облака и энергия стали узким местом ИИ-кластеров. Если чип быстрее, но сеть и rack-архитектура не успевают, пользователь всё равно видит задержку, лимиты или рост цены API.

Официальный визуал Broadcom Tomahawk 6 Ethernet switch ASIC
OpenAI упоминает Tomahawk networking silicon, но не раскрывает конкретную версию для Jalapeño. На изображении - официальный визуал Broadcom Tomahawk 6 как пример сетевого слоя для AI-кластеров. Источник: Broadcom.

Broadcom в этом сюжете продаёт не только «помощь с чипом». Компания приносит Ethernet, PCIe, optical connectivity и опыт крупных сетевых платформ. В октябре 2025 года OpenAI и Broadcom уже объявляли о сотрудничестве на 10 ГВт custom AI accelerators: тогда речь шла о racks с ускорителями OpenAI и сетевыми решениями Broadcom, deployment должен стартовать во второй половине 2026 года и завершиться к концу 2029-го.

Новый Jalapeño выглядит как конкретизация той сделки. В материале про 10 ГВт AI-инфраструктуры OpenAI в США мы уже писали, что борьба за compute стала вопросом не только денег, но и физической цепочки поставок. Теперь у этой цепочки появился публичный silicon-символ.

Девять месяцев tape-out: сильный сигнал, но не бенчмарк

OpenAI утверждает, что Jalapeño прошёл путь от initial design до manufacturing tape-out за девять месяцев. Компания также пишет, что это, по её оценке, самый быстрый ASIC development cycle для high-performance advanced semiconductors. Здесь лучше не превращать пресс-релиз в рекордную книгу: независимого подтверждения такого «самого быстрого» цикла пока нет.

Но сам срок важен. Если модели OpenAI действительно ускоряли часть дизайна и оптимизации, это замыкает интересную петлю: AI помогает проектировать инфраструктуру, на которой потом будет работать следующий AI. Для OpenAI это не только инженерный эксперимент, а способ быстрее обновлять compute-платформу под собственную линейку моделей.

Что это меняет для рынка AI-инфраструктуры

Первое последствие - давление на стоимость inference. Обучение моделей остаётся дорогим и престижным фронтом, но деньги в массовом AI-продукте сгорают при каждом запросе пользователя. ChatGPT, Codex, API и агентные продукты живут в режиме постоянного обслуживания. Если Jalapeño снижает стоимость токена и задержку, OpenAI получает больше пространства для лимитов, новых функций и ценовых манёвров.

Второе последствие - рост роли custom silicon. NVIDIA Blackwell и похожие GPU-платформы никуда не исчезают; для обучения и универсальных workloads они остаются центральными. Но на части inference-нагрузок у hyperscaler может появиться стимул строить собственный контур. Поэтому сравнивать Jalapeño с NVIDIA Blackwell надо аккуратно: это не одна и та же роль в стеке.

Третье последствие - больше зависимости от партнёров. OpenAI проектирует ускоритель, Broadcom помогает превратить его в silicon и сетевую платформу, Celestica участвует в rack/system integration, дата-центры и Microsoft нужны для deployment. Чем глубже OpenAI уходит в железо, тем меньше эта история похожа на чистую software-компанию.

Что пока неизвестно

  • Цена и себестоимость Jalapeño.
  • Техпроцесс, память, упаковка, пропускная способность и число чипов в rack.
  • Финальные бенчмарки против GPU, TPU и других ASIC.
  • Какая доля ChatGPT, Codex и API будет обслуживаться на Jalapeño.
  • Будет ли чип доступен внешним клиентам или останется внутренней инфраструктурой OpenAI.
  • Как быстро Broadcom, Celestica и дата-центры смогут масштабировать поставки.

Пока эти данные не раскрыты, честный вывод такой: Jalapeño - важный инфраструктурный сигнал, но ещё не доказанная производственная платформа. Он показывает, куда OpenAI двигает inference-стек, но не отвечает на главный экономический вопрос: насколько дешевле и стабильнее станет каждый пользовательский запрос.

Источники и дата проверки

Факты в статье проверены 24 июня 2026 года. Для показателей производительности и сроков deployment возможны изменения после выхода технического отчёта OpenAI и новых заявлений Broadcom.

Читайте также

Telegram-канал @toolarium