OpenAI Broadcom Jalapeño: зачем OpenAI свой inference-чип
OpenAI и Broadcom показали Jalapeño, первый OpenAI Intelligence Processor для LLM inference. Разбираем, что известно, где vendor-claims и почему важна сеть.
Факты проверены 24 июня 2026 года. OpenAI Broadcom Jalapeño - первый OpenAI Intelligence Processor, inference-ускоритель для LLM, который OpenAI разрабатывает вместе с Broadcom. Его задача не заменить все GPU в мире, а удешевить и ускорить массовое обслуживание ChatGPT, Codex, API и будущих агентных продуктов.
Главное в анонсе не само слово «чип». OpenAI показывает, что хочет контролировать больше слоев своей AI-инфраструктуры: модель, вычислительные kernels, обслуживание запросов, сеть, rack-интеграцию и дата-центры. Если раньше гонку вычислений часто описывали как «кто купит больше GPU», Jalapeño переносит разговор ближе к вопросу «кто лучше оптимизирует весь путь токена до пользователя».
Что представили OpenAI и Broadcom
24 июня 2026 года OpenAI и Broadcom представили Jalapeño. OpenAI называет его первым Intelligence Processor и первым ускорителем в многоступенчатой compute-платформе, которую компании строят вместе. По официальному описанию, чип спроектирован вокруг будущего LLM inference, а не переделан из более общего ускорителя для старых AI-нагрузок.
В проекте участвует не только Broadcom. OpenAI пишет, что Celestica помогает с платами, rack-системами, интеграцией и промышленным выпуском. Broadcom отвечает за реализацию silicon, networking и connectivity. Отдельно в анонсе упомянут Tomahawk networking silicon.

По данным OpenAI, engineering samples Jalapeño уже запускают ML-нагрузки в лаборатории на целевой частоте и мощности, включая GPT-5.3-Codex-Spark. Финальных бенчмарков при этом нет: OpenAI обещает технический отчёт о производительности в ближайшие месяцы. Поэтому все формулировки про «существенно лучше performance per watt» стоит читать как раннюю оценку OpenAI, а не как независимое сравнение с GPU.
Коротко: что известно сейчас
- Продукт: Jalapeño, первый OpenAI Intelligence Processor.
- Фокус: LLM inference, то есть обслуживание запросов к языковым моделям.
- Партнёры: Broadcom для silicon implementation, networking и connectivity; Celestica для board, rack и system integration.
- Статус: engineering samples уже работают в лаборатории, но финальные показатели ещё не опубликованы.
- Сроки: OpenAI говорит о первой deployment-волне к концу 2026 года и дальнейшем расширении в следующие годы.
- Масштаб: CEO Broadcom Хок Тань говорит о дата-центрах гигаваттного масштаба с Microsoft и другими партнёрами, начиная с 2026 года.
Чем Jalapeño отличается от GPU и TPU
Jalapeño стоит воспринимать как custom ASIC под конкретный класс нагрузки. GPU остаётся универсальной рабочей лошадью для обучения, inference и смешанных задач. TPU и похожие ASIC обычно сильны там, где владелец может заранее подогнать модель, компилятор, память и сеть под свою платформу.
| Критерий | Jalapeño | GPU | TPU / другие ASIC |
|---|---|---|---|
| Главная задача | LLM inference для продуктов OpenAI и совместимой отраслевой нагрузки | Универсальные AI и HPC-нагрузки: обучение, inference, симуляции | Оптимизированные workloads внутри конкретной платформы |
| Сильная сторона | Оптимизация под kernels, memory movement, networking и serving-паттерны OpenAI | Гибкость, зрелая software-цепочка, широкий рынок поставщиков | Цена/производительность на заранее выбранных задачах |
| Ограничение | Нет независимых бенчмарков и раскрытых характеристик | Не всегда лучший вариант для дешёвого массового inference | Меньше гибкости, сильная зависимость от платформы владельца |
| Что сравнивать | Задержку, стоимость токена, стабильность под пиковым спросом | Доступность, набор инструментов, стоимость кластера | Стоимость владения и качество компилятора/serving-слоя |
Здесь важна дисциплина формулировок. Jalapeño не доказал, что «победил GPU»: OpenAI ещё не опубликовала финальные цифры. Но сам выбор направления логичен. На масштабе ChatGPT и API даже небольшое снижение стоимости одного ответа превращается в инфраструктурное преимущество.
Почему Broadcom важна не меньше самого чипа
В inference узкое место не всегда лежит в матричном умножении. Модель надо загрузить, распределить, обслужить тысячи параллельных запросов, передать данные между ускорителями и не потерять задержку на сети. Поэтому в анонсе OpenAI рядом с chip architecture стоят memory systems, networking, scheduling и deployment systems.
Это хорошо стыкуется с прежним материалом Toolarium о том, почему сеть, облака и энергия стали узким местом ИИ-кластеров. Если чип быстрее, но сеть и rack-архитектура не успевают, пользователь всё равно видит задержку, лимиты или рост цены API.

Broadcom в этом сюжете продаёт не только «помощь с чипом». Компания приносит Ethernet, PCIe, optical connectivity и опыт крупных сетевых платформ. В октябре 2025 года OpenAI и Broadcom уже объявляли о сотрудничестве на 10 ГВт custom AI accelerators: тогда речь шла о racks с ускорителями OpenAI и сетевыми решениями Broadcom, deployment должен стартовать во второй половине 2026 года и завершиться к концу 2029-го.
Новый Jalapeño выглядит как конкретизация той сделки. В материале про 10 ГВт AI-инфраструктуры OpenAI в США мы уже писали, что борьба за compute стала вопросом не только денег, но и физической цепочки поставок. Теперь у этой цепочки появился публичный silicon-символ.
Девять месяцев tape-out: сильный сигнал, но не бенчмарк
OpenAI утверждает, что Jalapeño прошёл путь от initial design до manufacturing tape-out за девять месяцев. Компания также пишет, что это, по её оценке, самый быстрый ASIC development cycle для high-performance advanced semiconductors. Здесь лучше не превращать пресс-релиз в рекордную книгу: независимого подтверждения такого «самого быстрого» цикла пока нет.
Но сам срок важен. Если модели OpenAI действительно ускоряли часть дизайна и оптимизации, это замыкает интересную петлю: AI помогает проектировать инфраструктуру, на которой потом будет работать следующий AI. Для OpenAI это не только инженерный эксперимент, а способ быстрее обновлять compute-платформу под собственную линейку моделей.
Что это меняет для рынка AI-инфраструктуры
Первое последствие - давление на стоимость inference. Обучение моделей остаётся дорогим и престижным фронтом, но деньги в массовом AI-продукте сгорают при каждом запросе пользователя. ChatGPT, Codex, API и агентные продукты живут в режиме постоянного обслуживания. Если Jalapeño снижает стоимость токена и задержку, OpenAI получает больше пространства для лимитов, новых функций и ценовых манёвров.
Второе последствие - рост роли custom silicon. NVIDIA Blackwell и похожие GPU-платформы никуда не исчезают; для обучения и универсальных workloads они остаются центральными. Но на части inference-нагрузок у hyperscaler может появиться стимул строить собственный контур. Поэтому сравнивать Jalapeño с NVIDIA Blackwell надо аккуратно: это не одна и та же роль в стеке.
Третье последствие - больше зависимости от партнёров. OpenAI проектирует ускоритель, Broadcom помогает превратить его в silicon и сетевую платформу, Celestica участвует в rack/system integration, дата-центры и Microsoft нужны для deployment. Чем глубже OpenAI уходит в железо, тем меньше эта история похожа на чистую software-компанию.
Что пока неизвестно
- Цена и себестоимость Jalapeño.
- Техпроцесс, память, упаковка, пропускная способность и число чипов в rack.
- Финальные бенчмарки против GPU, TPU и других ASIC.
- Какая доля ChatGPT, Codex и API будет обслуживаться на Jalapeño.
- Будет ли чип доступен внешним клиентам или останется внутренней инфраструктурой OpenAI.
- Как быстро Broadcom, Celestica и дата-центры смогут масштабировать поставки.
Пока эти данные не раскрыты, честный вывод такой: Jalapeño - важный инфраструктурный сигнал, но ещё не доказанная производственная платформа. Он показывает, куда OpenAI двигает inference-стек, но не отвечает на главный экономический вопрос: насколько дешевле и стабильнее станет каждый пользовательский запрос.
Источники и дата проверки
Факты в статье проверены 24 июня 2026 года. Для показателей производительности и сроков deployment возможны изменения после выхода технического отчёта OpenAI и новых заявлений Broadcom.
- OpenAI: OpenAI and Broadcom unveil LLM-optimized inference chip, 24 июня 2026 года.
- OpenAI: strategic collaboration to deploy 10 gigawatts of OpenAI-designed AI accelerators, 13 октября 2025 года.
- Broadcom Investors: OpenAI and Broadcom announce strategic collaboration, 13 октября 2025 года.
- Broadcom: Tomahawk 6 / BCM78910 Series, страница продукта.