OpenAI

OpenAI Broadcom Jalapeño: зачем OpenAI свой inference-чип

OpenAI и Broadcom показали Jalapeño, первый OpenAI Intelligence Processor для LLM inference. Разбираем, что известно, где vendor-claims и почему важна сеть.

Факты проверены 24 июня 2026 года. OpenAI Broadcom Jalapeño - первый OpenAI Intelligence Processor, inference-ускоритель для LLM, который OpenAI разрабатывает вместе с Broadcom. Его задача не заменить все GPU в мире, а удешевить и ускорить массовое обслуживание ChatGPT, Codex, API и будущих агентных продуктов.

Главное в анонсе не само слово «чип». OpenAI показывает, что хочет контролировать больше слоев своей AI-инфраструктуры: модель, вычислительные kernels, обслуживание запросов, сеть, rack-интеграцию и дата-центры. Если раньше гонку вычислений часто описывали как «кто купит больше GPU», Jalapeño переносит разговор ближе к вопросу «кто лучше оптимизирует весь путь токена до пользователя».

Что представили OpenAI и Broadcom

24 июня 2026 года OpenAI и Broadcom представили Jalapeño. OpenAI называет его первым Intelligence Processor и первым ускорителем в многоступенчатой compute-платформе, которую компании строят вместе. По официальному описанию, чип спроектирован вокруг будущего LLM inference, а не переделан из более общего ускорителя для старых AI-нагрузок.

В проекте участвует не только Broadcom. OpenAI пишет, что Celestica помогает с платами, rack-системами, интеграцией и промышленным выпуском. Broadcom отвечает за реализацию silicon, networking и connectivity. Отдельно в анонсе упомянут Tomahawk networking silicon.

OpenAI и Broadcom оформили партнёрство по custom AI accelerators ещё в октябре 2025 года. Источник: OpenAI.

По данным OpenAI, engineering samples Jalapeño уже запускают ML-нагрузки в лаборатории на целевой частоте и мощности, включая GPT-5.3-Codex-Spark. Финальных бенчмарков при этом нет: OpenAI обещает технический отчёт о производительности в ближайшие месяцы. Поэтому все формулировки про «существенно лучше performance per watt» стоит читать как раннюю оценку OpenAI, а не как независимое сравнение с GPU.

Коротко: что известно сейчас

Продукт: Jalapeño, первый OpenAI Intelligence Processor.
Фокус: LLM inference, то есть обслуживание запросов к языковым моделям.
Партнёры: Broadcom для silicon implementation, networking и connectivity; Celestica для board, rack и system integration.
Статус: engineering samples уже работают в лаборатории, но финальные показатели ещё не опубликованы.
Сроки: OpenAI говорит о первой deployment-волне к концу 2026 года и дальнейшем расширении в следующие годы.
Масштаб: CEO Broadcom Хок Тань говорит о дата-центрах гигаваттного масштаба с Microsoft и другими партнёрами, начиная с 2026 года.

Чем Jalapeño отличается от GPU и TPU

Jalapeño стоит воспринимать как custom ASIC под конкретный класс нагрузки. GPU остаётся универсальной рабочей лошадью для обучения, inference и смешанных задач. TPU и похожие ASIC обычно сильны там, где владелец может заранее подогнать модель, компилятор, память и сеть под свою платформу.

Критерий	Jalapeño	GPU	TPU / другие ASIC
Главная задача	LLM inference для продуктов OpenAI и совместимой отраслевой нагрузки	Универсальные AI и HPC-нагрузки: обучение, inference, симуляции	Оптимизированные workloads внутри конкретной платформы
Сильная сторона	Оптимизация под kernels, memory movement, networking и serving-паттерны OpenAI	Гибкость, зрелая software-цепочка, широкий рынок поставщиков	Цена/производительность на заранее выбранных задачах
Ограничение	Нет независимых бенчмарков и раскрытых характеристик	Не всегда лучший вариант для дешёвого массового inference	Меньше гибкости, сильная зависимость от платформы владельца
Что сравнивать	Задержку, стоимость токена, стабильность под пиковым спросом	Доступность, набор инструментов, стоимость кластера	Стоимость владения и качество компилятора/serving-слоя

Здесь важна дисциплина формулировок. Jalapeño не доказал, что «победил GPU»: OpenAI ещё не опубликовала финальные цифры. Но сам выбор направления логичен. На масштабе ChatGPT и API даже небольшое снижение стоимости одного ответа превращается в инфраструктурное преимущество.

Почему Broadcom важна не меньше самого чипа

В inference узкое место не всегда лежит в матричном умножении. Модель надо загрузить, распределить, обслужить тысячи параллельных запросов, передать данные между ускорителями и не потерять задержку на сети. Поэтому в анонсе OpenAI рядом с chip architecture стоят memory systems, networking, scheduling и deployment systems.

Это хорошо стыкуется с прежним материалом Toolarium о том, почему сеть, облака и энергия стали узким местом ИИ-кластеров. Если чип быстрее, но сеть и rack-архитектура не успевают, пользователь всё равно видит задержку, лимиты или рост цены API.

OpenAI упоминает Tomahawk networking silicon, но не раскрывает конкретную версию для Jalapeño. На изображении - официальный визуал Broadcom Tomahawk 6 как пример сетевого слоя для AI-кластеров. Источник: Broadcom.

Broadcom в этом сюжете продаёт не только «помощь с чипом». Компания приносит Ethernet, PCIe, optical connectivity и опыт крупных сетевых платформ. В октябре 2025 года OpenAI и Broadcom уже объявляли о сотрудничестве на 10 ГВт custom AI accelerators: тогда речь шла о racks с ускорителями OpenAI и сетевыми решениями Broadcom, deployment должен стартовать во второй половине 2026 года и завершиться к концу 2029-го.

Новый Jalapeño выглядит как конкретизация той сделки. В материале про 10 ГВт AI-инфраструктуры OpenAI в США мы уже писали, что борьба за compute стала вопросом не только денег, но и физической цепочки поставок. Теперь у этой цепочки появился публичный silicon-символ.

Девять месяцев tape-out: сильный сигнал, но не бенчмарк

OpenAI утверждает, что Jalapeño прошёл путь от initial design до manufacturing tape-out за девять месяцев. Компания также пишет, что это, по её оценке, самый быстрый ASIC development cycle для high-performance advanced semiconductors. Здесь лучше не превращать пресс-релиз в рекордную книгу: независимого подтверждения такого «самого быстрого» цикла пока нет.

Но сам срок важен. Если модели OpenAI действительно ускоряли часть дизайна и оптимизации, это замыкает интересную петлю: AI помогает проектировать инфраструктуру, на которой потом будет работать следующий AI. Для OpenAI это не только инженерный эксперимент, а способ быстрее обновлять compute-платформу под собственную линейку моделей.

Что это меняет для рынка AI-инфраструктуры

Первое последствие - давление на стоимость inference. Обучение моделей остаётся дорогим и престижным фронтом, но деньги в массовом AI-продукте сгорают при каждом запросе пользователя. ChatGPT, Codex, API и агентные продукты живут в режиме постоянного обслуживания. Если Jalapeño снижает стоимость токена и задержку, OpenAI получает больше пространства для лимитов, новых функций и ценовых манёвров.

Второе последствие - рост роли custom silicon. NVIDIA Blackwell и похожие GPU-платформы никуда не исчезают; для обучения и универсальных workloads они остаются центральными. Но на части inference-нагрузок у hyperscaler может появиться стимул строить собственный контур. Поэтому сравнивать Jalapeño с NVIDIA Blackwell надо аккуратно: это не одна и та же роль в стеке.

Третье последствие - больше зависимости от партнёров. OpenAI проектирует ускоритель, Broadcom помогает превратить его в silicon и сетевую платформу, Celestica участвует в rack/system integration, дата-центры и Microsoft нужны для deployment. Чем глубже OpenAI уходит в железо, тем меньше эта история похожа на чистую software-компанию.

Что пока неизвестно

Цена и себестоимость Jalapeño.
Техпроцесс, память, упаковка, пропускная способность и число чипов в rack.
Финальные бенчмарки против GPU, TPU и других ASIC.
Какая доля ChatGPT, Codex и API будет обслуживаться на Jalapeño.
Будет ли чип доступен внешним клиентам или останется внутренней инфраструктурой OpenAI.
Как быстро Broadcom, Celestica и дата-центры смогут масштабировать поставки.

Пока эти данные не раскрыты, честный вывод такой: Jalapeño - важный инфраструктурный сигнал, но ещё не доказанная производственная платформа. Он показывает, куда OpenAI двигает inference-стек, но не отвечает на главный экономический вопрос: насколько дешевле и стабильнее станет каждый пользовательский запрос.

Источники и дата проверки

Факты в статье проверены 24 июня 2026 года. Для показателей производительности и сроков deployment возможны изменения после выхода технического отчёта OpenAI и новых заявлений Broadcom.

OpenAI: OpenAI and Broadcom unveil LLM-optimized inference chip, 24 июня 2026 года.
OpenAI: strategic collaboration to deploy 10 gigawatts of OpenAI-designed AI accelerators, 13 октября 2025 года.
Broadcom Investors: OpenAI and Broadcom announce strategic collaboration, 13 октября 2025 года.
Broadcom: Tomahawk 6 / BCM78910 Series, страница продукта.

OpenAI Broadcom Jalapeño: зачем OpenAI свой inference-чип

Что представили OpenAI и Broadcom

Коротко: что известно сейчас

Чем Jalapeño отличается от GPU и TPU

Почему Broadcom важна не меньше самого чипа

Девять месяцев tape-out: сильный сигнал, но не бенчмарк

Что это меняет для рынка AI-инфраструктуры

Что пока неизвестно

Источники и дата проверки

Читайте также

Похожие статьи

Codex и SSD-износ: что баг с логами говорит о рисках AI-агентов

OpenAI Patch the Planet: от поиска багов к патчам

OpenAI beneficial trait training: как RL делает модели устойчивее

Codex Record & Replay: OpenAI учит агента повторять workflow