NVIDIA H100 стоит дороже, чем три года назад: что происходит с рынком GPU

Reasoning-модели, дефицит памяти и бум AI-агентов развернули тренд на удешевление GPU. Разбираем цифры и причины.

NVIDIA H100 стоит дороже, чем три года назад: что происходит с рынком GPU

Четыре года — а цена растёт

NVIDIA представила архитектуру Hopper и чип H100 на конференции GTC в марте 2022 года. Первые поставки начались в октябре того же года. Обычно серверное оборудование теряет в цене по мере выхода новых поколений. С H100 произошло обратное.

По данным Latent.Space за 28 марта 2026 года, цены на аренду H100 уверенно растут с декабря 2025-го. Дилан Патель из SemiAnalysis в разговоре с Dwarkesh Patel подтвердил: H100 сейчас стоит дороже, чем три года назад, когда чип только появился на рынке. Четырёхлетний ускоритель, который по классическим моделям амортизации должен стоить 50–60% от первоначальной цены, торгуется на вторичном рынке за $20 000–30 000 — при начальной цене $25 000–40 000.

NVIDIA HGX H100 — серверная платформа с 8 GPU
NVIDIA HGX H100 — серверная платформа с 8 ускорителями. Источник: NVIDIA Developer Blog

Хронология: от дефицита к обвалу и обратно

Ценообразование H100 прошло через три отчётливых этапа.

2023 — голод. GPU не хватало физически. Облачная аренда стоила $8–10 в час. Очередь на поставку серверов растягивалась на 50 и более недель. CoWoS-упаковка TSMC, память HBM3 и подложки — всё было в дефиците. Компании, заполучившие H100, имели конкурентное преимущество просто по факту доступа к вычислениям.

2024 — коррекция. Цепочки поставок расшились, сроки ожидания упали до 8–12 недель. К августу 2024-го спотовые цены на аренду опустились до $1–2 в час. В первой половине 2025 года падение продолжилось: с $3,50+ до менее $1,50 за час. По данным Silicon Data, индекс аренды H100 к июню 2025-го составлял $2,36 — на 23% ниже сентября 2024-го. Отраслевые аналитики заговорили о «лопнувшем пузыре GPU».

Конец 2025 — разворот. В декабре 2025 года тренд резко сменился. Между 9 декабря 2025-го и 6 января 2026-го часовая ставка аренды H100 выросла на 10% — с $2,00 до $2,20. Это крупнейший краткосрочный скачок с середины 2025 года. При этом цены на A100 и B200 за тот же период не изменились — рост оказался точечным, только по H100.

Почему четырёхлетний чип дорожает

Reasoning-модели съедают больше GPU-часов

С декабря 2025 года спрос на вычисления вырос резко, и главная причина — reasoning-модели и AI-агенты. Модели вроде o3, Claude Opus 4.6 и DeepSeek R1 генерируют в разы больше токенов на каждый запрос, чем классические языковые модели. Обычный чат-бот тратит сотни токенов на ответ, reasoning-модель тратит десятки тысяч на внутренние цепочки рассуждений.

NVIDIA в марте 2026 года прямо указала, что reasoning-модели увеличивают потребление токенов и предъявляют новые требования к инфраструктуре на всех уровнях. Более умная модель означает больше GPU-часов на каждый запрос.

Софт сделал старое железо ценнее

Улучшение инференс-софта повысило ценность уже выпущенного оборудования. Оптимизации вроде TurboQuant (Google), RotorQuant и новые методы квантизации KV-кеша позволяют запускать на H100 рабочие нагрузки, которые год назад требовали более нового оборудования. Скорость декодирования выросла на 20–23% при 32K контексте, без замены железа.

Начальные 4–7-летние графики амортизации, заложенные в бизнес-модели дата-центров, оказались слишком пессимистичными. Данные аналитиков от 20 марта 2026 года показывают, что 45% от начальной стоимости на третий год — промежуточная, а не финальная точка. При текущем спросе H100 сохраняет полезность и рыночную стоимость дольше, чем предполагалось.

Дефицит памяти — новое бутылочное горлышко

Производители памяти — Samsung, SK Hynix и Micron — агрессивно перераспределяют мощности с обычной DDR5 и NAND Flash на HBM3e/HBM4 для дата-центров. По состоянию на март 2026 года масштабные AI-проекты потребляют до 40% мирового производства DRAM. Это привело к росту цен на полупроводниковую память на 200–400%.

По данным Dell и HP, доля памяти в стоимости сервера выросла с исторических 15–18% до 35%. Новые GPU дорожают из-за HBM-компонентов, а это поддерживает цены и на старое оборудование — потому что купить новое стало ещё сложнее и дороже.

Серверы Supermicro с NVIDIA HGX H100 и жидкостным охлаждением
Серверы Supermicro с NVIDIA HGX H100 и жидкостным охлаждением. Источник: Supermicro / PR Newswire

Рынок аренды: от $8 до $1,38 и обратно вверх

По состоянию на март 2026 года разброс цен на аренду H100 80GB огромен: от $1,38 в час у бюджетных провайдеров (Thunder Compute) до $14,19 у гиперскейлеров вроде AWS. Средний диапазон — $2,00–3,25 в час.

ПериодЦена аренды H100 ($/час)Контекст
Начало 2024$8–10Пик дефицита
Август 2024$1–2 (спот)Начало коррекции
Июнь 2025$2,36 (индекс)Стабилизация, −23% за год
Декабрь 2025$2,00Локальное дно
Январь 2026$2,20Начало разворота, +10%
Март 2026$1,38–14,19Сильная фрагментация

Источники: Silicon Data GPU Rental Index, Thunder Compute, Introl, JarvisLabs. Данные на март 2026 года.

Двукратный разброс цен на одинаковое оборудование — характерная черта этого рынка. Крупные корпоративные клиенты с годовыми контрактами почти не почувствовали декабрьский скачок. Весь ценовой удар пришёлся на сегмент спотовой аренды — стартапы и небольшие компании без предварительных договорённостей.

Покупка H100: вторичный рынок не думает падать

Прямая покупка нового H100 стоит $25 000–40 000 в зависимости от конфигурации. На вторичном рынке цены в марте 2026-го держатся на уровне $20 000–30 000 — неожиданно высоко для четырёхлетнего чипа.

Похожая ситуация с RTX 5090: рекомендованная цена $1 999, спотовая — выше $4 000. Компании, которые не могут купить серверные ускорители H100/H200 с очередью до года, покупают игровые карты для файн-тюнинга и инференса. Рабочая станция с четырьмя RTX 5090 стала реальной альтернативой для небольших команд.

Бутылочные горлышки: три звена одной цепи

Производство H100 упирается в три технологических ограничения.

CoWoS-упаковка TSMC. Каждый H100 требует сложной сборки «чип-на-пластине-на-подложке» с кремниевым интерпозером. TSMC наращивает мощности, но спрос опережает предложение в 1,4–1,6 раза. Этот разрыв, по оценкам Silicon Analysts (январь 2026), сохранится ещё 18–24 месяца.

Память HBM. SK Hynix, Samsung и Micron — единственные производители HBM. Их мощности полностью забронированы на 12–15 месяцев вперёд. Технология производства (TSV, укладка нескольких кристаллов DRAM) даёт низкий выход годных и длинные циклы.

Передовые техпроцессы. 4-нм и 3-нм узлы TSMC делят между собой NVIDIA, Apple, AMD и другие. Стоимость 3-нм пластины — $17 000–22 000. Это устанавливает высокий ценовой пол для всех новых GPU.

Что дальше: Blackwell не отменяет H100

Выход NVIDIA Blackwell (B200) не обрушил цены на H100. Классическая модель «новое поколение удешевляет старое» здесь не сработала. H100 занял позицию рабочего премиума: уже не передовое, но проверенное оборудование с отлаженным софтверным стеком.

Спрос на H100 идёт от разных сегментов: исследовательские лаборатории дообучают доменные модели, предприятия строят RAG-пайплайны, стартапы тренируют продуктовые системы. Эта широкая база потребителей делает H100 устойчивым к ценовой эрозии.

Рынок аренды GPU продолжает расти: с $3,34 млрд в 2023 году до $7,38 млрд в 2026-м, с прогнозом $26–34 млрд к 2032 году. Конкуренция смещается от чистой ценовой войны к качеству сервиса, инструментам разработчика и надёжности.

Практические выводы

Для тех, кто принимает решения о вычислительной инфраструктуре:

  • Горизонт планирования стоит закладывать на 12–18 месяцев. Закупить GPU за один квартал уже не получится: сроки поставки крупных партий серверных ускорителей составляют 30–50 недель.
  • Спотовый рынок стал зоной риска. Без долгосрочного контракта вы берёте на себя полную волатильность цен. Декабрьский скачок +10% за четыре недели — свойство рынка с низкой эластичностью предложения.
  • Имеет смысл работать с несколькими провайдерами. Двукратный разброс цен ($1,38 vs $4+ за час) на один и тот же GPU позволяет экономить при переключении.
  • AMD Instinct MI300 и Intel Gaudi становятся жизнеспособными вариантами для тех, кто не может позволить себе ждать. Миграция с CUDA требует инженерных усилий, но простой без вычислений обходится дороже.

По состоянию на 28 марта 2026 года. Рынок GPU меняется быстро — актуальные цены уточняйте у провайдеров.

Telegram-канал @toolarium