GLM-5.1: китайская модель набрала 94,6% от Claude Opus в кодинге — и скоро станет open source

Z.ai выпустила GLM-5.1 — модель на 744 млрд параметров, которая набрала 45,3 балла в кодинг-тесте против 47,9 у Claude Opus 4.6. Обучена на Huawei Ascend без NVIDIA, скоро выйдет в open source под MIT.

GLM-5.1: китайская модель набрала 94,6% от Claude Opus в кодинге — и скоро станет open source

27 марта 2026 года компания Z.ai (бывшая Zhipu AI) выпустила GLM-5.1, обновлённую версию своей флагманской языковой модели. В кодинг-бенчмарке модель набрала 45,3 балла против 47,9 у Claude Opus 4.6 от Anthropic. Разрыв составил 2,6 балла, то есть 94,6% от уровня флагмана. Предыдущая версия GLM-5 набирала 35,4, так что за полтора месяца рост составил 28%.

Модель доступна пользователям GLM Coding Plan и совместима с Claude Code, Cline и OpenClaw. Подписка начинается от $3 в месяц, что в 30 с лишним раз дешевле Claude Max за $100–200.

Что показала GLM-5.1 в тестах

Тестирование проводилось через Claude Code, инструмент самой Anthropic, заточенный под модели Claude. GLM-5.1 работала в чужой среде и всё равно подобралась вплотную к Opus 4.6.

По состоянию на 27 марта 2026 года:

МодельCoding Evaluation% от Claude Opus 4.6
Claude Opus 4.647,9100%
GLM-5.145,394,6%
GLM-535,473,9%

Помимо кодинг-результата, базовая GLM-5, на которой построена GLM-5.1, показывает сильные цифры в других бенчмарках:

  • SWE-bench Verified: 77,8% — лучший результат среди всех open-source моделей (у Claude Opus 4.5 — 80,9%)
  • Terminal-Bench 2.0: 56,2 балла, тоже лидер среди открытых моделей
  • GPQA-Diamond: 86,0% (у Claude Opus 4.5 — 87,0%)
  • AIME 2026 I: 92,7%, сопоставимо с Claude Opus 4.5 (93,3%)

Бенчмарки самой GLM-5.1 по другим тестам пока не раскрыты, полный технический отчёт ещё не опубликован.

Результаты GLM-5.1 в Coding Evaluation по сравнению с Claude Opus
Результаты GLM-5.1 в кодинг-тестах. Источник: Z.ai

Архитектура: 744 миллиарда параметров на китайском железе

GLM-5.1 построена на фундаменте GLM-5, вышедшей в феврале 2026 года. Характеристики платформы:

  • 744 млрд параметров всего, из них 40 млрд активных при инференсе (архитектура Mixture of Experts)
  • 28,5 трлн токенов данных для предобучения
  • Контекстное окно: 200K токенов, до 128K на выходе
  • Интеграция DeepSeek Sparse Attention для снижения стоимости деплоя
  • Поддержка MCP (Model Context Protocol)

Вся модель обучена исключительно на чипах Huawei Ascend 910B. Ни одного GPU от NVIDIA. В условиях американских экспортных ограничений это показательно: Z.ai построила конкурентоспособную модель на полностью китайском железе.

Точная архитектура GLM-5.1 пока не раскрыта, но компания подтвердила, что базовые параметры как минимум сохранены.

Open source под лицензией MIT

GLM-5 уже выложена на Hugging Face и ModelScope с открытыми весами под лицензией MIT, самой свободной из популярных. Веса можно использовать в коммерческих продуктах без ограничений.

GLM-5.1 тоже станет open source. 20 марта глава Z.ai Ли Цзысюань написал в X: «Don't panic. GLM-5.1 will be open source». Точная дата публикации весов пока не объявлена.

Для локального запуска GLM-5 (744B) требуется минимум 4 GPU класса H200 или аналогичная конфигурация. Модель поддерживает инференс через vLLM и SGLang, а также работу на чипах Huawei Ascend, Moore Threads, Cambricon и других.

Сравнение бенчмарков GLM-5 с Claude Opus 4.5, GPT-5.2 и другими моделями
Сравнение бенчмарков GLM-5 с ведущими моделями. Источник: The Decoder / Z.ai

Сколько стоит и как подключить

GLM-5.1 доступна через подписку GLM Coding Plan на платформе Z.ai. По состоянию на март 2026 года:

ТарифЦенаПромо за 1-й месяцЛимиты
Lite$10/мес$3120 запросов за 5 часов
Pro$30/мес$15600 запросов за 5 часов
Max4 000 поисковых запросов/мес

Для сравнения: подписка Claude Max стоит $100–200 в месяц.

Отдельный API для GLM-5.1 пока не доступен. API базовой GLM-5 работает по таким ценам:

InputOutput
GLM-5$1 / 1M токенов$3,2 / 1M токенов
GLM-5-Turbo$1,2 / 1M токенов$4 / 1M токенов
GLM-4.7-Flashбесплатнобесплатно

Данные с официальной страницы docs.z.ai/guides/overview/pricing.

Coding Plan совместим с Claude Code, Cline, OpenClaw, Kilo Code, Roo Code и другими агентами. Достаточно сменить API-эндпоинт в настройках.

Почему это важно

GLM-5.1 станет первой open-source моделью, которая приблизилась к закрытому флагману Anthropic на расстояние менее 3 баллов в кодинг-бенчмарке. Здесь сошлись сразу несколько обстоятельств.

Модель обучена на китайских чипах Huawei Ascend 910B, без участия NVIDIA. Это снимает зависимость от американских экспортных ограничений и подтверждает, что альтернативное железо уже даёт конкурентный результат.

Подписка от $3 в месяц при промо, API от $1 за миллион токенов. Для разработчиков, которые активно используют LLM для кодинга, разница с Claude или GPT-5 ощутима.

MIT-лицензия позволяет запускать модель локально, дообучать и встраивать в коммерческие продукты. Для компаний, которым важна независимость от облачных провайдеров, это весомый аргумент.

На Reddit-сообществе LocalLLaMA уже обсуждают связку GLM-5-Turbo для повседневных задач и GLM-5.1 для сложного планирования как рабочий вариант с минимальными затратами.

Что дальше

Z.ai обещала опубликовать полный технический отчёт по GLM-5.1 и выложить веса в open source. Точные сроки не названы. Судя по темпам (GLM-5 вышла 11 февраля, GLM-5.1 через полтора месяца), следующее обновление может появиться уже в мае.

Разрыв в 5,4% от Claude Opus — дистанция одного-двух обновлений.

Telegram-канал @toolarium