LLM

GLM-5.1: китайская модель набрала 94,6% от Claude Opus в кодинге — и скоро станет open source

Z.ai выпустила GLM-5.1 — модель на 744 млрд параметров, которая набрала 45,3 балла в кодинг-тесте против 47,9 у Claude Opus 4.6. Обучена на Huawei Ascend без NVIDIA, скоро выйдет в open source под MIT.

27 марта 2026 года компания Z.ai (бывшая Zhipu AI) выпустила GLM-5.1, обновлённую версию своей флагманской языковой модели. В кодинг-бенчмарке модель набрала 45,3 балла против 47,9 у Claude Opus 4.6 от Anthropic. Разрыв составил 2,6 балла, то есть 94,6% от уровня флагмана. Предыдущая версия GLM-5 набирала 35,4, так что за полтора месяца рост составил 28%.

Модель доступна пользователям GLM Coding Plan и совместима с Claude Code, Cline и OpenClaw. Подписка начинается от $3 в месяц, что в 30 с лишним раз дешевле Claude Max за $100–200.

Что показала GLM-5.1 в тестах

Тестирование проводилось через Claude Code, инструмент самой Anthropic, заточенный под модели Claude. GLM-5.1 работала в чужой среде и всё равно подобралась вплотную к Opus 4.6.

По состоянию на 27 марта 2026 года:

Модель	Coding Evaluation	% от Claude Opus 4.6
Claude Opus 4.6	47,9	100%
GLM-5.1	45,3	94,6%
GLM-5	35,4	73,9%

Помимо кодинг-результата, базовая GLM-5, на которой построена GLM-5.1, показывает сильные цифры в других бенчмарках:

SWE-bench Verified: 77,8% — лучший результат среди всех open-source моделей (у Claude Opus 4.5 — 80,9%)
Terminal-Bench 2.0: 56,2 балла, тоже лидер среди открытых моделей
GPQA-Diamond: 86,0% (у Claude Opus 4.5 — 87,0%)
AIME 2026 I: 92,7%, сопоставимо с Claude Opus 4.5 (93,3%)

Бенчмарки самой GLM-5.1 по другим тестам пока не раскрыты, полный технический отчёт ещё не опубликован.

Результаты GLM-5.1 в кодинг-тестах. Источник: Z.ai

Архитектура: 744 миллиарда параметров на китайском железе

GLM-5.1 построена на фундаменте GLM-5, вышедшей в феврале 2026 года. Характеристики платформы:

744 млрд параметров всего, из них 40 млрд активных при инференсе (архитектура Mixture of Experts)
28,5 трлн токенов данных для предобучения
Контекстное окно: 200K токенов, до 128K на выходе
Интеграция DeepSeek Sparse Attention для снижения стоимости деплоя
Поддержка MCP (Model Context Protocol)

Вся модель обучена исключительно на чипах Huawei Ascend 910B. Ни одного GPU от NVIDIA. В условиях американских экспортных ограничений это показательно: Z.ai построила конкурентоспособную модель на полностью китайском железе.

Точная архитектура GLM-5.1 пока не раскрыта, но компания подтвердила, что базовые параметры как минимум сохранены.

Open source под лицензией MIT

GLM-5 уже выложена на Hugging Face и ModelScope с открытыми весами под лицензией MIT, самой свободной из популярных. Веса можно использовать в коммерческих продуктах без ограничений.

GLM-5.1 тоже станет open source. 20 марта глава Z.ai Ли Цзысюань написал в X: «Don't panic. GLM-5.1 will be open source». Точная дата публикации весов пока не объявлена.

Для локального запуска GLM-5 (744B) требуется минимум 4 GPU класса H200 или аналогичная конфигурация. Модель поддерживает инференс через vLLM и SGLang, а также работу на чипах Huawei Ascend, Moore Threads, Cambricon и других.

Сравнение бенчмарков GLM-5 с ведущими моделями. Источник: The Decoder / Z.ai

Сколько стоит и как подключить

GLM-5.1 доступна через подписку GLM Coding Plan на платформе Z.ai. По состоянию на март 2026 года:

Тариф	Цена	Промо за 1-й месяц	Лимиты
Lite	$10/мес	$3	120 запросов за 5 часов
Pro	$30/мес	$15	600 запросов за 5 часов
Max	—	—	4 000 поисковых запросов/мес

Для сравнения: подписка Claude Max стоит $100–200 в месяц.

Отдельный API для GLM-5.1 пока не доступен. API базовой GLM-5 работает по таким ценам:

	Input	Output
GLM-5	$1 / 1M токенов	$3,2 / 1M токенов
GLM-5-Turbo	$1,2 / 1M токенов	$4 / 1M токенов
GLM-4.7-Flash	бесплатно	бесплатно

Данные с официальной страницы docs.z.ai/guides/overview/pricing.

Coding Plan совместим с Claude Code, Cline, OpenClaw, Kilo Code, Roo Code и другими агентами. Достаточно сменить API-эндпоинт в настройках.

Почему это важно

GLM-5.1 станет первой open-source моделью, которая приблизилась к закрытому флагману Anthropic на расстояние менее 3 баллов в кодинг-бенчмарке. Здесь сошлись сразу несколько обстоятельств.

Модель обучена на китайских чипах Huawei Ascend 910B, без участия NVIDIA. Это снимает зависимость от американских экспортных ограничений и подтверждает, что альтернативное железо уже даёт конкурентный результат.

Подписка от $3 в месяц при промо, API от $1 за миллион токенов. Для разработчиков, которые активно используют LLM для кодинга, разница с Claude или GPT-5 ощутима.

MIT-лицензия позволяет запускать модель локально, дообучать и встраивать в коммерческие продукты. Для компаний, которым важна независимость от облачных провайдеров, это весомый аргумент.

На Reddit-сообществе LocalLLaMA уже обсуждают связку GLM-5-Turbo для повседневных задач и GLM-5.1 для сложного планирования как рабочий вариант с минимальными затратами.

Что дальше

Z.ai обещала опубликовать полный технический отчёт по GLM-5.1 и выложить веса в open source. Точные сроки не названы. Судя по темпам (GLM-5 вышла 11 февраля, GLM-5.1 через полтора месяца), следующее обновление может появиться уже в мае.

Разрыв в 5,4% от Claude Opus — дистанция одного-двух обновлений.

GLM-5.1: китайская модель набрала 94,6% от Claude Opus в кодинге — и скоро станет open source

Что показала GLM-5.1 в тестах

Архитектура: 744 миллиарда параметров на китайском железе

Open source под лицензией MIT

Сколько стоит и как подключить

Почему это важно

Что дальше

Похожие статьи

Риски AI-инфраструктуры: дата-центры, токены и безопасность LLM

Наделла о distillation: кто зарабатывает на AI-данных

AgenticSTS: структурированная память AI-агентов вместо длинного контекста

Databricks GLM 5.2: почему AI-кодинг считают по задаче