GLM-5.1: китайская модель набрала 94,6% от Claude Opus в кодинге — и скоро станет open source
Z.ai выпустила GLM-5.1 — модель на 744 млрд параметров, которая набрала 45,3 балла в кодинг-тесте против 47,9 у Claude Opus 4.6. Обучена на Huawei Ascend без NVIDIA, скоро выйдет в open source под MIT.
27 марта 2026 года компания Z.ai (бывшая Zhipu AI) выпустила GLM-5.1, обновлённую версию своей флагманской языковой модели. В кодинг-бенчмарке модель набрала 45,3 балла против 47,9 у Claude Opus 4.6 от Anthropic. Разрыв составил 2,6 балла, то есть 94,6% от уровня флагмана. Предыдущая версия GLM-5 набирала 35,4, так что за полтора месяца рост составил 28%.
Модель доступна пользователям GLM Coding Plan и совместима с Claude Code, Cline и OpenClaw. Подписка начинается от $3 в месяц, что в 30 с лишним раз дешевле Claude Max за $100–200.
Что показала GLM-5.1 в тестах
Тестирование проводилось через Claude Code, инструмент самой Anthropic, заточенный под модели Claude. GLM-5.1 работала в чужой среде и всё равно подобралась вплотную к Opus 4.6.
По состоянию на 27 марта 2026 года:
| Модель | Coding Evaluation | % от Claude Opus 4.6 |
|---|---|---|
| Claude Opus 4.6 | 47,9 | 100% |
| GLM-5.1 | 45,3 | 94,6% |
| GLM-5 | 35,4 | 73,9% |
Помимо кодинг-результата, базовая GLM-5, на которой построена GLM-5.1, показывает сильные цифры в других бенчмарках:
- SWE-bench Verified: 77,8% — лучший результат среди всех open-source моделей (у Claude Opus 4.5 — 80,9%)
- Terminal-Bench 2.0: 56,2 балла, тоже лидер среди открытых моделей
- GPQA-Diamond: 86,0% (у Claude Opus 4.5 — 87,0%)
- AIME 2026 I: 92,7%, сопоставимо с Claude Opus 4.5 (93,3%)
Бенчмарки самой GLM-5.1 по другим тестам пока не раскрыты, полный технический отчёт ещё не опубликован.

Архитектура: 744 миллиарда параметров на китайском железе
GLM-5.1 построена на фундаменте GLM-5, вышедшей в феврале 2026 года. Характеристики платформы:
- 744 млрд параметров всего, из них 40 млрд активных при инференсе (архитектура Mixture of Experts)
- 28,5 трлн токенов данных для предобучения
- Контекстное окно: 200K токенов, до 128K на выходе
- Интеграция DeepSeek Sparse Attention для снижения стоимости деплоя
- Поддержка MCP (Model Context Protocol)
Вся модель обучена исключительно на чипах Huawei Ascend 910B. Ни одного GPU от NVIDIA. В условиях американских экспортных ограничений это показательно: Z.ai построила конкурентоспособную модель на полностью китайском железе.
Точная архитектура GLM-5.1 пока не раскрыта, но компания подтвердила, что базовые параметры как минимум сохранены.
Open source под лицензией MIT
GLM-5 уже выложена на Hugging Face и ModelScope с открытыми весами под лицензией MIT, самой свободной из популярных. Веса можно использовать в коммерческих продуктах без ограничений.
GLM-5.1 тоже станет open source. 20 марта глава Z.ai Ли Цзысюань написал в X: «Don't panic. GLM-5.1 will be open source». Точная дата публикации весов пока не объявлена.
Для локального запуска GLM-5 (744B) требуется минимум 4 GPU класса H200 или аналогичная конфигурация. Модель поддерживает инференс через vLLM и SGLang, а также работу на чипах Huawei Ascend, Moore Threads, Cambricon и других.

Сколько стоит и как подключить
GLM-5.1 доступна через подписку GLM Coding Plan на платформе Z.ai. По состоянию на март 2026 года:
| Тариф | Цена | Промо за 1-й месяц | Лимиты |
|---|---|---|---|
| Lite | $10/мес | $3 | 120 запросов за 5 часов |
| Pro | $30/мес | $15 | 600 запросов за 5 часов |
| Max | — | — | 4 000 поисковых запросов/мес |
Для сравнения: подписка Claude Max стоит $100–200 в месяц.
Отдельный API для GLM-5.1 пока не доступен. API базовой GLM-5 работает по таким ценам:
| Input | Output | |
|---|---|---|
| GLM-5 | $1 / 1M токенов | $3,2 / 1M токенов |
| GLM-5-Turbo | $1,2 / 1M токенов | $4 / 1M токенов |
| GLM-4.7-Flash | бесплатно | бесплатно |
Данные с официальной страницы docs.z.ai/guides/overview/pricing.
Coding Plan совместим с Claude Code, Cline, OpenClaw, Kilo Code, Roo Code и другими агентами. Достаточно сменить API-эндпоинт в настройках.
Почему это важно
GLM-5.1 станет первой open-source моделью, которая приблизилась к закрытому флагману Anthropic на расстояние менее 3 баллов в кодинг-бенчмарке. Здесь сошлись сразу несколько обстоятельств.
Модель обучена на китайских чипах Huawei Ascend 910B, без участия NVIDIA. Это снимает зависимость от американских экспортных ограничений и подтверждает, что альтернативное железо уже даёт конкурентный результат.
Подписка от $3 в месяц при промо, API от $1 за миллион токенов. Для разработчиков, которые активно используют LLM для кодинга, разница с Claude или GPT-5 ощутима.
MIT-лицензия позволяет запускать модель локально, дообучать и встраивать в коммерческие продукты. Для компаний, которым важна независимость от облачных провайдеров, это весомый аргумент.
На Reddit-сообществе LocalLLaMA уже обсуждают связку GLM-5-Turbo для повседневных задач и GLM-5.1 для сложного планирования как рабочий вариант с минимальными затратами.
Что дальше
Z.ai обещала опубликовать полный технический отчёт по GLM-5.1 и выложить веса в open source. Точные сроки не названы. Судя по темпам (GLM-5 вышла 11 февраля, GLM-5.1 через полтора месяца), следующее обновление может появиться уже в мае.
Разрыв в 5,4% от Claude Opus — дистанция одного-двух обновлений.