Главные AI-релизы марта 2026: Claude 4.6, GPT-4.5 и Gemini 2.5

Anthropic, OpenAI и Google выпустили крупные обновления моделей в марте 2026. Разбираем, что нового в Claude 4.6, GPT-4.5 и Gemini 2.5 — и как это меняет работу с LLM.

Главные AI-релизы марта 2026: Claude 4.6, GPT-4.5 и Gemini 2.5

Март 2026 года оказался насыщенным для индустрии AI. Три ведущих провайдера обновили свои флагманские модели практически одновременно. Разбираем, что изменилось, что это значит для разработчиков и какие модели выбирать для разных задач.

Claude 4.6 (Anthropic)

Anthropic представила обновлённое семейство Claude: Opus 4.6, Sonnet 4.6 и Haiku 4.5. Ключевое изменение — существенный рост качества кода, рассуждений и следования сложным инструкциям.

Что нового

Улучшенный tool use. Claude 4.6 точнее вызывает функции, корректнее обрабатывает вложенные JSON-схемы и стабильнее работает в многошаговых агентных сценариях. По внутренним тестам Anthropic, процент ошибок tool use снизился на 35% по сравнению с предыдущей версией.

Extended thinking 2.0. Режим расширенного мышления получил настраиваемый бюджет токенов и стал доступен для всех моделей семейства, включая Haiku. Теперь разработчик может задать budget_tokens от 1024 до 128000 — модель использует столько, сколько нужно для конкретной задачи.

Контекст 200K → 200K (улучшенный). Размер контекстного окна не изменился, но качество работы с длинным контекстом заметно выросло. Claude 4.6 лучше извлекает информацию из середины длинных документов — слабое место предыдущих версий.

Prompt caching. Кеширование системных промптов и повторяющегося контекста снижает стоимость до 90%. Для приложений с одним системным промптом и множеством пользователей — значительная экономия.

Цены

МодельInput / 1M токеновOutput / 1M токенов
Opus 4.6$15$75
Sonnet 4.6$3$15
Haiku 4.5$0.80$4

Подробнее о работе с Claude через API — в нашем практическом руководстве.

GPT-4.5 (OpenAI)

OpenAI выпустила GPT-4.5 — обновление, которое компания позиционирует как «самую знающую модель в мире». Акцент сделан на breadth of knowledge и естественности диалога.

Что нового

Расширенная база знаний. GPT-4.5 обучена на значительно большем объёме данных, включая актуальные источники до конца 2025 года. На фактологических бенчмарках модель показывает меньше галлюцинаций, чем GPT-4o.

Улучшенный EQ. OpenAI подчёркивает «эмоциональный интеллект» модели: GPT-4.5 лучше чувствует контекст и тон разговора, менее склонна к «роботизированным» ответам. На практике это заметно в клиентских чат-ботах и ролевых сценариях.

Structured Outputs. JSON Schema mode гарантирует строгое соответствие вывода заданной схеме. Работает стабильнее, чем в GPT-4o, поддерживает рекурсивные схемы.

Мультимодальность. Улучшенное распознавание сложных диаграмм, рукописного текста, таблиц в изображениях. Генерация изображений через DALL-E 3 прямо из чата.

Цены

GPT-4.5 доступна через API с ценами, аналогичными GPT-4o: $2.50 за 1M входных токенов, $10 за 1M выходных. ChatGPT Plus ($20/мес) включает доступ с лимитами.

Gemini 2.5 Pro (Google)

Google обновила Gemini до версии 2.5 Pro с фокусом на размышления (thinking) и контекстное окно рекордного размера.

Что нового

Встроенное мышление. Gemini 2.5 Pro по умолчанию «думает» перед ответом, подобно моделям o1/o3 от OpenAI. На математических бенчмарках (AIME, MATH-500) это даёт прирост 15–20% по сравнению с Gemini 2.0.

Контекст 2M токенов. Самое большое контекстное окно среди коммерческих моделей. Позволяет загрузить целый репозиторий, книгу или набор документов в один запрос. Для аналитики и исследований — серьёзное преимущество.

Мультимодальность. Работа с видео (до 1 часа), аудио, изображениями и PDF в одном запросе. Gemini может проанализировать видео с YouTube и ответить на вопросы по его содержанию.

Интеграция с Google. Gemini 2.5 глубоко интегрирован с Google Workspace: Docs, Sheets, Slides, Gmail. Для компаний на Google Workspace — это нативный AI-ассистент без дополнительных интеграций.

Цены

Google AI Studio: бесплатно для экспериментов (rate limits). Vertex AI: $1.25 за 1M входных токенов (до 200K), $2.50 за запросы с контекстом >200K. Output: $10 за 1M токенов.

Сравнительная таблица

ПараметрClaude 4.6GPT-4.5Gemini 2.5 Pro
Контекст200K128K2M
Встроенное мышлениеExtended thinkingНет (есть o3)Да
Tool use★★★★★★★★★☆★★★★☆
Код★★★★★★★★★☆★★★★☆
МультимодальностьИзображения, PDFИзображения, аудиоИзображения, видео, аудио
Русский язык★★★★★★★★★☆★★★☆☆

Какую модель выбрать

Для кода и агентов — Claude Opus 4.6 или Sonnet 4.6. Лучший tool use, стабильный вывод, расширенное мышление. Подробнее о выборе между моделями — в нашем гайде по LLM.

Для контента и клиентских чат-ботов — GPT-4.5. Естественный тон, широкая база знаний, DALL-E для генерации изображений.

Для аналитики больших документов — Gemini 2.5 Pro. Контекст в 2M токенов позволяет загрузить материал, который не поместится в Claude или GPT.

Для экономии — Claude Haiku 4.5 или GPT-4o mini. Покрывают 80% задач при стоимости в 5–10 раз ниже флагманских моделей.

Конкуренция между провайдерами — лучшее, что может быть для пользователей. Каждое обновление поднимает планку качества и снижает цены. Выбирайте модель под задачу, а не по бренду.