Главные AI-релизы марта 2026: Claude 4.6, GPT-4.5 и Gemini 2.5
Anthropic, OpenAI и Google выпустили крупные обновления моделей в марте 2026. Разбираем, что нового в Claude 4.6, GPT-4.5 и Gemini 2.5 — и как это меняет работу с LLM.
Март 2026 года оказался насыщенным для индустрии AI. Три ведущих провайдера обновили свои флагманские модели практически одновременно. Разбираем, что изменилось, что это значит для разработчиков и какие модели выбирать для разных задач.
Claude 4.6 (Anthropic)
Anthropic представила обновлённое семейство Claude: Opus 4.6, Sonnet 4.6 и Haiku 4.5. Ключевое изменение — существенный рост качества кода, рассуждений и следования сложным инструкциям.
Что нового
Улучшенный tool use. Claude 4.6 точнее вызывает функции, корректнее обрабатывает вложенные JSON-схемы и стабильнее работает в многошаговых агентных сценариях. По внутренним тестам Anthropic, процент ошибок tool use снизился на 35% по сравнению с предыдущей версией.
Extended thinking 2.0. Режим расширенного мышления получил настраиваемый бюджет токенов и стал доступен для всех моделей семейства, включая Haiku. Теперь разработчик может задать budget_tokens от 1024 до 128000 — модель использует столько, сколько нужно для конкретной задачи.
Контекст 200K → 200K (улучшенный). Размер контекстного окна не изменился, но качество работы с длинным контекстом заметно выросло. Claude 4.6 лучше извлекает информацию из середины длинных документов — слабое место предыдущих версий.
Prompt caching. Кеширование системных промптов и повторяющегося контекста снижает стоимость до 90%. Для приложений с одним системным промптом и множеством пользователей — значительная экономия.
Цены
| Модель | Input / 1M токенов | Output / 1M токенов |
|---|---|---|
| Opus 4.6 | $15 | $75 |
| Sonnet 4.6 | $3 | $15 |
| Haiku 4.5 | $0.80 | $4 |
Подробнее о работе с Claude через API — в нашем практическом руководстве.
GPT-4.5 (OpenAI)
OpenAI выпустила GPT-4.5 — обновление, которое компания позиционирует как «самую знающую модель в мире». Акцент сделан на breadth of knowledge и естественности диалога.
Что нового
Расширенная база знаний. GPT-4.5 обучена на значительно большем объёме данных, включая актуальные источники до конца 2025 года. На фактологических бенчмарках модель показывает меньше галлюцинаций, чем GPT-4o.
Улучшенный EQ. OpenAI подчёркивает «эмоциональный интеллект» модели: GPT-4.5 лучше чувствует контекст и тон разговора, менее склонна к «роботизированным» ответам. На практике это заметно в клиентских чат-ботах и ролевых сценариях.
Structured Outputs. JSON Schema mode гарантирует строгое соответствие вывода заданной схеме. Работает стабильнее, чем в GPT-4o, поддерживает рекурсивные схемы.
Мультимодальность. Улучшенное распознавание сложных диаграмм, рукописного текста, таблиц в изображениях. Генерация изображений через DALL-E 3 прямо из чата.
Цены
GPT-4.5 доступна через API с ценами, аналогичными GPT-4o: $2.50 за 1M входных токенов, $10 за 1M выходных. ChatGPT Plus ($20/мес) включает доступ с лимитами.
Gemini 2.5 Pro (Google)
Google обновила Gemini до версии 2.5 Pro с фокусом на размышления (thinking) и контекстное окно рекордного размера.
Что нового
Встроенное мышление. Gemini 2.5 Pro по умолчанию «думает» перед ответом, подобно моделям o1/o3 от OpenAI. На математических бенчмарках (AIME, MATH-500) это даёт прирост 15–20% по сравнению с Gemini 2.0.
Контекст 2M токенов. Самое большое контекстное окно среди коммерческих моделей. Позволяет загрузить целый репозиторий, книгу или набор документов в один запрос. Для аналитики и исследований — серьёзное преимущество.
Мультимодальность. Работа с видео (до 1 часа), аудио, изображениями и PDF в одном запросе. Gemini может проанализировать видео с YouTube и ответить на вопросы по его содержанию.
Интеграция с Google. Gemini 2.5 глубоко интегрирован с Google Workspace: Docs, Sheets, Slides, Gmail. Для компаний на Google Workspace — это нативный AI-ассистент без дополнительных интеграций.
Цены
Google AI Studio: бесплатно для экспериментов (rate limits). Vertex AI: $1.25 за 1M входных токенов (до 200K), $2.50 за запросы с контекстом >200K. Output: $10 за 1M токенов.
Сравнительная таблица
| Параметр | Claude 4.6 | GPT-4.5 | Gemini 2.5 Pro |
|---|---|---|---|
| Контекст | 200K | 128K | 2M |
| Встроенное мышление | Extended thinking | Нет (есть o3) | Да |
| Tool use | ★★★★★ | ★★★★☆ | ★★★★☆ |
| Код | ★★★★★ | ★★★★☆ | ★★★★☆ |
| Мультимодальность | Изображения, PDF | Изображения, аудио | Изображения, видео, аудио |
| Русский язык | ★★★★★ | ★★★★☆ | ★★★☆☆ |
Какую модель выбрать
Для кода и агентов — Claude Opus 4.6 или Sonnet 4.6. Лучший tool use, стабильный вывод, расширенное мышление. Подробнее о выборе между моделями — в нашем гайде по LLM.
Для контента и клиентских чат-ботов — GPT-4.5. Естественный тон, широкая база знаний, DALL-E для генерации изображений.
Для аналитики больших документов — Gemini 2.5 Pro. Контекст в 2M токенов позволяет загрузить материал, который не поместится в Claude или GPT.
Для экономии — Claude Haiku 4.5 или GPT-4o mini. Покрывают 80% задач при стоимости в 5–10 раз ниже флагманских моделей.
Конкуренция между провайдерами — лучшее, что может быть для пользователей. Каждое обновление поднимает планку качества и снижает цены. Выбирайте модель под задачу, а не по бренду.