Claude Opus 4.6 и Sonnet 4.6: полный обзор моделей Anthropic

Anthropic выпустила Claude 4.6 — разбираем архитектуру Opus 4.6 и Sonnet 4.6, возможности и результаты бенчмарков.

Интерфейс Claude Opus 4.6 и Sonnet 4.6 от Anthropic

Anthropic за первые месяцы 2026 года выпустила два крупных обновления: Claude Opus 4.6 (5 февраля) и Claude Sonnet 4.6 (17 февраля). Вместе с Haiku 4.5 (октябрь 2025) они составляют актуальную линейку моделей. По состоянию на март 2026 года Anthropic оценивается в $380 млрд, а годовая выручка приближается к $20 млрд. Вот что изменилось.

Линейка моделей Claude в 2026 году

МодельДата выходаКонтекстЦена (вход/выход за 1M)Лучшее применение
Claude Opus 4.65 февраля 20261M токенов$5 / $25Сложный анализ, агенты, рефакторинг
Claude Sonnet 4.617 февраля 20261M токенов (бета)$3 / $15Повседневная разработка, production API
Claude Haiku 4.5Октябрь 2025200K токенов$1 / $5Чат-боты, классификация, автоматизация

Цены по данным platform.claude.com, март 2026.

Claude Opus 4.6: флагман для агентных задач

Opus 4.6 — самая мощная модель Anthropic. Контекстное окно расширено до 1 миллиона токенов. На бенчмарке SWE-bench Verified (реальные задачи по исправлению багов в open-source проектах) модель набирает 79.2% с режимом thinking — первое место среди всех моделей по данным Vals AI на март 2026.

Где Opus 4.6 сильнее всего:

  • Агентные системы — координация нескольких инструментов, многошаговые рабочие процессы с минимальным числом ошибок
  • Кибербезопасность — в слепом тестировании Opus 4.6 показал лучший результат в 38 из 40 расследований по сравнению с моделями Claude 4.5
  • Рефакторинг кодовых баз — глубокое понимание контекста на миллион токенов позволяет работать с целыми репозиториями

Claude Sonnet 4.6: рабочая лошадка

Sonnet 4.6 — модель, которую большинство разработчиков используют ежедневно. При цене $3/$15 за миллион токенов она приближается к уровню Opus по качеству, но стоит в 1.7 раза дешевле на входе.

По данным Anthropic, в Claude Code пользователи предпочитали Sonnet 4.6 предыдущему Sonnet 4.5 в 70% случаев. Более того, Sonnet 4.6 оказался предпочтительнее даже Opus 4.5 (модель за ноябрь 2025) в 59% случаев — при стоимости в разы ниже.

Что говорят пользователи:

  • Модель читает контекст перед изменением кода, а не переписывает вслепую
  • Консолидирует общую логику вместо дублирования
  • Реже заявляет об успехе, когда задача не выполнена
  • Контекстное окно 1M токенов (бета) — целые кодовые базы, контракты, десятки статей в одном запросе

Бенчмарки: Claude vs конкуренты

По состоянию на март 2026 года:

БенчмаркClaude Opus 4.6Claude Sonnet 4.6GPT-5.4Gemini 3.1 Pro
SWE-bench Verified79.2%~70%77.2%~72%
Цена (вход/выход за 1M)$5 / $25$3 / $15$2.50 / $15$2 / $12
Контекст1M токенов1M токенов1.1M токенов1M токенов
Computer Use✅ Production✅ Production✅ Preview

Источники: swebench.com, Vals AI, официальные страницы pricing. Март 2026.

Расширенное мышление (Extended Thinking)

Extended thinking — режим, в котором модель «думает» перед ответом, выстраивая цепочку рассуждений длиной до 128 000 токенов. Пользователь видит результат мышления через API с параметром thinking. В отличие от OpenAI o3, где цепочка рассуждений скрыта, Claude показывает свои рассуждения — это помогает отлаживать промпты и понимать логику модели.

Sonnet 4.6 поддерживает как адаптивное мышление (модель сама решает, когда включать), так и расширенное мышление. Это позволяет гибко настраивать баланс между скоростью и качеством ответа.

Computer Use: управление компьютером

Computer Use — API для управления браузером и рабочим столом через скриншоты. Модель видит экран и выполняет клики, ввод текста, прокрутку. В продакшене с Opus 4.6, доступен через Anthropic API, Amazon Bedrock и Google Vertex AI.

На бенчмарке OSWorld-Verified (сотни задач в реальном ПО — Chrome, LibreOffice, VS Code) модели Sonnet показали стабильный рост за 16 месяцев. Sonnet 4.6 демонстрирует качество, близкое к человеческому, на задачах навигации по таблицам и заполнения многошаговых форм.

Что важно для разработчиков

  • API совместимость — переход с предыдущих версий требует только замены model ID на claude-opus-4-6 или claude-sonnet-4-6
  • MCP (Model Context Protocol) — стандарт интеграции с внешними сервисами. Работает в Claude.ai, Claude Code и через API
  • Context compaction (бета) — автоматическое сжатие старого контекста при приближении к лимиту, что увеличивает эффективную длину разговора
  • Платформы — api.anthropic.com, Amazon Bedrock, Google Cloud Vertex AI
import anthropic

client = anthropic.Anthropic()

message = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    messages=[
        {"role": "user", "content": "Объясни архитектуру трансформеров"}
    ]
)
print(message.content[0].text)

Эволюция: от Claude 3 до Claude 4.6

ВерсияДатаКонтекстSWE-bench VerifiedЦена Sonnet-класс
Claude 3 OpusМарт 2024200K~48%$15 / $75
Claude 3.5 SonnetОктябрь 2024200K~50%$3 / $15
Claude 3.7 SonnetФевраль 2025200K62.3%$3 / $15
Claude Opus 4.5Ноябрь 2025200K76.8%$15 / $75 (Opus)
Claude Opus 4.6Февраль 20261M79.2%$5 / $25 (Opus)
Claude Sonnet 4.6Февраль 20261M~70%$3 / $15

За два года цена Opus-класса снизилась с $15/$75 (Claude 3 Opus) до $5/$25 (Opus 4.6) — при троекратном росте качества. Контекстное окно выросло с 200K до 1M токенов.

Что выбрать: Opus, Sonnet или Haiku

Opus 4.6 — для задач, где критична точность: рефакторинг большой кодовой базы, координация агентов, анализ сложных документов. Стоит в 1.7x дороже Sonnet.

Sonnet 4.6 — для 80% повседневных задач разработки. По отзывам пользователей Claude Code, Sonnet 4.6 сравним с Opus предыдущего поколения, но при этом быстрее и дешевле. Оптимальный выбор по соотношению цена/качество.

Haiku 4.5 — для массовых задач: классификация, извлечение данных, чат-боты. Контекст 200K токенов, цена $1/$5.

Позиция на рынке: Claude vs GPT vs Gemini

Claude Opus 4.6 лидирует на SWE-bench Verified — главном бенчмарке для реального программирования. GPT-5.4 ($2.50/$15, выпущен 5 марта 2026) конкурирует по цене и предлагает мощный reasoning. Gemini 3.1 Pro ($2/$12) выигрывает на мультимодальных задачах и видео.

Преимущества Claude: точное следование инструкциям, минимум галлюцинаций в технических задачах, прозрачное мышление, сильный computer use. Подробнее — в сравнении Claude и Gemini и обзоре рынка LLM.

Telegram-канал @toolarium