Claude

Claude Opus 4.6 и Sonnet 4.6: полный обзор моделей Anthropic

Anthropic выпустила Claude 4.6 — разбираем архитектуру Opus 4.6 и Sonnet 4.6, возможности и результаты бенчмарков.

Anthropic за первые месяцы 2026 года выпустила два крупных обновления: Claude Opus 4.6 (5 февраля) и Claude Sonnet 4.6 (17 февраля). Вместе с Haiku 4.5 (октябрь 2025) они составляют актуальную линейку моделей. По состоянию на март 2026 года Anthropic оценивается в $380 млрд, а годовая выручка приближается к $20 млрд. Вот что изменилось.

Линейка моделей Claude в 2026 году

Модель	Дата выхода	Контекст	Цена (вход/выход за 1M)	Лучшее применение
Claude Opus 4.6	5 февраля 2026	1M токенов	$5 / $25	Сложный анализ, агенты, рефакторинг
Claude Sonnet 4.6	17 февраля 2026	1M токенов (бета)	$3 / $15	Повседневная разработка, production API
Claude Haiku 4.5	Октябрь 2025	200K токенов	$1 / $5	Чат-боты, классификация, автоматизация

Цены по данным platform.claude.com, март 2026.

Claude Opus 4.6: флагман для агентных задач

Opus 4.6 — самая мощная модель Anthropic. Контекстное окно расширено до 1 миллиона токенов. На бенчмарке SWE-bench Verified (реальные задачи по исправлению багов в open-source проектах) модель набирает 79.2% с режимом thinking — первое место среди всех моделей по данным Vals AI на март 2026.

Где Opus 4.6 сильнее всего:

Агентные системы — координация нескольких инструментов, многошаговые рабочие процессы с минимальным числом ошибок
Кибербезопасность — в слепом тестировании Opus 4.6 показал лучший результат в 38 из 40 расследований по сравнению с моделями Claude 4.5
Рефакторинг кодовых баз — глубокое понимание контекста на миллион токенов позволяет работать с целыми репозиториями

Claude Sonnet 4.6: рабочая лошадка

Sonnet 4.6 — модель, которую большинство разработчиков используют ежедневно. При цене $3/$15 за миллион токенов она приближается к уровню Opus по качеству, но стоит в 1.7 раза дешевле на входе.

По данным Anthropic, в Claude Code пользователи предпочитали Sonnet 4.6 предыдущему Sonnet 4.5 в 70% случаев. Более того, Sonnet 4.6 оказался предпочтительнее даже Opus 4.5 (модель за ноябрь 2025) в 59% случаев — при стоимости в разы ниже.

Что говорят пользователи:

Модель читает контекст перед изменением кода, а не переписывает вслепую
Консолидирует общую логику вместо дублирования
Реже заявляет об успехе, когда задача не выполнена
Контекстное окно 1M токенов (бета) — целые кодовые базы, контракты, десятки статей в одном запросе

Бенчмарки: Claude vs конкуренты

По состоянию на март 2026 года:

Бенчмарк	Claude Opus 4.6	Claude Sonnet 4.6	GPT-5.4	Gemini 3.1 Pro
SWE-bench Verified	79.2%	~70%	77.2%	~72%
Цена (вход/выход за 1M)	$5 / $25	$3 / $15	$2.50 / $15	$2 / $12
Контекст	1M токенов	1M токенов	1.1M токенов	1M токенов
Computer Use	✅ Production	✅ Production	✅	✅ Preview

Источники: swebench.com, Vals AI, официальные страницы pricing. Март 2026.

Расширенное мышление (Extended Thinking)

Extended thinking — режим, в котором модель «думает» перед ответом, выстраивая цепочку рассуждений длиной до 128 000 токенов. Пользователь видит результат мышления через API с параметром thinking. В отличие от OpenAI o3, где цепочка рассуждений скрыта, Claude показывает свои рассуждения — это помогает отлаживать промпты и понимать логику модели.

Sonnet 4.6 поддерживает как адаптивное мышление (модель сама решает, когда включать), так и расширенное мышление. Это позволяет гибко настраивать баланс между скоростью и качеством ответа.

Computer Use: управление компьютером

Computer Use — API для управления браузером и рабочим столом через скриншоты. Модель видит экран и выполняет клики, ввод текста, прокрутку. В продакшене с Opus 4.6, доступен через Anthropic API, Amazon Bedrock и Google Vertex AI.

На бенчмарке OSWorld-Verified (сотни задач в реальном ПО — Chrome, LibreOffice, VS Code) модели Sonnet показали стабильный рост за 16 месяцев. Sonnet 4.6 демонстрирует качество, близкое к человеческому, на задачах навигации по таблицам и заполнения многошаговых форм.

Что важно для разработчиков

API совместимость — переход с предыдущих версий требует только замены model ID на claude-opus-4-6 или claude-sonnet-4-6
MCP (Model Context Protocol) — стандарт интеграции с внешними сервисами. Работает в Claude.ai, Claude Code и через API
Context compaction (бета) — автоматическое сжатие старого контекста при приближении к лимиту, что увеличивает эффективную длину разговора
Платформы — api.anthropic.com, Amazon Bedrock, Google Cloud Vertex AI

import anthropic

client = anthropic.Anthropic()

message = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    messages=[
        {"role": "user", "content": "Объясни архитектуру трансформеров"}
    ]
)
print(message.content[0].text)

Эволюция: от Claude 3 до Claude 4.6

Версия	Дата	Контекст	SWE-bench Verified	Цена Sonnet-класс
Claude 3 Opus	Март 2024	200K	~48%	$15 / $75
Claude 3.5 Sonnet	Октябрь 2024	200K	~50%	$3 / $15
Claude 3.7 Sonnet	Февраль 2025	200K	62.3%	$3 / $15
Claude Opus 4.5	Ноябрь 2025	200K	76.8%	$15 / $75 (Opus)
Claude Opus 4.6	Февраль 2026	1M	79.2%	$5 / $25 (Opus)
Claude Sonnet 4.6	Февраль 2026	1M	~70%	$3 / $15

За два года цена Opus-класса снизилась с $15/$75 (Claude 3 Opus) до $5/$25 (Opus 4.6) — при троекратном росте качества. Контекстное окно выросло с 200K до 1M токенов.

Что выбрать: Opus, Sonnet или Haiku

Opus 4.6 — для задач, где критична точность: рефакторинг большой кодовой базы, координация агентов, анализ сложных документов. Стоит в 1.7x дороже Sonnet.

Sonnet 4.6 — для 80% повседневных задач разработки. По отзывам пользователей Claude Code, Sonnet 4.6 сравним с Opus предыдущего поколения, но при этом быстрее и дешевле. Оптимальный выбор по соотношению цена/качество.

Haiku 4.5 — для массовых задач: классификация, извлечение данных, чат-боты. Контекст 200K токенов, цена $1/$5.

Позиция на рынке: Claude vs GPT vs Gemini

Claude Opus 4.6 лидирует на SWE-bench Verified — главном бенчмарке для реального программирования. GPT-5.4 ($2.50/$15, выпущен 5 марта 2026) конкурирует по цене и предлагает мощный reasoning. Gemini 3.1 Pro ($2/$12) выигрывает на мультимодальных задачах и видео.

Преимущества Claude: точное следование инструкциям, минимум галлюцинаций в технических задачах, прозрачное мышление, сильный computer use. Подробнее — в сравнении Claude и Gemini и обзоре рынка LLM.