Anthropic Mythos и NSA: почему AI safety упирается в доверие

Anthropic Mythos NSA стал тестом доверия к AI-лабораториям: что известно о сообщениях FT, чем отличается Glasswing и почему важны данные.

Официальный визуал Anthropic Project Glasswing для статьи про Anthropic Mythos NSA

Anthropic Mythos NSA - новый нервный сюжет вокруг AI safety. 5 июня 2026 года The Decoder со ссылкой на Financial Times сообщил, что NSA использует закрытую модель Anthropic Mythos для наступательных киберопераций, а около шести инженеров Anthropic работают рядом с агентством, чтобы адаптировать и поддерживать модель.

Здесь важно не перепрыгнуть через факты. На момент проверки 5 июня 2026 года Anthropic и NSA публично не подтверждали детали этой работы. Нет и публичного доказательства, что Mythos автономно атакует Китай, Иран или другие цели. Подтверждённая рамка другая: одна из самых заметных лабораторий с заявленной ставкой на безопасность продвигает закрытый доступ к сильной кибермодели как защитную меру, а теперь оказалась в сюжете про разведывательные кибероперации.

Anthropic Mythos - закрытая передовая модель Anthropic для поиска и анализа уязвимостей, доступ к которой компания выдаёт ограниченному кругу проверенных организаций. Поэтому новость про NSA важна не только как ещё один эпизод гонки ИИ в кибербезопасности. Она проверяет доверие к правилам доступа, публичным обещаниям и тому, кто видит реальные возможности таких моделей до рынка.

Скриншот The Decoder о сообщении Financial Times про Anthropic Mythos и NSA
The Decoder 5 июня 2026 года пересказал материал Financial Times о Mythos и NSA. Скриншот проверен 5 июня 2026 года.

Что именно сообщили про NSA

The Decoder пишет, что Mythos используют в NSA для наступательных киберопераций. В пересказе материала FT отдельно подчёркнуто, что инженеры Anthropic якобы размещены непосредственно при агентстве. Это не похоже на обычную поставку API или разовый пилот: если сообщение верно, речь идёт о поддержке модели на месте внутри чувствительного государственного контура.

Сценарий выглядит логичным технически. Модель, которую Anthropic описывает как сильную в поиске уязвимостей, может помогать быстро разбирать код, строить цепочки эксплуатации, проверять гипотезы и снижать цену работы специалистов. Но именно поэтому эта новость чувствительна. В кибербезопасности граница между защитой и атакой зависит не от названия модели, а от того, кто получил доступ, к каким системам и под каким контролем.

Мы уже разбирали Mythos как dual-use кибермодель, где trusted access становится главным фильтром. Новая деталь про NSA добавляет более жёсткий вопрос: если доступ считается доверенным, кто проверяет доверие к самому получателю и к поставщику?

Почему это чувствительно для Anthropic

Anthropic строила публичный образ на осторожности: конституционный подход, обоснование безопасности, ограниченный доступ к опасным возможностям, отказ выпускать слишком сильные инструменты без дополнительных защит. В обычной корпоративной риторике это звучит убедительно. Но Mythos показывает, что самый сложный конфликт возникает не на публичном релизе, а до него - когда модель уже достаточно сильна для государственных и коммерческих тестов, но общество видит только выборочные фрагменты.

У истории есть политический фон. В апреле вокруг Anthropic уже шёл конфликт с оборонным ведомством США: компания спорила с Пентагоном из-за ограничений на военное использование моделей и статуса поставщика. Теперь, если данные FT верны, та же Anthropic помогает NSA в кибероперационном контуре. Это не обязательно противоречие в юридическом смысле. Но для читателя и клиента оно выглядит как разрыв между публичной моральной позицией и практикой закрытых сделок.

Главная претензия здесь не в том, что кибермодель нельзя применять государству. Вопрос тоньше: может ли компания называться ориентированной на безопасность, если самые сильные и рискованные сценарии становятся видны только через утечки и журналистские материалы?

Чем это отличается от Project Glasswing

Официальный контур Anthropic выглядит иначе. 7 апреля 2026 года компания запустила Project Glasswing - программу контролируемого доступа к Claude Mythos Preview для поиска и исправления уязвимостей. Anthropic пишет, что модель уже помогла находить серьёзные проблемы в критическом ПО, а публичный релиз не планируется, пока не появятся достаточные защитные механизмы против опасных выводов.

В Glasswing компания называет стартовых партнёров: AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, J.P. Morgan, Linux Foundation, Microsoft, NVIDIA, Palo Alto Networks и другие организации. Отдельно Anthropic заявляет о 100 млн долларов кредитов на использование и 4 млн долларов прямых пожертвований для программы. Это понятная защитная логика: дать сильный инструмент тем, кто закрывает уязвимости в инфраструктуре, а не тем, кто монетизирует их.

Поэтому материал про NSA не отменяет Project Glasswing как защитную инициативу. Он показывает её предел. Партнёрская программа может быть публичной и аккуратно описанной, но параллельно могут существовать закрытые государственные контуры, где модель работает по другим правилам, с другими целями и без такого же уровня внешней прозрачности.

Государственный тест стал нормой

История про Mythos ложится на более широкий сдвиг в США. 2 июня 2026 года White House опубликовал указ Promoting Advanced Artificial Intelligence Innovation and Security. Документ описывает добровольный механизм ранней проверки продвинутых моделей ИИ с сильными кибервозможностями: разработчики могут давать государству доступ до развёртывания, в том числе на срок до 30 дней.

Скриншот указа White House Promoting Advanced Artificial Intelligence Innovation and Security
Указ White House от 2 июня 2026 года описывает добровольный контур ранней проверки продвинутых моделей ИИ с кибервозможностями. Скриншот проверен 5 июня 2026 года.

Это важный контекст. США не просто регулируют такие модели после выхода. Государство всё чаще хочет видеть их до публичного запуска, особенно если модель способна помогать в кибероперациях. Для безопасности это рационально: лучше проверить опасные возможности заранее. Для доверия это создаёт новую проблему: кто контролирует государственный доступ, как отделяется тестирование от эксплуатации и какие отчёты получает общество?

Три сюжета про доверие к AI-компаниям

Сюжет Почему важен Вывод для AI safety
NSA и Mythos Закрытая кибермодель попадает в разведывательный контур, если верны сообщения FT и The Decoder. Заявления о приоритете безопасности нельзя отделять от правил доступа, аудита и отчётности.
Recursive self-improvement Anthropic Institute 4 июня 2026 года написал, что ИИ всё заметнее помогает инженерам создавать новые ИИ-системы. Доверие нужно не только к модели на выходе, но и к процессу разработки.
Данные обучения Microsoft 2 июня 2026 года представила MAI-Thinking-1; официальный технический отчёт упоминает Common Crawl в корпусе данных. Обещания о качестве и происхождении данных должны быть проверяемыми, а не только маркетинговыми.

Эти три сюжета не одинаковые по риску. Сообщение про NSA касается операционного использования сильной кибермодели. Текст Anthropic Institute про recursive self-improvement говорит о том, что разработка самих AI-систем всё сильнее ускоряется ИИ: в материале Anthropic приводит оценку, что к марту 2026 года более 80% принятого кода компании было написано при участии Claude. Microsoft MAI - другой класс истории: там вопрос доверия касается того, как публичные обещания о данных соотносятся с техническим отчётом.

Но общий знаменатель один. Чем сильнее модели, тем меньше достаточно фразы "мы действуем ответственно". Нужны проверяемые правила: кто получает доступ, что именно логируется, кто может оспорить решение, какие инциденты публикуются и как независимые аудиторы видят закрытые тесты.

Где здесь Microsoft MAI и данные обучения

Microsoft 2 июня 2026 года представила MAI-Thinking-1, собственную модель рассуждений для Microsoft Foundry и Copilot. В сопутствующем техническом отчёте Microsoft упоминает Common Crawl среди источников данных. Это не доказывает конкретного нарушения прав и не связано напрямую с Mythos. Но это ещё один пример того, как доверие к ведущим AI-лабораториям быстро упирается в проверяемость заявлений.

Для Toolarium это продолжение уже знакомого вопроса о гонке за данными: когда компании покупают, лицензируют или собирают код и тексты, пользователю всё труднее понять, где заканчивается аккуратная подготовка данных и начинается серый слой. Мы отдельно разбирали этот рынок в материале о том, как Google покупает код у Play-разработчиков. В случае MAI важна не сенсация, а стандарт: если модель становится частью корпоративного продукта, происхождение данных должно быть описано так, чтобы его можно было проверить.

Что это значит для компаний и регуляторов

Для корпоративных клиентов Mythos - напоминание, что сильная модель для поиска уязвимостей не является обычным облачным сервисом. Перед тестом нужны вопросы о среде запуска, хранении логов, доступе инженеров поставщика, правах на найденные уязвимости, сроках раскрытия и сценариях, где модель может предложить слишком опасную инструкцию. Особенно если поставщик одновременно работает с государственными структурами.

Для регуляторов главный риск - не сама сила моделей, а непрозрачная асимметрия доступа. Одни участники рынка видят реальное поведение передовой модели до публичного релиза, другие получают пресс-релиз и карточку модели. В кибербезопасности такая асимметрия быстро превращается в преимущество: кто раньше видит класс уязвимостей, тот раньше может закрыть его или использовать.

Для Anthropic эта история сложнее рекламного кризиса. Если компания хочет оставаться примером ответственного подхода, ей придётся объяснять не только запреты в политике использования, но и исключения из них. Кто именно считается доверенным пользователем? Чем защитный доступ отличается от разведывательного? Есть ли внешняя проверка таких сделок? Без ответов слово safety начинает звучать как внутренний комплаенс-ярлык, а не как общественное обязательство.

Итог

Anthropic Mythos и NSA - это не доказательство того, что закрытые AI-модели уже самостоятельно ведут кибервойну. Такой вывод был бы сильнее доступных фактов. Но это серьёзный тест для доверия к лабораториям, которые публично ставят безопасность в центр: сильные модели уже используются в контурах, где прозрачность минимальна, а последствия ошибок могут быть политическими и инфраструктурными.

В 2026 году спор об AI safety всё меньше похож на спор о красивых принципах. Он становится спором о доступе, данных, инженерной зависимости и проверяемых правилах. Mythos в этом смысле важен не потому, что он "самый опасный". Он важен потому, что показывает: если передовой ИИ становится инфраструктурой кибербезопасности и разведки, доверие нельзя строить только на репутации компании.

Источники и дата проверки

Факты в материале проверены 5 июня 2026 года. Быстро меняющиеся данные о моделях, партнёрских программах и государственных правилах могут измениться после этой даты.

  • The Decoder - пересказ сообщения Financial Times о Mythos и NSA.
  • Anthropic Project Glasswing - официальный источник по Claude Mythos Preview, партнёрам и ограниченному доступу.
  • Anthropic Institute - официальный текст о recursive self-improvement и роли ИИ в разработке ИИ-систем.
  • White House - указ от 2 июня 2026 года о проверке продвинутых моделей ИИ.
  • Microsoft AI - официальный анонс MAI-Thinking-1.
  • Microsoft AI technical report - технический отчёт MAI-Thinking-1 с описанием источников данных.
Telegram-канал @toolarium