безопасность

Claude Mythos и patch gap: ИИ ищет уязвимости быстрее, чем их патчат

Project Glasswing показал новое узкое место в кибербезопасности: ИИ ускоряет поиск уязвимостей, но проверка, раскрытие и патчи остаются медленнее.

Проверено 27 мая 2026 года. В истории с Claude Mythos важны уже не только способности модели. Anthropic прямо пишет: Project Glasswing и примерно 50 партнеров нашли с помощью Claude Mythos Preview больше 10 000 уязвимостей высокой или критической серьезности. Раньше узким местом был поиск багов. Теперь, по словам компании, узкое место сместилось в проверку, ответственное раскрытие и патчи.

Это и есть новый patch gap: ИИ ищет уязвимости быстрее, чем команды успевают понять, какие из них реальны, кому их раскрывать и как быстро закрывать без вреда для пользователей. Для кибербезопасности это неприятный переходный период. Защитники получают сильный инструмент, но тот же сдвиг снижает цену поиска багов для всех, кто получит похожие модели.

Что именно сообщил Anthropic

22 мая Anthropic опубликовала первое большое обновление по Project Glasswing. Это не публичный запуск Claude Mythos Preview. Модель не выпущена публично и используется в контролируемой программе, где Anthropic дает доступ партнерам для защиты критического ПО.

Цифры у Anthropic резкие. За первый месяц большинство партнеров, по данным компании, нашли сотни уязвимостей высокой или критической серьезности в своем ПО. Совокупно их больше 10 000. Cloudflare, как приводит Anthropic, нашла 2 000 багов в критически важных системах, из них 400 высокой или критической серьезности. Mozilla, в свою очередь, нашла и исправила 271 уязвимость в Firefox 150 при тестировании Mythos Preview.

Отдельный блок касается open source. Anthropic пишет, что просканировала больше 1 000 проектов и получила 23 019 находок всех уровней серьезности. Из них Mythos Preview оценил 6 202 как уязвимости высокой или критической серьезности. После ручной проверки 1 752 таких находок 90,6% оказались верными срабатываниями, а 62,4% подтвердились как уязвимости высокой или критической серьезности. По текущим результатам проверки Anthropic оценивает, что только в коде с открытым исходным кодом модель уже вывела на поверхность почти 3 900 уязвимостей высокой или критической серьезности.

Диаграмма Anthropic показывает главное: от обнаружения до исправления проходит резкое сужение. На изображении учтены находки всех уровней серьезности по состоянию на 22 мая 2026 года. Источник: Anthropic.

Самая важная строка не в больших числах, а ниже. Anthropic сообщает, что некоторые мейнтейнеры просили замедлить раскрытие, потому что им нужно больше времени на разработку патчей. В среднем баг высокой или критической серьезности, найденный Mythos Preview, занимает две недели до исправления. К 22 мая, по словам компании, 530 багов высокой или критической серьезности уже раскрыты мейнтейнерам, 75 из них пропатчены, 65 получили публичные уведомления о безопасности, а еще 827 подтвержденных уязвимостей ждут раскрытия.

Почему это не просто шум вокруг новой модели

Скепсис здесь нужен. 10 000 находок не равны 10 000 публичным CVE, а оценка серьезности модели не заменяет проверку исследователя. Anthropic сама показывает, что между первичной находкой и исправлением в upstream-проекте огромная дистанция. Хорошая статья на эту тему не должна делать вид, что Claude Mythos уже автоматически взломал весь интернет.

Но списать все на маркетинг тоже не получается. В своем разборе Frontier Red Team Anthropic утверждает, что Mythos Preview в тестах способен не только находить, но и эксплуатировать zero-day уязвимости в крупных ОС и браузерах, когда пользователь направляет модель на такую задачу. В бенчмарке по уже исправленным багам Firefox JS shell предыдущая модель Opus 4.6 получала рабочие эксплойты два раза за несколько сотен попыток, а Mythos Preview дошла до 181 рабочего эксплойта и еще 29 раз получила контроль регистров.

Это не значит, что любой чат-бот завтра станет автономным атакующим. Но это значит, что разница между "модель заметила подозрительный код" и "модель собрала воспроизводимое доказательство" быстро сокращается. Для защитника это подарок. Для команды проверки это очередь, которая внезапно выросла в разы.

Mozilla и Cloudflare показывают, где начинается настоящая работа

У Mozilla уже есть практический пример. 21 апреля компания написала, что Firefox 150 включает исправления для 271 уязвимости, найденной во время первой оценки Claude Mythos Preview. Позже Mozilla Hacks разобрала процесс подробнее: в апреле 2026 года Firefox выпустил исправления для 423 багов безопасности, из них 271 относились к объявленной Mythos-оценке для Firefox 150. По серьезности внутри этих 271 багов было 180 sec-high, 80 sec-moderate и 11 sec-low.

Mozilla показывает скачок исправлений в апреле 2026 года: 423 бага безопасности за месяц. Источник: Mozilla Hacks.

Этот график хорошо объясняет, почему patch gap не решается одной моделью. Модель может найти больше. Потом людям нужно дедуплицировать отчеты, оценить эксплуатируемость, расставить приоритеты, написать патчи, пройти ревью, протестировать сборки и довести обновление до пользователей. Если хотя бы одно звено старое, вся новая скорость упирается в него.

Cloudflare в своем разборе Project Glasswing описывает ту же проблему инженерно. Простая команда "найди уязвимости в репозитории" дает шум и плохое покрытие. Рабочий подход похож на отдельную систему: разведка кода, узкие задачи поиска, независимая проверка, закрытие пробелов и дедупликация. Компания отдельно пишет, что состязательная проверка и разделение задач помогают снижать шум, а не просто раздувать очередь находок.

Для рынка это важнее красивой цифры. Claude Mythos не отменяет инженерию безопасности. Он делает хорошую команду инженерии безопасности быстрее и одновременно наказывает тех, у кого нет нормального приема отчетов, проверки и выпуска патчей.

Что меняется для 90-day disclosure

Anthropic не предлагает сжечь ответственное раскрытие. Наоборот, компания ссылается на отраслевую 90-дневную практику и пишет, что многие детали нельзя раскрывать сразу, пока пользователи не успели обновиться. Но сама логика 90 дней становится слабее, когда поиск и доказательство бага дешевеют.

Toolarium уже разбирал, почему 90-дневное раскрытие уязвимостей перестает работать как спокойный защитный буфер. История с Glasswing добавляет новый слой: окно раскрытия теперь конкурирует не только с ручными исследователями и патч-диффингом, но и с моделями, которые умеют быстро читать код, строить гипотезы и проверять их в тестовом контуре.

Здесь же проходит граница с темой бенчмарков эксплойтов. Поиск бага, подтверждение серьезности и боевая цепочка эксплуатации остаются разными вещами. Но если модели становятся сильнее в последних двух пунктах, то риск из ExploitBench и автономных AI-эксплойтов перестает быть абстрактным спором про бенчмарки. Он становится операционным вопросом: сколько времени у мейнтейнера есть между раскрытием, патчем и появлением воспроизводимого пути эксплуатации?

Где сюда вписывается Bumblebee

Сайдбар с Perplexity Bumblebee важен не потому, что он решает patch gap. Не решает. Но он показывает, какой защитный слой будет нужен чаще.

Perplexity 22 мая открыла Bumblebee, сканер на Go только для чтения для macOS и Linux рабочих машин разработчиков. Он проверяет не только пакетные менеджеры вроде npm, pnpm, Yarn, Bun, PyPI, Go modules, RubyGems и Composer, но и MCP-конфиги, расширения семейства VS Code и браузерные расширения. Важная деталь: Bumblebee не вызывает пакетные менеджеры, не запускает установочные скрипты, не читает исходный код приложений и не делает мониторинг сети и процессов.

В эпоху атак на цепочки поставок с помощью ИИ это выглядит прагматично. Если баги и вредоносные зависимости будут находиться и эксплуатироваться быстрее, защитникам нужна быстрая инвентаризация зоны риска. У кого стоит уязвимая версия? Где опасный MCP-конфиг? На каких рабочих машинах разработчиков есть расширение, которое нужно убрать сейчас, а не после недельной ручной сверки?

Практический вывод для команд

Первый вывод неприятный: нельзя строить процесс так, будто у вас по умолчанию есть спокойные недели на проверку. Для части находок высокой или критической серьезности нужен P0-режим с заранее понятными владельцами, SLA и правом выбивать место в релизном графике.

Второй: поиск багов с помощью ИИ без процесса приема отчетов быстро превращается в мусорную очередь. Нужны правила, какие отчеты принимаются, как они дедуплицируются, кто подтверждает воспроизводимость, где хранится доказательство воспроизводимости, как команда отличает "интересно" от "надо чинить сегодня".

Третий: доступ к защитным ИИ-возможностям придется отделять от обычного продуктового доступа. Anthropic уже делает это с Mythos Preview и Project Glasswing, а для более широких защитных сценариев продвигает отдельные инструменты и рабочие процессы. В этом контексте полезно держать рядом материал про Claude Security и разделение защитных продуктов от Mythos.

И четвертый: архитектура снова важнее скорости патча. Если одна уязвимость сразу ведет к полному взлому, команда всегда будет проигрывать календарю. Если нужны цепочки, есть границы песочниц, минимальные права, логирование и быстрый откат, patch gap становится менее смертельным.

Итог

Claude Mythos и Project Glasswing показывают не конец кибербезопасности, а смену узкого места. Уязвимости теперь можно искать намного быстрее. Но проверка, раскрытие, исправление и доставка патчей остаются человеческими, организационными и инфраструктурными процессами.

Поэтому главный вопрос не "насколько страшна Mythos". Вопрос практичнее: готова ли команда к миру, где хороший отчет об уязвимости появляется быстрее, чем тикет успевают правильно разметить? Если нет, patch gap будет расти даже у тех, кто первым получит сильные модели.