AI-агенты Бенчмарки ИИ-агентов ломаются: почему 100% не значит способность Berkeley RDI показала, что популярные бенчмарки ИИ-агентов можно обходить почти до идеальных оценок. Объясняем, как читать leaderboard после этого.
разработка Cursor vs Copilot vs Windsurf: сравнение AI-помощников для кода в 2026 Сравниваем Cursor, GitHub Copilot и Windsurf по тарифам, агентным режимам, IDE, командным функциям и реальным сценариям выбора.
AI-агенты AI-агент MJ Rathbun и Matplotlib: где граница ответственности История MJ Rathbun показывает, что автономный агент может создать не только PR, но и репутационный кризис вокруг open-source проекта.
AI-агенты Apple против вайб-кодинга: App Store как фильтр AI-приложений Вайб-кодинг App Store упёрся в правило 2.5.2: Apple поддерживает AI-кодинг в Xcode, но фильтрует приложения, меняющие функции после ревью.
AI-агенты Anthropic и OpenClaw: что значит блокировка создателя для AI-агентов Anthropic сначала ограничила создателя OpenClaw, затем восстановила доступ. Новость показывает, как модельные провайдеры начинают контролировать сторонние агентные клиенты.
AI-агенты ИИ-агенты: что это и когда они действительно нужны Опорная страница по ИИ-агентам: что считать агентом, когда автономия действительно окупается и в каких случаях команде лучше выбрать workflow, RAG или один LLM-вызов.
Anthropic Claude Mythos и кибербезопасность: где реальный риск Mythos Preview показал 72,4% успеха в тесте Firefox JS shell, но реальный вывод тоньше: защита AI-агентов должна стать zero-trust.