AI-агенты ИИ-агенты в продакшене: tokenmaxxing и tool-overuse Tokenmaxxing, tool-overuse и SkillGraph показывают, почему зрелые ИИ-агенты в продакшене требуют лимитов, трасс и осознанного порядка действий.
AI-агенты ИИ-агент Яндекса для покупок: как Алиса AI ищет дешевле ИИ-агент Яндекса для покупок уже ищет низкие цены, показывает товары в Алисе AI и ведёт к заказу через Yandex Commerce Protocol.
OpenAI WSJ: Sora сжигала $1 млн в день — настоящая причина закрытия Расследование WSJ раскрыло реальные причины закрытия Sora: $1 млн расходов в день, менее 500 тысяч пользователей, сорванная сделка с Disney на $1 млрд и конкуренция с Claude Code за GPU.
Claude 20 млн коммитов Claude Code — и 90% уходит в репозитории без звёзд Дашборд claudescode.dev показал: 50 млрд строк кода, 20 млн коммитов — и 90% уходит в репозитории без звёзд. Разобрали данные и выяснили, что реальная история интереснее заголовка.
AI-агенты Repo-level code localization: где AI-агенты ловят keyword shortcut Repo-level code localization кажется сильнее, чем есть: новый paper показывает роль keyword shortcut и объясняет, что меняют KA-LogicQuery и LogicLoc.
AI-агенты Rubric-Based GRM для SWE agents: почему pass/fail мало Разбираем paper Rubric-Based GRM: как рубрики помогают обучать SWE-агентов лучше, чем один pass/fail по unit-тестам.
AI-агенты HarmfulSkillBench: harmful skills AI-агентов и guardrails HarmfulSkillBench нашёл 4,93% вредных skills в двух открытых реестрах. Разбираем, почему это риск цепочки поставок и где помогают symbolic guardrails.