безопасность Gemini проверили на scheming: что это значит для безопасности AI-агентов DeepMind проверила Gemini на scheming в агентных coding/research сценариях: baseline выглядит спокойнее, но подсказки и права доступа меняют риск.
OpenAI OpenAI Rosalind Biodefense: зачем GPT-Rosalind дают биообороне OpenAI открыла Rosalind Biodefense: спонсируемый доступ к GPT-Rosalind для доверенных разработчиков и отдельных государственных команд по биообороне.
безопасность Prompt injection в jqwik: stdout как риск для AI coding agents jqwik 1.10.0 добавил prompt injection в stdout тестового движка. Разбираем, почему проблема не в одной строке, а в том, что AI coding agents читают логи как рабочий контекст.
безопасность AI safety закон Иллинойса: SB 315 прошёл обе палаты SB 315 прошёл обе палаты Иллинойса и может стать новым американским стандартом AI safety для frontier labs: аудит, отчёты, инциденты и роль штатов.
безопасность Google Cloud и Gemini API keys: где ломается AI security Почему старые Google API keys стали опаснее после Gemini: публичные ключи, счета за инференс, задержки budget alerts и окно отзыва до 23 минут.
LLM Квантизация LLM может ломать alignment: почему perplexity не хватает Разбор arXiv-работы Quantization Undoes Alignment: как 3-bit квантизация может добавлять bias и почему safety-аудит нужен после сжатия.
LLM arXiv вводит годовой бан за непроверенный AI-slop в препринтах arXiv будет банить авторов за непроверенный AI-slop: выдуманные ссылки, оставленные комментарии LLM и другие признаки халтуры.