Войти Подписаться

Ключевые хабы

LLM ИИ для разработчиков OpenAI AI-агенты Нейросети Продуктивность RAG

безопасность

Безопасность ИИ: атаки на языковые модели, защита данных, alignment и этические вопросы применения AI.

AI safety закон Иллинойса: Дэниел Дидех выступает в Палате представителей Иллинойса во время рассмотрения SB 315

безопасность

AI safety закон Иллинойса: SB 315 прошёл обе палаты

SB 315 прошёл обе палаты Иллинойса и может стать новым американским стандартом AI safety для frontier labs: аудит, отчёты, инциденты и роль штатов.

Логотип Google Cloud на стенде компании к материалу о Gemini API keys и AI security

безопасность

Google Cloud и Gemini API keys: где ломается AI security

Почему старые Google API keys стали опаснее после Gemini: публичные ключи, счета за инференс, задержки budget alerts и окно отзыва до 23 минут.

Заголовок arXiv-работы Quantization Undoes Alignment о квантизации LLM и bias

Квантизация LLM может ломать alignment: почему perplexity не хватает

Разбор arXiv-работы Quantization Undoes Alignment: как 3-bit квантизация может добавлять bias и почему safety-аудит нужен после сжатия.

Страница arXiv с исследованием о галлюцинированных ссылках и AI-slop в научных работах

arXiv вводит годовой бан за непроверенный AI-slop в препринтах

arXiv будет банить авторов за непроверенный AI-slop: выдуманные ссылки, оставленные комментарии LLM и другие признаки халтуры.

Безопасность агентских систем: заголовок Tproger о пяти атаках на ИИ-агентов и каналах утечки данных

AI-агенты

Безопасность агентских систем: атаки, GPU-часы и MEMO

ИИ-агенты становятся инфраструктурой. Разбираем, почему им нужны границы доступа, бюджет вычислений и управляемая память.

Иллюстрация Google Search к теме Google Zero и AI-поиска

Google Zero, AI-суды и zero-day clock: ИИ сжимает старые буферы

Google Zero, рост AI-документов в судах США и Zero Day Clock показывают один сдвиг: ИИ сокращает старые буферы времени, трафика и фильтрации.

BadHost CVE-2026-48710 и риск для MCP-серверов и AI-агентов

безопасность

BadHost: как CVE-2026-48710 в Starlette угрожает MCP и AI-агентам

BadHost в Starlette показывает, как обычная ошибка Host header превращается в риск для MCP-серверов, LLM proxy и OpenAI-compatible API.

Telegram-канал @toolarium