Войти Подписаться

Ключевые хабы

LLM ИИ для разработчиков OpenAI AI-агенты Нейросети Продуктивность RAG

AI-агенты

AI-агенты: автономные ИИ-системы, способные выполнять задачи без постоянного участия человека.

Основатели DeductiveAI на фоне сделки Elastic и роста рынка AI SRE

AI-агенты

Elastic покупает DeductiveAI: зачем рынку AI SRE

Сделка Elastic с DeductiveAI показывает, как observability-сервисы переходят от дашбордов к AI SRE-агентам для диагностики инцидентов.

MosaicLeaks и утечки приватных данных через deep-research агентов

безопасность

MosaicLeaks: как deep-research агенты выдают секреты через поиск

MosaicLeaks показывает, что deep-research агент может раскрыть приватные факты не ответом, а журналом внешних поисковых запросов.

Официальная обложка Google DeepMind для материала DeepMind AI Control Roadmap о контроле AI-агентов

безопасность

DeepMind AI Control Roadmap: как Google предлагает контролировать сильных AI-агентов

Google DeepMind выпустила AI Control Roadmap: дорожную карту системных защит для сильных AI-агентов внутри корпоративной инфраструктуры.

Схема Data2Story Virtual Newsroom: семь ролей агента от данных до проверяемой HTML-статьи

AI-агенты

Data2Story: как ИИ-агенты делают проверяемую журналистику

Data2Story показывает, как ИИ-агенты могут собрать data-историю и оставить проверяемый след от каждого утверждения к данным, коду или источнику.

Отравление AI search через Reddit и пользовательский контент

безопасность

Отравление AI search через Reddit: как UGC попадает в ответы

Исследование Cornell показывает, как UGC на Reddit, Quora и Wikipedia может отравлять ответы AI search. Объясняем WARP, риски цитат и границы выводов.

Nvidia ENPIRE: робототехническая ферма для обучения роботов через AI coding agents

AI-агенты

Nvidia ENPIRE: роботы учатся через AI coding agents

ENPIRE от NVIDIA, CMU и UC Berkeley переносит autoresearch в робототехнику: кодовые агенты пишут код оценки, запускают роботов и упираются в физику.

OpenAI LifeSciBench: сравнение моделей GPT-Rosalind, GPT-5.5, Gemini 3.1 Pro, GPT-5.4 и Grok 4.3 по задачам бенчмарка

AI-агенты

OpenAI LifeSciBench: как теперь измеряют научных ИИ-агентов

LifeSciBench проверяет не знание биологии, а реалистичную научную работу: артефакты, рубрики, ограничения и частичный прогресс моделей.

Telegram-канал @toolarium