AI-агенты Бенчмарки ИИ-агентов ломаются: почему 100% не значит способность Berkeley RDI показала, что популярные бенчмарки ИИ-агентов можно обходить почти до идеальных оценок. Объясняем, как читать leaderboard после этого.
LLM AI-суверенитет Европы: что предлагает Mistral и где план упирается в реальность Mistral выпустила playbook по AI-суверенитету Европы. Разбираем не PR, а практический план: таланты, единый рынок, закупки, инфраструктура и данные ЕС.
DeepSeek DeepSeek против OpenAI: как китайская лаборатория изменила рынок ИИ DeepSeek давит на OpenAI ценой API и открытыми весами V3/R1, но проигрывает в зрелости платформы и несёт отдельные риски для данных.
нейросети NVIDIA Blackwell: что меняют B200 и GB200 для ИИ-инфраструктуры Blackwell важен не только новым GPU. Объясняем, что дают B200 и GB200 NVL72, где у них преимущество над H100 и какие ограничения остаются у датацентров.
AI-агенты Создатель libGDX: ИИ-агенты копят ошибки быстрее, чем вы их замечаете Марио Зехнер, создатель libGDX, написал пост о том, как автономные ИИ-агенты накапливают ошибки, создают неуправляемую сложность и теряют код при поиске. Его рецепт — замедлиться.
DeepSeek Модели рассуждения: o3, DeepSeek-R1 и новая парадигма Модели рассуждения меняют подход к задачам ИИ. Разбираем o3, DeepSeek-R1, Claude и Gemini: как работает chain-of-thought, сравниваем бенчмарки и цены в 2026 году.
Anthropic Anthropic vs OpenAI: «табачная индустрия», контракт Пентагона и десятилетняя вражда Биограф Сэма Альтмана Кич Хейги опубликовала расследование о расколе OpenAI и Anthropic. Внутри Anthropic сравнивают OpenAI с табачной индустрией, а Дарио Амодеи назвал заявления Альтмана «прямой ложью».