Войти Подписаться

Ключевые хабы

LLM ИИ для разработчиков OpenAI AI-агенты Нейросети Продуктивность RAG

новости

Google TurboQuant — сжатие KV-кэша LLM в 6 раз без потери качества

Google TurboQuant: алгоритм сжимает память LLM в 6 раз без потери качества

Google Research представила TurboQuant — алгоритм сжатия KV-кэша до 3 бит, который уменьшает память LLM в 6 раз и ускоряет attention в 8 раз. Без потери качества.

Официальная иллюстрация Cloudflare Developers к платформе для AI-приложений и агентов

AI-агенты

Cloudflare Agent Cloud OpenAI: зачем агентам боевой контур

OpenAI и Cloudflare переводят AI-агентов из демо в production: GPT-5.4, Codex harness, Sandboxes и инфраструктура Agent Cloud.

OpenAI закрывает Sora — расходы $15 млн в день и разворот к корпоративному рынку

OpenAI закрывает Sora: $15 млн в день и разворот к корпоративному рынку

OpenAI закрывает Sora после полугода работы: $15 млн ежедневных расходов, отмена сделки Disney на $1 млрд и стратегический разворот к корпоративному рынку перед IPO.

Документация Linux Kernel AI Coding Assistants с правилами для AI-generated code

разработка

Linux kernel AI-generated code: правила для ИИ-кода

Linux kernel формализовал правила для AI-generated code: человек подписывает DCO, ИИ раскрывается через Assisted-by, а ответственность не переезжает на модель.

Банки тестируют Anthropic Mythos на фоне регуляторного конфликта в США

Anthropic Mythos и банки: почему США смотрят на тесты

Anthropic Mythos и банки: почему власти США могут подталкивать финансовый сектор к тестам модели и где начинается конфликт с комплаенсом.

Arcee Trinity-Large-Thinking — открытая модель Arcee AI для задач рассуждения

Arcee Trinity-Large-Thinking: открытая модель на 400B

Arcee AI выпустила Trinity-Large-Thinking — модель семейства Trinity с открытыми весами для задач рассуждения. Разбираем характеристики, бенчмарки и ограничения релиза.

Официальная графика SiFive и NVIDIA NVLink Fusion

нейросети

SiFive, NVIDIA и RISC-V CPU для AI-датацентров

Раунд SiFive на $400 млн показывает, что в AI-датацентрах снова важен слой CPU: RISC-V, заказные IP-блоки и связь с NVIDIA NVLink Fusion.

Telegram-канал @toolarium