Войти Подписаться

Ключевые хабы

LLM ИИ для разработчиков OpenAI AI-агенты Нейросети Продуктивность RAG

RAG

Retrieval-Augmented Generation: как подключить базы знаний к языковым моделям и строить RAG-системы.

USER2-base и OpenAI в юридическом RAG-бенчмарке на корпусе судебной практики

USER2-base догнала OpenAI в юридическом RAG-бенчмарке

На корпусе судебной практики USER2-base не уступила OpenAI text-embedding-3-large. Разбираем, что это меняет для русскоязычного юридического RAG.

AI-ассистент для колл-центра — архитектура RAG-системы на Qwen 8B

AI-ассистент для колл-центра за 6 месяцев: как 12 бэкендеров без ML-опыта вывели проект в пилот

Российская компания построила голосового AI-ассистента «Суфлёр» силами 12 бэкендеров без ML-опыта. RAG вместо fine-tuning, Qwen 8B вместо облачного GPT, задержка 2 секунды.

Ollama и LM Studio — настройка локальной LLM пошагово

Как настроить локальную языковую модель: полное руководство по Ollama, LM Studio и не только

Пошаговое руководство по настройке локальных языковых моделей: Ollama, LM Studio, Open WebUI. Выбор железа и моделей, квантизация, RAG, подключение через API — всё, чтобы запустить свой AI без облака.

Сравнение LangChain Docs и LlamaIndex High-Level Concepts

LangChain vs LlamaIndex: что выбрать для production RAG в 2026 году

LangChain vs LlamaIndex для production RAG: где важнее orchestration, data layer, observability и когда выгоднее гибридный стек.

ИИ-поиск в приложении с помощью эмбеддингов

разработка

Как встроить ИИ-поиск в приложение с эмбеддингами

Практическое руководство: как добавить семантический поиск в приложение с помощью эмбеддингов и векторных баз данных.

Страница arXiv статьи Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks

RAG: что это и когда он действительно нужен

Техническая опорная страница по RAG внутри LLM-кластера: когда retrieval действительно нужен, где достаточно длинного контекста и куда идти за базами, метриками и прикладными сценариями.

Векторные базы данных для RAG: Qdrant, Weaviate, Pinecone, pgvector и Chroma

Векторные базы данных для RAG: как выбрать Qdrant, Weaviate, Pinecone, pgvector и Chroma

Как выбрать Qdrant, Weaviate, Pinecone, pgvector и Chroma для RAG: где хватает Postgres, когда нужен managed retrieval и зачем важны фильтры.

Telegram-канал @toolarium