RAG

Retrieval-Augmented Generation: как подключить базы знаний к языковым моделям и строить RAG-системы.
AI-ассистент для колл-центра — архитектура RAG-системы на Qwen 8B
кейсы

AI-ассистент для колл-центра за 6 месяцев: как 12 бэкендеров без ML-опыта вывели проект в пилот

Российская компания построила голосового AI-ассистента «Суфлёр» силами 12 бэкендеров без ML-опыта. RAG вместо fine-tuning, Qwen 8B вместо облачного GPT, задержка 2 секунды.
Toolarium 4 мин
Ollama и LM Studio — настройка локальной LLM пошагово
LLM

Как настроить локальную языковую модель: полное руководство по Ollama, LM Studio и не только

Пошаговое руководство по настройке локальных языковых моделей: Ollama, LM Studio, Open WebUI. Выбор железа и моделей, квантизация, RAG, подключение через API — всё, чтобы запустить свой AI без облака.
Toolarium 13 мин
Telegram-канал @toolarium