разработка

Open WebUI: веб-интерфейс для локальных моделей

Обзор Open WebUI — веб-интерфейса для работы с локальными языковыми моделями через Ollama.

Запуск языковой модели через терминал — рабочий вариант для разработчиков, но неудобный для команды. Open WebUI решает эту проблему: проект предоставляет полноценный веб-интерфейс для работы с локальными LLM через Ollama и совместимые API. За два года существования Open WebUI набрал более 60 000 звёзд на GitHub и стал стандартом для тех, кто хочет интерфейс уровня ChatGPT, но на собственном железе.

Что умеет Open WebUI

Open WebUI — не просто обёртка над API. Платформа включает управление несколькими моделями из единого окна, историю чатов с поиском, загрузку документов для RAG-запросов, поддержку мультимодальных моделей (изображения, голос) и систему пользователей с разграничением доступа.

Ключевое преимущество — совместимость. Open WebUI работает с Ollama, с любым API, совместимым с OpenAI (vLLM, LiteLLM, LocalAI), и напрямую с облачными провайдерами. Переключение между локальной Llama 3.1 и облачным GPT-4o происходит в один клик.

Установка через Docker

Самый быстрый способ запуска — Docker. Если Ollama уже установлена на хосте:

docker run -d -p 3000:8080 \
  --add-host=host.docker.internal:host-gateway \
  -v open-webui:/app/backend/data \
  --name open-webui \
  ghcr.io/open-webui/open-webui:main

Интерфейс будет доступен по адресу http://localhost:3000. Первый зарегистрированный пользователь автоматически получает права администратора.

Для установки вместе с Ollama в одном контейнере (например, на чистом сервере) используйте образ с GPU-поддержкой:

docker run -d -p 3000:8080 \
  --gpus all \
  -v ollama:/root/.ollama \
  -v open-webui:/app/backend/data \
  --name open-webui \
  ghcr.io/open-webui/open-webui:ollama

Первоначальная настройка

После запуска откройте веб-интерфейс и создайте учётную запись администратора. В разделе «Admin Panel → Settings → Connections» проверьте подключение к Ollama — URL по умолчанию http://host.docker.internal:11434 для Docker-установки.

Скачайте модели прямо из интерфейса: откройте «Admin Panel → Settings → Models» и введите название модели, например llama3.1:8b. Open WebUI запустит загрузку через Ollama автоматически. Подробнее о выборе модели — в нашем руководстве.

RAG: загрузка документов в контекст

Одна из сильнейших функций Open WebUI — встроенная поддержка RAG. Загрузите PDF, DOCX или TXT-файл прямо в чат, и модель будет отвечать на основе содержимого документа. Система автоматически разбивает документ на фрагменты, создаёт эмбеддинги и подставляет релевантные части в контекст запроса.

Для корпоративного использования можно создать «коллекции документов» — базы знаний, доступные всем пользователям. Это удобно для внутренней документации, регламентов или технических спецификаций. Принцип работы технологии подробно описан в статье о RAG.

Мультимодальность и голосовой ввод

Open WebUI поддерживает модели с анализом изображений (LLaVA, GPT-4o). Перетащите картинку в чат — модель опишет содержимое или ответит на вопросы о ней. Голосовой ввод работает через встроенный модуль распознавания речи или подключение внешнего Whisper-сервера.

Для голосового взаимодействия укажите в настройках URL вашего Whisper-сервера или используйте браузерное распознавание речи. Подробнее о голосовых технологиях — в статье о Whisper и TTS.

Управление пользователями

Open WebUI поддерживает три роли: администратор, пользователь и наблюдатель. Администратор управляет моделями, настройками и доступами. Пользователь работает с чатами и документами. Наблюдатель может только читать.

Для команд от 5 человек настройте LDAP или OAuth-аутентификацию — Open WebUI поддерживает интеграцию с Active Directory, Google Workspace и GitHub.

Расширения и пайплайны

Система пайплайнов позволяет добавлять пользовательскую логику: фильтры ввода (модерация, перевод), обработчики вывода (форматирование, цитирование источников) и кастомные функции (поиск по базе данных, вызов внешних API).

Пайплайны пишутся на Python и подключаются через интерфейс администратора. Пример — фильтр, который автоматически переводит запрос на английский перед отправкой в модель и переводит ответ обратно на русский.

Сравнение с альтернативами

На рынке интерфейсов для локальных LLM конкурируют три основных проекта: Open WebUI, Text Generation WebUI (Oobabooga) и LM Studio. Open WebUI выигрывает в многопользовательском режиме и RAG. Text Generation WebUI предлагает более тонкую настройку параметров генерации. LM Studio — десктопное приложение с максимально простой установкой, но без веб-доступа.

Для команды или корпоративного использования Open WebUI — оптимальный выбор. Для индивидуального экспериментирования с параметрами моделей лучше подойдёт LM Studio.

Итог

Open WebUI превращает локальную LLM в полноценный корпоративный инструмент. Установка занимает пять минут, а функциональность покрывает большинство сценариев — от простого чата до RAG-систем с управлением доступом. Для старта достаточно сервера с Ollama и одной командой Docker.

Подробнее: Как настроить локальную языковую модель

Open WebUI: что это и зачем нужно

Open WebUI — самостоятельно размещаемый веб-интерфейс для работы с локальными LLM через Ollama и OpenAI-совместимые API. Задача — дать пользователям ChatGPT-подобный интерфейс для моделей, запущенных локально или в собственной инфраструктуре.

Установка Open WebUI

# Через Docker (рекомендуется)
docker run -d   --name open-webui   -p 3000:8080   -v open-webui:/app/backend/data   --add-host=host.docker.internal:host-gateway   ghcr.io/open-webui/open-webui:main

# С GPU поддержкой
docker run -d   --gpus all   --name open-webui   -p 3000:8080   ghcr.io/open-webui/open-webui:cuda

Ключевые функции

Функция	Описание
Мультимодальность	Загрузка изображений для анализа (с совместимыми моделями: LLaVA, Bakllava)
RAG из документов	Загрузка PDF, Word, текстовых файлов как контекст для чата
Веб-поиск	Интеграция с SearXNG, Google PSE, Brave API для поиска в интернете
Управление моделями	Скачивание и управление Ollama-моделями прямо из интерфейса
Функции (Tools)	Встроенный Python sandbox для создания инструментов (кода, кастомных функций)
Multi-user	Аутентификация, роли (admin/user), изолированные истории чатов
Pipelines	Плагины для обработки запросов/ответов (фильтры, RAG, guardrails)

Конфигурация с внешними API

Open WebUI работает не только с Ollama — можно подключить любой OpenAI-совместимый API: Groq, Together AI, Anthropic (через прокси), локальный vLLM или LM Studio. Настройка через Admin Panel → Connections → OpenAI API. Это позволяет в одном интерфейсе переключаться между локальными моделями и облачными.

Open WebUI vs Alternatives

Open WebUI → мощный, self-hosted, multi-user, активно развивается (релизы каждые 1–2 недели)
Chatbot UI → проще в настройке, фокус на OpenAI API, меньше функций
Lobe Chat → красивый интерфейс, поддержка плагинов, но более тяжёлый
AnythingLLM → лучший RAG из документов, целевое решение для корпоративных баз знаний