ИИ для российских компаний: что доступно, что нет и как обойтись
Обзор доступных AI-решений для российского бизнеса: отечественные модели, открытые альтернативы, облачные платформы и стратегии адаптации в условиях ограничений.
Российский бизнес оказался в уникальной ситуации: самые мощные AI-инструменты формально недоступны, но потребность в автоматизации никуда не делась. Компании адаптируются: кто-то использует отечественные модели, кто-то разворачивает открытые LLM на своих серверах, кто-то находит обходные пути через партнёров.
Разбираемся в текущей ситуации и практических вариантах.
Что заблокировано
К марту 2026 года российские компании не могут официально использовать:
- OpenAI API (ChatGPT, GPT-4, DALL-E) — регистрация заблокирована для российских номеров и IP
- Anthropic API (Claude) — аналогичные ограничения
- Google Vertex AI — облачная платформа недоступна для российских юрлиц
- Microsoft Azure OpenAI — облако Azure ограничено для России
- Midjourney — блокировка по платёжным данным
Ограничения касаются именно коммерческих API и облачных сервисов. Открытые модели (Llama, Mistral, Stable Diffusion) доступны без ограничений — их веса можно скачать и использовать на любом оборудовании.
Российские AI-решения
YandexGPT (Яндекс)
Семейство языковых моделей от Яндекса, доступных через Yandex Cloud. Модели: YandexGPT Lite (быстрая), YandexGPT Pro (качественная), YandexGPT для генерации кода.
Плюсы: нативная работа с русским языком, соответствие российскому законодательству (хранение данных в РФ), API и SDK, интеграция с Yandex Cloud.
Минусы: качество на сложных задачах уступает Claude и GPT-4o, ограниченное контекстное окно (32K), менее развитый tool use.
Цена: от ₽0.60 за 1000 токенов (YandexGPT Lite).
GigaChat (Сбер)
Мультимодальная модель от Сбера. Работает с текстом и генерирует изображения (Kandinsky). Доступна через API и в виде чат-бота.
Плюсы: русский язык, генерация изображений в одном продукте, интеграция с экосистемой Сбера.
Минусы: качество кода и аналитики ниже, чем у западных аналогов. Закрытая модель, данные обрабатываются на серверах Сбера.
T-Bank AI (T-Банк)
T-Bank развивает собственные AI-модели для внутренних и корпоративных задач. Доступны API для партнёров и корпоративных клиентов.
MTS AI
МТС развивает AI-платформу для бизнеса: модели для обработки текста, речи и изображений. Фокус на телеком-задачах и корпоративных клиентах.
Открытые модели как альтернатива
Для технически готовых компаний открытые модели — сильная альтернатива проприетарным API.
Что можно развернуть
- Llama 4 70B/405B — от Meta, одна из сильнейших открытых моделей. Качество близко к GPT-4o на многих задачах
- Mistral Large — европейская модель с хорошей поддержкой русского языка
- Qwen 3 — китайская модель от Alibaba, конкурентная на бенчмарках
- DeepSeek V3 — эффективная модель с Mixture-of-Experts архитектурой
Инфраструктура для запуска
Для запуска крупных моделей (70B+) нужны GPU-серверы. Варианты:
- Yandex Cloud GPU — серверы с NVIDIA A100/H100, дата-центры в России
- Selectel GPU — российский облачный провайдер с GPU-инстансами
- Собственное оборудование — для компаний с бюджетом на hardware. Сервер с 4×A100 стоит от $100K, но окупается при большой нагрузке
- Ollama + LM Studio — для небольших моделей (до 13B) на обычном компьютере с хорошей видеокартой. Подробное руководство по настройке
Инструменты для развёртывания
- vLLM — высокопроизводительный сервер инференса, поддерживает batching и PagedAttention
- TGI (Text Generation Inference) от Hugging Face — готовый Docker-контейнер для развёртывания
- Ollama — простейший способ запустить модель локально одной командой
Практические сценарии
Малый бизнес (до 50 сотрудников)
Рекомендация: YandexGPT или GigaChat для типовых задач + Ollama с небольшой моделью (Llama 8B, Gemma 9B) на офисном сервере для чувствительных данных.
Бюджет: от ₽5000/мес за API + ₽0 за Ollama (нужен сервер с GPU).
Средний бизнес (50–500 сотрудников)
Рекомендация: Llama 4 70B на Yandex Cloud GPU для основных задач + YandexGPT для интеграции с Yandex-экосистемой. Внутренний чат-бот на базе открытой модели + RAG по корпоративной базе знаний.
Бюджет: от ₽50 000/мес за GPU-инстансы + разработка.
Крупный бизнес
Рекомендация: собственная инфраструктура с несколькими моделями. Router, который направляет запросы к оптимальной модели. Fine-tuning открытых моделей на отраслевых данных. Команда ML-инженеров для поддержки.
Что важно учитывать
152-ФЗ. Персональные данные граждан РФ должны храниться на территории России. При использовании облачных AI-сервисов убедитесь, что данные не уходят за границу. Открытые модели на своих серверах автоматически решают эту проблему.
Качество vs доступность. Российские модели отстают от Claude Opus и GPT-4o на 15–25% по качеству на сложных задачах. Но для 80% бизнес-сценариев (классификация, суммаризация, простая генерация) этого достаточно.
Кадры. Развёртывание открытых моделей требует компетенций в ML-инфраструктуре. Если в компании нет ML-инженера, начинайте с облачных API (Yandex, Сбер) и переходите к self-hosted по мере роста экспертизы.
Ограничения — это вызов, но не стоп-фактор. Российские компании, которые инвестируют в AI-инфраструктуру сейчас, получат компетенции и независимость, которые окупятся в будущем.