Россия

ИИ для российских компаний: что доступно, что нет и как обойтись

Обзор доступных AI-решений для российского бизнеса: отечественные модели, открытые альтернативы, облачные платформы и стратегии адаптации в условиях ограничений.

Российский бизнес оказался в уникальной ситуации: самые мощные AI-инструменты формально недоступны, но потребность в автоматизации никуда не делась. Компании адаптируются: кто-то использует отечественные модели, кто-то разворачивает открытые LLM на своих серверах, кто-то находит обходные пути через партнёров.

Разбираемся в текущей ситуации и практических вариантах.

Что заблокировано

К марту 2026 года российские компании не могут официально использовать:

OpenAI API (ChatGPT, GPT-4, DALL-E) — регистрация заблокирована для российских номеров и IP
Anthropic API (Claude) — аналогичные ограничения
Google Vertex AI — облачная платформа недоступна для российских юрлиц
Microsoft Azure OpenAI — облако Azure ограничено для России
Midjourney — блокировка по платёжным данным

Ограничения касаются именно коммерческих API и облачных сервисов. Открытые модели (Llama, Mistral, Stable Diffusion) доступны без ограничений — их веса можно скачать и использовать на любом оборудовании.

Российские AI-решения

YandexGPT (Яндекс)

Семейство языковых моделей от Яндекса, доступных через Yandex Cloud. Модели: YandexGPT Lite (быстрая), YandexGPT Pro (качественная), YandexGPT для генерации кода.

Плюсы: нативная работа с русским языком, соответствие российскому законодательству (хранение данных в РФ), API и SDK, интеграция с Yandex Cloud.

Минусы: качество на сложных задачах уступает Claude и GPT-4o, ограниченное контекстное окно (32K), менее развитый tool use.

Цена: от ₽0.60 за 1000 токенов (YandexGPT Lite).

GigaChat (Сбер)

Мультимодальная модель от Сбера. Работает с текстом и генерирует изображения (Kandinsky). Доступна через API и в виде чат-бота.

Плюсы: русский язык, генерация изображений в одном продукте, интеграция с экосистемой Сбера.

Минусы: качество кода и аналитики ниже, чем у западных аналогов. Закрытая модель, данные обрабатываются на серверах Сбера.

T-Bank AI (T-Банк)

T-Bank развивает собственные AI-модели для внутренних и корпоративных задач. Доступны API для партнёров и корпоративных клиентов.

MTS AI

МТС развивает AI-платформу для бизнеса: модели для обработки текста, речи и изображений. Фокус на телеком-задачах и корпоративных клиентах.

Открытые модели как альтернатива

Для технически готовых компаний открытые модели — сильная альтернатива проприетарным API.

Что можно развернуть

Llama 4 70B/405B — от Meta, одна из сильнейших открытых моделей. Качество близко к GPT-4o на многих задачах
Mistral Large — европейская модель с хорошей поддержкой русского языка
Qwen 3 — китайская модель от Alibaba, конкурентная на бенчмарках
DeepSeek V3 — эффективная модель с Mixture-of-Experts архитектурой

Инфраструктура для запуска

Для запуска крупных моделей (70B+) нужны GPU-серверы. Варианты:

Yandex Cloud GPU — серверы с NVIDIA A100/H100, дата-центры в России
Selectel GPU — российский облачный провайдер с GPU-инстансами
Собственное оборудование — для компаний с бюджетом на hardware. Сервер с 4×A100 стоит от $100K, но окупается при большой нагрузке
Ollama + LM Studio — для небольших моделей (до 13B) на обычном компьютере с хорошей видеокартой. Подробное руководство по настройке

Инструменты для развёртывания

vLLM — высокопроизводительный сервер инференса, поддерживает batching и PagedAttention
TGI (Text Generation Inference) от Hugging Face — готовый Docker-контейнер для развёртывания
Ollama — простейший способ запустить модель локально одной командой

Практические сценарии

Малый бизнес (до 50 сотрудников)

Рекомендация: YandexGPT или GigaChat для типовых задач + Ollama с небольшой моделью (Llama 8B, Gemma 9B) на офисном сервере для чувствительных данных.

Бюджет: от ₽5000/мес за API + ₽0 за Ollama (нужен сервер с GPU).

Средний бизнес (50–500 сотрудников)

Рекомендация: Llama 4 70B на Yandex Cloud GPU для основных задач + YandexGPT для интеграции с Yandex-экосистемой. Внутренний чат-бот на базе открытой модели + RAG по корпоративной базе знаний.

Бюджет: от ₽50 000/мес за GPU-инстансы + разработка.

Крупный бизнес

Рекомендация: собственная инфраструктура с несколькими моделями. Router, который направляет запросы к оптимальной модели. Fine-tuning открытых моделей на отраслевых данных. Команда ML-инженеров для поддержки.

Что важно учитывать

152-ФЗ. Персональные данные граждан РФ должны храниться на территории России. При использовании облачных AI-сервисов убедитесь, что данные не уходят за границу. Открытые модели на своих серверах автоматически решают эту проблему.

Качество vs доступность. Российские модели отстают от Claude Opus и GPT-4o на 15–25% по качеству на сложных задачах. Но для 80% бизнес-сценариев (классификация, суммаризация, простая генерация) этого достаточно.

Кадры. Развёртывание открытых моделей требует компетенций в ML-инфраструктуре. Если в компании нет ML-инженера, начинайте с облачных API (Yandex, Сбер) и переходите к self-hosted по мере роста экспертизы.

Ограничения — это вызов, но не стоп-фактор. Российские компании, которые инвестируют в AI-инфраструктуру сейчас, получат компетенции и независимость, которые окупятся в будущем.