Deccan AI привлёк $25 млн на разметку данных для LLM: кто и зачем платит миллиарды за пост-тренинг
Индийский стартап Deccan AI закрыл раунд Series A на $25 млн для разметки данных и пост-тренинга больших языковых моделей. Что стоит за бумом рынка аннотации данных.
$25 млн на то, чтобы учить чужие модели
Индийский стартап Deccan AI закрыл раунд Series A на $25 млн. Лид-инвестор — A91 Partners, участвовали Prosus Ventures и Susquehanna International Group (SIG). Деньги пойдут на расширение главного продукта компании: подготовку данных для пост-тренинга больших языковых моделей.
Deccan AI не строит собственные модели. Компания помогает тем, кто строит: собирает экспертную обратную связь, проводит оценку качества и создаёт среды для обучения с подкреплением (RLHF). Среди клиентов — Google DeepMind и Snowflake.

Кто стоит за Deccan AI
Компанию основал Рукеш Редди (Rukesh Reddy) в октябре 2024 года. Штаб-квартира расположена в районе залива Сан-Франциско, операционный центр — в Хайдарабаде. В штате 125 сотрудников, а за его пределами — сеть из более чем 1 млн контрибьюторов: студенты, отраслевые специалисты, кандидаты и доктора наук.
В типичный месяц на платформе активны от 5 000 до 10 000 человек. Около 10% всей базы имеют степень магистра или PhD, а среди активных участников доля учёных ещё выше, в зависимости от проекта.
Сейчас у Deccan AI около десяти клиентов и пара десятков параллельных проектов. Выручка выросла в 10 раз за последний год и достигла «двузначных миллионов долларов» (точные цифры Редди не раскрывает). 80% дохода приносят пять крупнейших заказчиков. Для рынка, где покупателей единицы, а контракты на десятки миллионов, это ожидаемая структура.
Что именно делает Deccan AI
Пост-тренинг — этап после базового обучения модели. Здесь модель учат отвечать корректно, безопасно и полезно. Для этого нужны люди: они пишут эталонные ответы, оценивают варианты, создают сценарии для обучения с подкреплением.
Deccan специализируется на нескольких направлениях:
- Улучшение навыков программирования у моделей через генерацию экспертных примеров кода
- Обучение работе с внешними инструментами: API, базы данных, интерфейсы
- Оценка качества модели через собственный продукт Helix
- Автоматизация операций для корпоративных клиентов
Компания также работает над задачами для «мировых моделей» (world models), которые понимают физическую среду: робототехника, компьютерное зрение, пространственный интеллект.

Рынок разметки данных: от кликворкеров до миллиардеров
Три года назад «разметка данных» звучала как подработка для фрилансеров: отметить кота на фотографии, расставить ограничительные рамки. Теперь это один из самых быстрорастущих сегментов ИИ-индустрии.
По данным Oxford Economics и Scale AI, рынок аннотации данных оценивался в $2,7–5 млрд в 2024 году. К 2030 году он может достичь $19 млрд. Спрос на специалистов по аннотации вырос на 154% год к году (Upwork, 2026).
Масштабы видны по выручке ключевых игроков. По состоянию на март 2026 года:
- Mercor — $750 млн годовой повторяющейся выручки (ARR), оценка $10 млрд. Трое основателей стали самыми молодыми селф-мейд миллиардерами в истории, по версии Forbes
- micro1 — $200 млн ARR, рост с $7 млн до $100 млн за восемь месяцев
- Scale AI — приобретена Meta за $14 млрд (ранее крупнейший игрок рынка)
- Surge AI — достигла $1 млрд ARR за 24 месяца
Война за кадры дошла до абсурдных сумм: по данным Forbes, сотрудникам micro1 предлагали подписные бонусы от $500 тыс. до $2 млн за переход в Mercor. Переманивают не только инженеров, но и менеджеров по продажам, и проджект-лидов.
Почему Индия
Большинство контрибьюторов Deccan AI работают из Индии. Mercor и Turing набирают людей по всему миру, но Редди считает это минусом: «Если вы работаете в одной стране, контролировать качество гораздо проще. Наши конкуренты ищут экспертов в 100 с лишним странах».
Индия сегодня — крупнейший поставщик кадров и тренировочных данных для ИИ, хотя собственные фронтирные модели страна пока не разрабатывает. Те остаются за горсткой американских и китайских компаний.
Рынок аннотации данных в Индии вырос с $250 млн в 2020–2021 годах до прогнозных $7 млрд к 2030 году (оценка NASSCOM). Рост ИИ-найма в стране составляет 33,4% год к году — самый высокий в мире.
При этом вопрос оплаты остаётся болезненным. Индустрию критикуют за использование дешёвого гиг-труда. Редди утверждает, что на платформе Deccan AI контрибьюторы зарабатывают от $10 до $700 в час, а лучшие получают до $7 000 в месяц.
Что это значит для рынка ИИ
$25 млн — скромная сумма по меркам ИИ-стартапов, где раунды в сотни миллионов стали нормой. Но раунд Deccan AI показателен.
Фронтирные лаборатории всё активнее отдают пост-тренинг на аутсорс. OpenAI, Anthropic и Google DeepMind не справляются с этой работой своими силами. По словам Редди, допустимая погрешность на этапе пост-тренинга «близка к нулю»: одна ошибка может повлиять на поведение модели в продакшене. Это формирует спрос на компании вроде Deccan AI, способные обеспечить экспертную, доменно-специфичную разметку под жёсткие сроки.
Но у бизнес-модели есть очевидный риск. 80% выручки Deccan AI приходится на пятёрку клиентов. Потеря одного контракта может обрушить доходы. Deccan AI делает ставку на качество и позиционирует себя как «born GenAI» компанию, в отличие от старых игроков, которые начинали с разметки изображений для компьютерного зрения. Пока рынок растёт, это работает. Вопрос в том, как долго рост продолжится.
По состоянию на 28 марта 2026 года.