Андрей Карпатый в Anthropic: ставка на pre-training Claude

Андрей Карпатый перешёл в Anthropic, чтобы работать над pre-training Claude. Разбираем, почему это сигнал для всей гонки AI-лабораторий.

Андрей Карпатый выступает перед аудиторией, иллюстрация к новости о переходе в Anthropic

По состоянию на 27 мая 2026 года Андрей Карпатый перешёл в Anthropic и будет работать в команде pre-training Claude. Для рынка важен тип задачи: Anthropic забирает человека, который умеет соединять теорию нейросетей, обучение больших моделей и практическую инженерную работу.

Главная деталь новости в том, что Карпатый должен строить команду, которая будет использовать Claude для ускорения исследований pre-training. В этой роли Claude становится внутренним инструментом лаборатории, где рождаются следующие версии Claude.

Портрет Андрея Карпатого с его личного сайта
Андрей Карпатый описывает себя как AI researcher and educator; на личном сайте он перечисляет OpenAI, Tesla, Stanford CS231n и образовательные проекты. Источник: karpathy.ai, проверено 27 мая 2026 года.

Что произошло 19 мая 2026 года

Карпатый объявил о переходе 19 мая 2026 года. TechCrunch пишет, что он начал работу в Anthropic на той же неделе и вошёл в команду pre-training под руководством Nick Joseph. Axios отдельно уточняет со ссылкой на Anthropic: эта команда отвечает за крупные тренировочные прогоны, которые дают Claude базовые знания и возможности.

Формулировка важна. Карпатый не «вернулся из OpenAI» сейчас: он ушёл из OpenAI ещё в феврале 2024 года, после второго периода работы в компании. Затем он запустил Eureka Labs, образовательный проект про AI-native обучение. Теперь он возвращается к R&D в крупной лаборатории, но уже не в OpenAI, а у её прямого конкурента.

Anthropic, по данным TechCrunch и VentureBeat, видит для него отдельную задачу: собрать команду, которая будет применять Claude для ускорения исследований предобучения. Источники не подтверждают версию, что Claude начнёт «сам себя обучать». Речь о более приземлённой и ценной работе: быстрее проверять гипотезы, строить датасеты, анализировать ошибки и поддерживать исследователей там, где раньше всё упиралось в ручной труд.

Почему pre-training стал центром истории

Предобучение, или pre-training, это этап, на котором модель учится на огромном массиве данных до настройки под инструкции, диалоги и конкретные продукты. Именно здесь закладывается большая часть того, что потом воспринимается как «ум» модели: язык, факты, код, базовые навыки рассуждения, привычки к форматам.

Для лабораторий уровня Anthropic это один из самых дорогих участков работы. Нужны данные, вычисления, инфраструктура, план экспериментов и люди, которые понимают, какие изменения в обучении реально улучшают модель. Поэтому мы уже отдельно разбирали, почему для Anthropic важна не только исследовательская команда, но и вычислительная база: Google TPU и Amazon Trainium стали двумя опорами Claude.

Найм Карпатого показывает другой слой той же гонки. Одни деньги и GPU не решают задачу, если лаборатория медленно понимает, какие эксперименты запускать. Anthropic пытается ускорить сам цикл исследований: идея, проверка, анализ, новая гипотеза. Если Claude помогает на этом участке, выигрыш появляется ещё до следующего крупного тренировочного запуска.

Скриншот страницы Anthropic Research с направлениями Alignment, Interpretability, Societal Impacts и Frontier Red Team
Страница Anthropic Research показывает публичные исследовательские направления компании. Скриншот проверен 27 мая 2026 года: без cookie-баннера, капчи, логина и ошибок. Источник: Anthropic.

Почему именно Карпатый

У Карпатого редкая комбинация опыта. На своём сайте он пишет, что был участником команды-основателей OpenAI, затем директором AI в Tesla, где руководил компьютерным зрением для Autopilot, а в 2023-2024 годах снова работал в OpenAI над midtraining и synthetic data generation. Это близко к тому, что теперь нужно Anthropic: улучшать обучение моделей не только масштабом, но и качеством исследовательского процесса.

Отдельная причина - его публичная работа вокруг обучения и автоматизации исследований. Eureka Labs была заявлена как AI-native школа, а до этого Карпатый годами объяснял нейросети через CS231n, YouTube-лекции и открытые мини-проекты. Для Anthropic такая педагогика может быть рабочим навыком: человек, который умеет превращать сложную ML-практику в понятные процедуры, полезен при создании внутренних AI-инструментов для исследователей.

С этим связан и соседний материал Toolarium про Autoresearch Карпатого и цикл из 700 экспериментов. Новый переход не стоит сводить к Autoresearch, но направление похоже: ускорить работу исследователя за счёт моделей, которые помогают формулировать, запускать и разбирать эксперименты.

Что это говорит о гонке Anthropic и OpenAI

AI-гонку часто описывают через деньги, дата-центры и дефицит GPU. Это правда, но неполная. После определённого масштаба преимущество даёт не только больше вычислений, а способность быстрее превращать вычисления в знания о модели. Карпатый как раз из тех исследователей, которые умеют говорить на обоих языках: математическом и инженерном.

Для OpenAI это болезненный символический сигнал, но не катастрофа. Карпатый не был сотрудником OpenAI с 2024 года, поэтому речь не о внезапном уходе из текущей команды. Зато для Anthropic это сильный аргумент в борьбе за исследователей: компания показывает, что хочет быть местом, где можно работать не только над безопасностью и продуктом Claude, но и над базовой машиной обучения следующего поколения моделей.

Внешне это похоже на общий сдвиг к AI-native R&D. Исследовательские команды всё чаще строят не один большой чат-бот, а рабочую среду, где модели помогают писать код, проверять идеи, читать статьи, строить отчёты и держать контекст. Мы уже видели похожую логику в материале про OpenArx и AI-native инфраструктуру для науки и R&D-команд.

Что это может изменить для Claude

Самый реалистичный эффект - не мгновенный скачок Claude в ближайшем релизе. Pre-training работает длинными циклами, а крупные модели не улучшаются от одного найма за неделю. Если команда Карпатого окажется успешной, результат проявится позже: в более быстрых исследовательских итерациях, лучшем выборе данных, более точной диагностике ошибок и, возможно, в новых внутренних инструментах для команды Claude.

Есть и риск переоценить новость. Anthropic не раскрывала, какие именно задачи получит новая команда, какой у неё будет размер и какие метрики успеха компания будет считать главными. Поэтому корректный вывод такой: это сильный кадровый и исследовательский сигнал, но не доказательство, что Claude автоматически обгонит OpenAI, Google или Meta.

Для разработчиков и менеджеров, которые выбирают модели сейчас, практический смысл проще. Следите не за фамилией в анонсе, а за тем, появятся ли у Claude новые признаки зрелого research tooling: более устойчивые модели для кода и агентов, лучшее поведение на длинных задачах, прозрачные системные карты, сильные инструменты оценки и меньше случайных регрессий между версиями.

Что смотреть дальше

У этой истории есть несколько проверяемых продолжений. Первое - появятся ли у Anthropic публичные материалы о том, как Claude помогает исследователям в pre-training. Второе - будет ли Карпатый снова публиковать образовательные или технические разборы, но уже вокруг Claude. Третье - изменится ли ритм релизов Claude так, чтобы это выглядело как ускорение исследовательского цикла, а не просто очередной запуск более крупной модели.

Пока главный вывод сдержанный: Anthropic наняла не «звезду для витрины», а исследователя, который хорошо подходит к задаче ускорения R&D. Если компания права, следующая стадия гонки LLM будет решаться не только количеством чипов, но и тем, насколько быстро сами модели помогают улучшать процесс создания моделей.

Читайте также

Источники и дата проверки

Telegram-канал @toolarium