AI-агенты

Sakana AI Fugu: один API для нескольких LLM

Sakana AI Fugu — новый OpenAI-совместимый API, за которым работает модель-оркестратор нескольких LLM. Разбираем, что запустила Sakana, сколько это стоит и где заканчивается защита от vendor lock-in.

По состоянию на 22 июня 2026 года Sakana AI Fugu — это OpenAI-совместимый API, за которым работает модель-оркестратор нескольких LLM. Пользователь видит один endpoint, а Fugu внутри решает, когда ответить самой, когда собрать команду моделей и как свести их ответы в один результат.

Sakana подаёт Fugu как способ снизить зависимость от одного поставщика ИИ. Это сильный тезис, особенно после истории с Fable 5 и Mythos 5 у Anthropic. Но здесь важно не перепродать идею: Fugu уменьшает зависимость от одного провайдера моделей, зато добавляет новый слой зависимости от самой Sakana.

Sakana показывает Fugu как модель-оркестратор над пулом закрытых и открытых LLM. Источник: Sakana AI.

Что именно запустила Sakana

22 июня 2026 года Sakana AI объявила общедоступный запуск Fugu и Fugu Ultra. В официальном релизе компания описывает продукт как multi-agent orchestration system, упакованную в один foundation model и доступную через единый API.

На практике это похоже на слой маршрутизации и координации поверх нескольких моделей. Fugu выбирает модель под задачу, делегирует части работы, проверяет промежуточные ответы и собирает итог. Важная деталь: Sakana утверждает, что сам Fugu тоже языковая модель, обученная вызывать другие LLM из пула, включая рекурсивные вызовы собственных экземпляров.

В линейке два варианта. Fugu рассчитан на баланс качества и задержки: кодинг, ревью, чат-боты, интерактивные сервисы. Fugu Ultra нацелен на сложные многошаговые задачи: исследование, воспроизведение статей, анализ безопасности, патентный поиск. Оба варианта доступны через OpenAI-совместимый API, то есть существующий клиент или coding harness можно направить на endpoint Fugu без миграции SDK.

Для кого	Что меняет Fugu	Где остаётся риск
Разработчики	Один API вместо ручной сборки пула моделей и маршрутизатора	Отладка становится сложнее: ошибка может быть в модели, маршруте или синтезе
Бизнес	Можно не завязывать весь контур на одного поставщика LLM	Появляется зависимость от коммерческого слоя Sakana
Команды с compliance	Для Fugu можно исключать отдельных провайдеров или модели из пула	Fugu Ultra использует фиксированный полный пул, а ввод всё равно может идти во внешние LLM

Почему это связано с vendor lock-in

Sakana явно строит запуск вокруг темы зависимости от одного поставщика. Компания ссылается на директиву правительства США, после которой Anthropic 12 июня 2026 года сообщила о приостановке доступа к Fable 5 и Mythos 5 для иностранных граждан. В заявлении Anthropic отдельно сказано, что остальные модели компании не затронуты.

Для Toolarium это соседний, но не тот же кластер, что материал про зависимость от американских AI-платформ. Там главный вопрос был геополитическим и инфраструктурным. Fugu интересен как продуктовая реакция: спрятать несколько моделей за один API и дать пользователю управляемый пул.

В этом есть рациональное зерно. Если один провайдер исчезает из доступного набора, оркестратор может попытаться перейти на другие модели. Но устойчивость зависит от того, какие модели реально есть в пуле, какие из них доступны вашей организации и насколько Sakana прозрачно показывает маршрутизацию. Это ближе к управляемому AI-шлюзу, чем к полной независимости.

Поэтому Fugu стоит читать вместе с более широким вопросом про контроль AI-инфраструктуры. Один API удобен, но контроль смещается к тому, кто управляет пулом, политиками маршрутизации, логами и тарифами.

Бенчмарки выглядят сильно, но это данные Sakana

Sakana заявляет, что Fugu Ultra сопоставим с Anthropic Fable 5 и Mythos Preview на инженерных, научных и reasoning-бенчмарках. На продуктовой странице и в релизе есть важная оговорка: все оценки, кроме Fugu, взяты из публикаций самих поставщиков моделей; для Fable 5 и Mythos Preview Sakana берёт максимум двух значений, если оба доступны на одном тесте. Эти модели не входят в пул Fugu, потому что они не доступны публично.

Сравнение Fugu и Fugu Ultra с базовыми frontier-моделями по данным Sakana. Это не независимый тест. Источник: Sakana AI.

Бенчмарк	Fugu	Fugu Ultra	Что видно по таблице Sakana
SWE Bench Pro	59,0	73,7	Ultra выше Fugu и заявленных базовых моделей в этой строке
TerminalBench 2.1	80,2	82,1	оба Fugu идут выше указанных Opus, Gemini и GPT
LiveCodeBench Pro	87,8	90,8	Ultra лидирует среди значений в таблице Sakana
Humanity’s Last Exam	47,2	50,0	Ultra чуть выше Fable 5 в опубликованном сравнении
MRCRv2	86,6	93,6	здесь GPT 5.5 выше Fugu Ultra: 94,8 против 93,6

Эти числа годятся как сигнал, что Sakana научилась делать оркестрацию конкурентной. Они не доказывают, что Fugu всегда лучше одиночной frontier-модели в рабочем контуре. На результат будет влиять задача, задержка, стоимость, доступность нужных моделей и то, насколько хорошо оркестратор понимает, когда делегировать, а когда не усложнять.

Сколько стоит Fugu

Цены ниже актуальны на 22 июня 2026 года и взяты с официальной страницы Sakana Fugu. У сервиса есть подписка и pay-as-you-go.

Тариф	Цена	Для чего
Standard	$20 в месяц	лёгкое ежедневное использование и небольшие эксперименты
Pro	$100 в месяц	регулярный кодинг, ревью, исследование и анализ; 10x Standard usage
Max	$200 в месяц	длинные тяжёлые задачи; 20x Standard usage
Fugu в pay-as-you-go	ставка базовой модели; при нескольких агентах берётся ставка верхнего tier, а не сумма всех моделей	эластичная нагрузка и enterprise-сценарии
Fugu Ultra pay-as-you-go	$5 input, $30 output, $0,50 cached input за 1 млн токенов	сложные многошаговые задачи с оплатой за токены
Fugu Ultra при контексте больше 272K	$10 input, $45 output, $1 cached input за 1 млн токенов	длинный контекст и тяжёлые сессии

Главная экономическая идея Fugu в pay-as-you-go звучит разумно: если в пуле работает несколько агентов, Sakana не складывает цены всех моделей, а берёт одну ставку по самой дорогой модели в активном наборе. Для команды это проще, чем считать каждый маршрут вручную. Но без собственных логов использования всё равно трудно понять, будет ли Fugu дешевле самодельного маршрутизатора или прямых вызовов к двум-трём провайдерам.

Что проверить перед внедрением

Terms of Service Sakana называют Fugu API-based AI orchestration service и прямо описывают маршрутизацию ввода к внешним machine learning models, включая OpenAI, Anthropic и Google. Это ключевой пункт для компаний с чувствительными данными: запрос может попасть не только в Sakana, но и во внешние модели, выбранные оркестратором.

В ToS также сказано, что сервис и output не гарантируются по точности, полноте, своевременности или соответствию требованиям. Отдельный блок касается данных: Sakana может использовать content для обучения и улучшения моделей, а пользователь может запросить opt-out для моделей, которые разрабатывает и эксплуатирует сама компания. При этом уже совершённое training use может быть необратимым по техническим или операционным причинам.

Для Fugu есть настройка исключения отдельных моделей из пула. Это полезно для приватности и compliance. Но у Fugu Ultra, по FAQ Sakana, пул фиксированный, потому что именно полный набор агентов нужен для максимального качества. Если у вас жёсткие ограничения по провайдерам, это может стать стоп-фактором.

Отдельно стоит сравнить Fugu с альтернативами из соседнего класса: собственный маршрутизатор, AI gateway, LiteLLM, прямые API нескольких вендоров, локальные open-weight модели. Для общей рамки полезен материал про выбор между открытыми моделями и закрытыми API: Fugu не отменяет этот выбор, а добавляет ещё один вариант между ними.

Кому стоит следить за Sakana AI Fugu

В первую очередь Fugu интересен командам, которые уже используют несколько LLM и устали поддерживать маршрутизацию вручную. Если у вас один чат-бот на одном провайдере, выгода пока неочевидна. Если есть код-ревью, исследовательские агенты, внутренний анализ документов и требования по отказоустойчивости, продукт стоит добавить в список для теста.

Самый честный тест для Fugu — не один красивый промпт, а рабочая трасса. Возьмите 20–30 задач из реального контура, сравните качество, задержку, стоимость, повторяемость результата и объяснимость маршрута. Отдельно проверьте сценарий, где один провайдер исключён из пула. Если качество падает резко, защита от vendor lock-in окажется слабее маркетингового обещания.

Sakana сделала удачный ход: компания продаёт не ещё одну модель, а модель, которая управляет другими моделями. Это может стать важным форматом для AI-инфраструктуры. Но для бизнеса Fugu пока нужно воспринимать как новый слой управления, а не как универсальную страховку от всех рисков поставщиков.

Источники и проверка фактов

Sakana AI: Fugu release, опубликовано 22 июня 2026 года, проверено 22 июня 2026 года.
Sakana Fugu product page, цены, FAQ и описание моделей, проверено 22 июня 2026 года.
Sakana Fugu Terms of Service, effective 12 июня 2026 года, проверено 22 июня 2026 года.
Anthropic: statement on Fable 5 and Mythos 5 access, опубликовано 12 июня 2026 года, проверено 22 июня 2026 года.
The Decoder: Sakana AI Fugu, опубликовано 22 июня 2026 года, проверено 22 июня 2026 года.

Sakana AI Fugu: один API для нескольких LLM

Что именно запустила Sakana

Почему это связано с vendor lock-in

Бенчмарки выглядят сильно, но это данные Sakana

Сколько стоит Fugu

Что проверить перед внедрением

Кому стоит следить за Sakana AI Fugu

Источники и проверка фактов

Похожие статьи

CUGA Apps от IBM: новый стек agentic apps

Codex и SSD-износ: что баг с логами говорит о рисках AI-агентов

Кто теперь контролирует frontier AI: государство, платформы и разработчики

AWS Context и Continuum: зачем AI agents слой контроля