Sakana AI Fugu: один API для нескольких LLM

Sakana AI Fugu — новый OpenAI-совместимый API, за которым работает модель-оркестратор нескольких LLM. Разбираем, что запустила Sakana, сколько это стоит и где заканчивается защита от vendor lock-in.

Логотип Sakana Fugu на белом фоне

По состоянию на 22 июня 2026 года Sakana AI Fugu — это OpenAI-совместимый API, за которым работает модель-оркестратор нескольких LLM. Пользователь видит один endpoint, а Fugu внутри решает, когда ответить самой, когда собрать команду моделей и как свести их ответы в один результат.

Sakana подаёт Fugu как способ снизить зависимость от одного поставщика ИИ. Это сильный тезис, особенно после истории с Fable 5 и Mythos 5 у Anthropic. Но здесь важно не перепродать идею: Fugu уменьшает зависимость от одного провайдера моделей, зато добавляет новый слой зависимости от самой Sakana.

Схема Sakana Fugu над пулом закрытых и открытых LLM
Sakana показывает Fugu как модель-оркестратор над пулом закрытых и открытых LLM. Источник: Sakana AI.

Что именно запустила Sakana

22 июня 2026 года Sakana AI объявила общедоступный запуск Fugu и Fugu Ultra. В официальном релизе компания описывает продукт как multi-agent orchestration system, упакованную в один foundation model и доступную через единый API.

На практике это похоже на слой маршрутизации и координации поверх нескольких моделей. Fugu выбирает модель под задачу, делегирует части работы, проверяет промежуточные ответы и собирает итог. Важная деталь: Sakana утверждает, что сам Fugu тоже языковая модель, обученная вызывать другие LLM из пула, включая рекурсивные вызовы собственных экземпляров.

В линейке два варианта. Fugu рассчитан на баланс качества и задержки: кодинг, ревью, чат-боты, интерактивные сервисы. Fugu Ultra нацелен на сложные многошаговые задачи: исследование, воспроизведение статей, анализ безопасности, патентный поиск. Оба варианта доступны через OpenAI-совместимый API, то есть существующий клиент или coding harness можно направить на endpoint Fugu без миграции SDK.

Для когоЧто меняет FuguГде остаётся риск
РазработчикиОдин API вместо ручной сборки пула моделей и маршрутизатораОтладка становится сложнее: ошибка может быть в модели, маршруте или синтезе
БизнесМожно не завязывать весь контур на одного поставщика LLMПоявляется зависимость от коммерческого слоя Sakana
Команды с complianceДля Fugu можно исключать отдельных провайдеров или модели из пулаFugu Ultra использует фиксированный полный пул, а ввод всё равно может идти во внешние LLM

Почему это связано с vendor lock-in

Sakana явно строит запуск вокруг темы зависимости от одного поставщика. Компания ссылается на директиву правительства США, после которой Anthropic 12 июня 2026 года сообщила о приостановке доступа к Fable 5 и Mythos 5 для иностранных граждан. В заявлении Anthropic отдельно сказано, что остальные модели компании не затронуты.

Для Toolarium это соседний, но не тот же кластер, что материал про зависимость от американских AI-платформ. Там главный вопрос был геополитическим и инфраструктурным. Fugu интересен как продуктовая реакция: спрятать несколько моделей за один API и дать пользователю управляемый пул.

В этом есть рациональное зерно. Если один провайдер исчезает из доступного набора, оркестратор может попытаться перейти на другие модели. Но устойчивость зависит от того, какие модели реально есть в пуле, какие из них доступны вашей организации и насколько Sakana прозрачно показывает маршрутизацию. Это ближе к управляемому AI-шлюзу, чем к полной независимости.

Поэтому Fugu стоит читать вместе с более широким вопросом про контроль AI-инфраструктуры. Один API удобен, но контроль смещается к тому, кто управляет пулом, политиками маршрутизации, логами и тарифами.

Бенчмарки выглядят сильно, но это данные Sakana

Sakana заявляет, что Fugu Ultra сопоставим с Anthropic Fable 5 и Mythos Preview на инженерных, научных и reasoning-бенчмарках. На продуктовой странице и в релизе есть важная оговорка: все оценки, кроме Fugu, взяты из публикаций самих поставщиков моделей; для Fable 5 и Mythos Preview Sakana берёт максимум двух значений, если оба доступны на одном тесте. Эти модели не входят в пул Fugu, потому что они не доступны публично.

Бенчмарк-графики Sakana Fugu Ultra и Fugu на Terminal Bench, GPQA-D, LiveCodeBench и других тестах
Сравнение Fugu и Fugu Ultra с базовыми frontier-моделями по данным Sakana. Это не независимый тест. Источник: Sakana AI.
БенчмаркFuguFugu UltraЧто видно по таблице Sakana
SWE Bench Pro59,073,7Ultra выше Fugu и заявленных базовых моделей в этой строке
TerminalBench 2.180,282,1оба Fugu идут выше указанных Opus, Gemini и GPT
LiveCodeBench Pro87,890,8Ultra лидирует среди значений в таблице Sakana
Humanity’s Last Exam47,250,0Ultra чуть выше Fable 5 в опубликованном сравнении
MRCRv286,693,6здесь GPT 5.5 выше Fugu Ultra: 94,8 против 93,6

Эти числа годятся как сигнал, что Sakana научилась делать оркестрацию конкурентной. Они не доказывают, что Fugu всегда лучше одиночной frontier-модели в рабочем контуре. На результат будет влиять задача, задержка, стоимость, доступность нужных моделей и то, насколько хорошо оркестратор понимает, когда делегировать, а когда не усложнять.

Сколько стоит Fugu

Цены ниже актуальны на 22 июня 2026 года и взяты с официальной страницы Sakana Fugu. У сервиса есть подписка и pay-as-you-go.

ТарифЦенаДля чего
Standard$20 в месяцлёгкое ежедневное использование и небольшие эксперименты
Pro$100 в месяцрегулярный кодинг, ревью, исследование и анализ; 10x Standard usage
Max$200 в месяцдлинные тяжёлые задачи; 20x Standard usage
Fugu в pay-as-you-goставка базовой модели; при нескольких агентах берётся ставка верхнего tier, а не сумма всех моделейэластичная нагрузка и enterprise-сценарии
Fugu Ultra pay-as-you-go$5 input, $30 output, $0,50 cached input за 1 млн токеновсложные многошаговые задачи с оплатой за токены
Fugu Ultra при контексте больше 272K$10 input, $45 output, $1 cached input за 1 млн токеновдлинный контекст и тяжёлые сессии

Главная экономическая идея Fugu в pay-as-you-go звучит разумно: если в пуле работает несколько агентов, Sakana не складывает цены всех моделей, а берёт одну ставку по самой дорогой модели в активном наборе. Для команды это проще, чем считать каждый маршрут вручную. Но без собственных логов использования всё равно трудно понять, будет ли Fugu дешевле самодельного маршрутизатора или прямых вызовов к двум-трём провайдерам.

Что проверить перед внедрением

Terms of Service Sakana называют Fugu API-based AI orchestration service и прямо описывают маршрутизацию ввода к внешним machine learning models, включая OpenAI, Anthropic и Google. Это ключевой пункт для компаний с чувствительными данными: запрос может попасть не только в Sakana, но и во внешние модели, выбранные оркестратором.

В ToS также сказано, что сервис и output не гарантируются по точности, полноте, своевременности или соответствию требованиям. Отдельный блок касается данных: Sakana может использовать content для обучения и улучшения моделей, а пользователь может запросить opt-out для моделей, которые разрабатывает и эксплуатирует сама компания. При этом уже совершённое training use может быть необратимым по техническим или операционным причинам.

Для Fugu есть настройка исключения отдельных моделей из пула. Это полезно для приватности и compliance. Но у Fugu Ultra, по FAQ Sakana, пул фиксированный, потому что именно полный набор агентов нужен для максимального качества. Если у вас жёсткие ограничения по провайдерам, это может стать стоп-фактором.

Отдельно стоит сравнить Fugu с альтернативами из соседнего класса: собственный маршрутизатор, AI gateway, LiteLLM, прямые API нескольких вендоров, локальные open-weight модели. Для общей рамки полезен материал про выбор между открытыми моделями и закрытыми API: Fugu не отменяет этот выбор, а добавляет ещё один вариант между ними.

Кому стоит следить за Sakana AI Fugu

В первую очередь Fugu интересен командам, которые уже используют несколько LLM и устали поддерживать маршрутизацию вручную. Если у вас один чат-бот на одном провайдере, выгода пока неочевидна. Если есть код-ревью, исследовательские агенты, внутренний анализ документов и требования по отказоустойчивости, продукт стоит добавить в список для теста.

Самый честный тест для Fugu — не один красивый промпт, а рабочая трасса. Возьмите 20–30 задач из реального контура, сравните качество, задержку, стоимость, повторяемость результата и объяснимость маршрута. Отдельно проверьте сценарий, где один провайдер исключён из пула. Если качество падает резко, защита от vendor lock-in окажется слабее маркетингового обещания.

Sakana сделала удачный ход: компания продаёт не ещё одну модель, а модель, которая управляет другими моделями. Это может стать важным форматом для AI-инфраструктуры. Но для бизнеса Fugu пока нужно воспринимать как новый слой управления, а не как универсальную страховку от всех рисков поставщиков.

Источники и проверка фактов

Telegram-канал @toolarium