Sakana AI Fugu: один API для нескольких LLM
Sakana AI Fugu — новый OpenAI-совместимый API, за которым работает модель-оркестратор нескольких LLM. Разбираем, что запустила Sakana, сколько это стоит и где заканчивается защита от vendor lock-in.
По состоянию на 22 июня 2026 года Sakana AI Fugu — это OpenAI-совместимый API, за которым работает модель-оркестратор нескольких LLM. Пользователь видит один endpoint, а Fugu внутри решает, когда ответить самой, когда собрать команду моделей и как свести их ответы в один результат.
Sakana подаёт Fugu как способ снизить зависимость от одного поставщика ИИ. Это сильный тезис, особенно после истории с Fable 5 и Mythos 5 у Anthropic. Но здесь важно не перепродать идею: Fugu уменьшает зависимость от одного провайдера моделей, зато добавляет новый слой зависимости от самой Sakana.

Что именно запустила Sakana
22 июня 2026 года Sakana AI объявила общедоступный запуск Fugu и Fugu Ultra. В официальном релизе компания описывает продукт как multi-agent orchestration system, упакованную в один foundation model и доступную через единый API.
На практике это похоже на слой маршрутизации и координации поверх нескольких моделей. Fugu выбирает модель под задачу, делегирует части работы, проверяет промежуточные ответы и собирает итог. Важная деталь: Sakana утверждает, что сам Fugu тоже языковая модель, обученная вызывать другие LLM из пула, включая рекурсивные вызовы собственных экземпляров.
В линейке два варианта. Fugu рассчитан на баланс качества и задержки: кодинг, ревью, чат-боты, интерактивные сервисы. Fugu Ultra нацелен на сложные многошаговые задачи: исследование, воспроизведение статей, анализ безопасности, патентный поиск. Оба варианта доступны через OpenAI-совместимый API, то есть существующий клиент или coding harness можно направить на endpoint Fugu без миграции SDK.
| Для кого | Что меняет Fugu | Где остаётся риск |
|---|---|---|
| Разработчики | Один API вместо ручной сборки пула моделей и маршрутизатора | Отладка становится сложнее: ошибка может быть в модели, маршруте или синтезе |
| Бизнес | Можно не завязывать весь контур на одного поставщика LLM | Появляется зависимость от коммерческого слоя Sakana |
| Команды с compliance | Для Fugu можно исключать отдельных провайдеров или модели из пула | Fugu Ultra использует фиксированный полный пул, а ввод всё равно может идти во внешние LLM |
Почему это связано с vendor lock-in
Sakana явно строит запуск вокруг темы зависимости от одного поставщика. Компания ссылается на директиву правительства США, после которой Anthropic 12 июня 2026 года сообщила о приостановке доступа к Fable 5 и Mythos 5 для иностранных граждан. В заявлении Anthropic отдельно сказано, что остальные модели компании не затронуты.
Для Toolarium это соседний, но не тот же кластер, что материал про зависимость от американских AI-платформ. Там главный вопрос был геополитическим и инфраструктурным. Fugu интересен как продуктовая реакция: спрятать несколько моделей за один API и дать пользователю управляемый пул.
В этом есть рациональное зерно. Если один провайдер исчезает из доступного набора, оркестратор может попытаться перейти на другие модели. Но устойчивость зависит от того, какие модели реально есть в пуле, какие из них доступны вашей организации и насколько Sakana прозрачно показывает маршрутизацию. Это ближе к управляемому AI-шлюзу, чем к полной независимости.
Поэтому Fugu стоит читать вместе с более широким вопросом про контроль AI-инфраструктуры. Один API удобен, но контроль смещается к тому, кто управляет пулом, политиками маршрутизации, логами и тарифами.
Бенчмарки выглядят сильно, но это данные Sakana
Sakana заявляет, что Fugu Ultra сопоставим с Anthropic Fable 5 и Mythos Preview на инженерных, научных и reasoning-бенчмарках. На продуктовой странице и в релизе есть важная оговорка: все оценки, кроме Fugu, взяты из публикаций самих поставщиков моделей; для Fable 5 и Mythos Preview Sakana берёт максимум двух значений, если оба доступны на одном тесте. Эти модели не входят в пул Fugu, потому что они не доступны публично.

| Бенчмарк | Fugu | Fugu Ultra | Что видно по таблице Sakana |
|---|---|---|---|
| SWE Bench Pro | 59,0 | 73,7 | Ultra выше Fugu и заявленных базовых моделей в этой строке |
| TerminalBench 2.1 | 80,2 | 82,1 | оба Fugu идут выше указанных Opus, Gemini и GPT |
| LiveCodeBench Pro | 87,8 | 90,8 | Ultra лидирует среди значений в таблице Sakana |
| Humanity’s Last Exam | 47,2 | 50,0 | Ultra чуть выше Fable 5 в опубликованном сравнении |
| MRCRv2 | 86,6 | 93,6 | здесь GPT 5.5 выше Fugu Ultra: 94,8 против 93,6 |
Эти числа годятся как сигнал, что Sakana научилась делать оркестрацию конкурентной. Они не доказывают, что Fugu всегда лучше одиночной frontier-модели в рабочем контуре. На результат будет влиять задача, задержка, стоимость, доступность нужных моделей и то, насколько хорошо оркестратор понимает, когда делегировать, а когда не усложнять.
Сколько стоит Fugu
Цены ниже актуальны на 22 июня 2026 года и взяты с официальной страницы Sakana Fugu. У сервиса есть подписка и pay-as-you-go.
| Тариф | Цена | Для чего |
|---|---|---|
| Standard | $20 в месяц | лёгкое ежедневное использование и небольшие эксперименты |
| Pro | $100 в месяц | регулярный кодинг, ревью, исследование и анализ; 10x Standard usage |
| Max | $200 в месяц | длинные тяжёлые задачи; 20x Standard usage |
| Fugu в pay-as-you-go | ставка базовой модели; при нескольких агентах берётся ставка верхнего tier, а не сумма всех моделей | эластичная нагрузка и enterprise-сценарии |
| Fugu Ultra pay-as-you-go | $5 input, $30 output, $0,50 cached input за 1 млн токенов | сложные многошаговые задачи с оплатой за токены |
| Fugu Ultra при контексте больше 272K | $10 input, $45 output, $1 cached input за 1 млн токенов | длинный контекст и тяжёлые сессии |
Главная экономическая идея Fugu в pay-as-you-go звучит разумно: если в пуле работает несколько агентов, Sakana не складывает цены всех моделей, а берёт одну ставку по самой дорогой модели в активном наборе. Для команды это проще, чем считать каждый маршрут вручную. Но без собственных логов использования всё равно трудно понять, будет ли Fugu дешевле самодельного маршрутизатора или прямых вызовов к двум-трём провайдерам.
Что проверить перед внедрением
Terms of Service Sakana называют Fugu API-based AI orchestration service и прямо описывают маршрутизацию ввода к внешним machine learning models, включая OpenAI, Anthropic и Google. Это ключевой пункт для компаний с чувствительными данными: запрос может попасть не только в Sakana, но и во внешние модели, выбранные оркестратором.
В ToS также сказано, что сервис и output не гарантируются по точности, полноте, своевременности или соответствию требованиям. Отдельный блок касается данных: Sakana может использовать content для обучения и улучшения моделей, а пользователь может запросить opt-out для моделей, которые разрабатывает и эксплуатирует сама компания. При этом уже совершённое training use может быть необратимым по техническим или операционным причинам.
Для Fugu есть настройка исключения отдельных моделей из пула. Это полезно для приватности и compliance. Но у Fugu Ultra, по FAQ Sakana, пул фиксированный, потому что именно полный набор агентов нужен для максимального качества. Если у вас жёсткие ограничения по провайдерам, это может стать стоп-фактором.
Отдельно стоит сравнить Fugu с альтернативами из соседнего класса: собственный маршрутизатор, AI gateway, LiteLLM, прямые API нескольких вендоров, локальные open-weight модели. Для общей рамки полезен материал про выбор между открытыми моделями и закрытыми API: Fugu не отменяет этот выбор, а добавляет ещё один вариант между ними.
Кому стоит следить за Sakana AI Fugu
В первую очередь Fugu интересен командам, которые уже используют несколько LLM и устали поддерживать маршрутизацию вручную. Если у вас один чат-бот на одном провайдере, выгода пока неочевидна. Если есть код-ревью, исследовательские агенты, внутренний анализ документов и требования по отказоустойчивости, продукт стоит добавить в список для теста.
Самый честный тест для Fugu — не один красивый промпт, а рабочая трасса. Возьмите 20–30 задач из реального контура, сравните качество, задержку, стоимость, повторяемость результата и объяснимость маршрута. Отдельно проверьте сценарий, где один провайдер исключён из пула. Если качество падает резко, защита от vendor lock-in окажется слабее маркетингового обещания.
Sakana сделала удачный ход: компания продаёт не ещё одну модель, а модель, которая управляет другими моделями. Это может стать важным форматом для AI-инфраструктуры. Но для бизнеса Fugu пока нужно воспринимать как новый слой управления, а не как универсальную страховку от всех рисков поставщиков.
Источники и проверка фактов
- Sakana AI: Fugu release, опубликовано 22 июня 2026 года, проверено 22 июня 2026 года.
- Sakana Fugu product page, цены, FAQ и описание моделей, проверено 22 июня 2026 года.
- Sakana Fugu Terms of Service, effective 12 июня 2026 года, проверено 22 июня 2026 года.
- Anthropic: statement on Fable 5 and Mythos 5 access, опубликовано 12 июня 2026 года, проверено 22 июня 2026 года.
- The Decoder: Sakana AI Fugu, опубликовано 22 июня 2026 года, проверено 22 июня 2026 года.