Gemini

Gemini 3.5 Flash: как Google I/O 2026 повернул Gemini к агентам

Google вывела Gemini 3.5 Flash из роли быстрой модели в центр агентной инфраструктуры: Antigravity, Managed Agents, Spark и научные сценарии.

По состоянию на 27 мая 2026 года Gemini 3.5 Flash — не просто новая быстрая модель Google. Компания выпустила её 19 мая на Google I/O 2026 и сразу поставила в центр агентной стратегии: Gemini app, AI Mode в Search, Antigravity, Gemini API, AI Studio, Android Studio и корпоративные продукты.

Суть анонса в том, что Google собирает вокруг Gemini не витрину для чата, а рабочий стек. Быстрая модель ведёт несколько подагентов, работает с инструментами, запускает код в изолированной среде, сохраняет состояние между вызовами и выходит в потребительские и научные сценарии.

Это важное продолжение линии, которую мы уже разбирали в материале про Gemini 3.1 Pro и стратегию Google. Тогда Google догоняла лидеров по reasoning и мультимодальности. Теперь акцент смещён: Flash-ветка стала двигателем для задач, где скорость, цена и параллельное выполнение важнее красивого ответа в чате.

Что именно объявили

В официальном анонсе Google называет Gemini 3.5 Flash первым релизом новой серии Gemini 3.5. Модель получила идентификатор gemini-3.5-flash, стабильный GA-статус и позиционирование для coding, agentic execution и long-horizon workflows.

Коротко по продуктовой связке:

Gemini 3.5 Flash стала доступна в Gemini app и AI Mode в Google Search.
Для разработчиков модель пришла в Google Antigravity, Gemini API, Google AI Studio и Android Studio.
Для компаний она появилась в Gemini Enterprise Agent Platform и Gemini Enterprise.
Antigravity 2.0 превратили в отдельное desktop-приложение для оркестрации агентов.
Managed Agents в Gemini API позволяют поднять агента с Linux-средой через один API-вызов.
Gemini Spark представлен как персональный агент, который работает поверх 3.5 Flash.

Количество анонсов здесь вторично. Сильнее выглядит связка: модель, среда разработки, API, изолированное исполнение и потребительский агент работают как одна техническая цепочка.

Почему именно Flash стала ключевой

Flash-модели обычно воспринимают как быстрый и сравнительно дешёвый слой. В Gemini 3.5 Google меняет смысл этой ветки: она должна быть достаточно сильной для агентных циклов, но достаточно быстрой, чтобы подагенты могли работать параллельно.

Google заявляет, что Gemini 3.5 Flash обходит Gemini 3.1 Pro в сложных coding и agentic-бенчмарках: Terminal-Bench 2.1 — 76,2%, GDPval-AA — 1656 Elo, MCP Atlas — 83,6%. Для мультимодального понимания компания приводит 84,2% на CharXiv Reasoning. Отдельно Google утверждает, что по скорости выдачи токенов модель в 4 раза быстрее других frontier-моделей. Эти цифры стоит читать как позиционирование Google, а не независимый вердикт рынка.

Официальный график Google по Artificial Analysis: Gemini 3.5 Flash вынесена в правую верхнюю часть диаграммы «intelligence vs speed». Источник: Google Keyword.

Техническая спецификация тоже показывает, что это не маленькая модель для коротких запросов. В документации Gemini API указаны окно входа 1 048 576 токенов и максимум 65 536 выходных токенов. Поддерживаются текст, изображения, видео, аудио и PDF на входе; на выходе — текст. Есть Batch API, caching, code execution, file search, function calling, search grounding, structured outputs, thinking и URL context. Computer Use для Gemini 3.5 Flash на момент проверки не поддерживается.

Параметр	Данные на 27 мая 2026 года	Почему это важно
Модель	`gemini-3.5-flash`, stable / GA	Её можно брать в production-сценарии, а не только в preview-тесты.
Контекст	1 048 576 input-токенов и 65 536 output-токенов	Агент может держать длинные сессии, документы и историю работы.
Standard API price	$1,50 за 1 млн input-токенов и $9,00 за 1 млн output-токенов	Flash уже не выглядит ультрадешёвым слоем, особенно при длинных reasoning-циклах.
Batch / Flex	$0,75 input и $4,50 output за 1 млн токенов	Асинхронные агентные задачи можно удешевлять, если не нужна мгновенная выдача.
Priority	$2,70 input и $16,20 output за 1 млн токенов	Низкая задержка в пиковых сценариях стоит заметно дороже.
Ограничение	Computer Use не поддерживается	Для управления компьютером напрямую придётся оставаться на других моделях или harness-слое.

Цены взяты с официальной страницы Gemini API pricing. В этой части нельзя ориентироваться на старые обзоры: Google изменила стоимость Flash-линейки, и агентные циклы быстро умножают output-токены.

Antigravity 2.0 превращает модель в рабочую среду

Antigravity 2.0 — центральная часть истории для разработчиков. Google описывает его как agent-first платформу: отдельное desktop-приложение, CLI, SDK и корпоративный путь через Gemini Enterprise Agent Platform. В отличие от классического «помощника в IDE», здесь разработчик управляет несколькими агентами, подагентами и фоновыми задачами.

Агентные задачи редко укладываются в один запрос. Надо прочитать кодовую базу, выбрать план, запустить тесты, исправить ошибки, повторить цикл и не потерять контекст. Если модель медленная, каждый цикл становится дорогим по времени. Если она слабая, параллельные подагенты расходятся в разные стороны. Gemini 3.5 Flash пытается закрыть оба риска: скорость для итераций и достаточное качество для coding-задач.

Отсюда связь с UX. В материале про AI-курсор Gemini мы уже писали, что Google уводит агентность из чатового окна в интерфейс компьютера. Antigravity делает то же самое для разработки: агент не ждёт в боковой панели, а становится отдельным рабочим слоем с расписанием, окружением и подзадачами.

Managed Agents: агент как API-объект

Managed Agents в Gemini API — самый интересный слой для разработчиков продуктов. По официальному описанию, один вызов Interactions API может поднять агента, который рассуждает, вызывает инструменты и выполняет код в изолированной Linux-среде. Состояние среды можно продолжить в следующих вызовах: файлы и контекст не исчезают после одного ответа.

Managed Agents в Gemini API строятся вокруг Antigravity agent harness и Gemini 3.5 Flash. Источник: Google Keyword.

Для команд это меняет точку интеграции. Раньше нужно было отдельно собирать оркестратор, песочницу, файловое состояние, tool-use и правила агента. Google предлагает вынести часть этой инфраструктуры в управляемый слой. Поведение агента можно описывать через markdown-файлы вроде AGENTS.md и SKILL.md, а затем версионировать как обычную часть проекта.

Главный риск тут продуктовый. Managed Agents упрощают запуск агента, но не отменяют контроль качества. Если агент работает с кодом, данными или внешними системами, команде всё равно нужны права доступа, audit trail, лимиты на действия, тесты и понятная ответственность за результат.

Spark и Science Skills показывают второй фронт

Gemini Spark показывает, куда Google хочет вынести агентность для обычных пользователей. Компания описывает Spark как персонального агента на базе 3.5 Flash, который может работать 24/7 и действовать под руководством пользователя. В анонсе Google пишет о запуске для trusted testers и планах дать beta-доступ подписчикам Google AI Ultra в США.

Параллельно Google развивает научные сценарии. В Gemini for Science компания представила Hypothesis Generation на базе Co-Scientist, Computational Discovery с AlphaEvolve и ERA, Literature Insights на базе NotebookLM, а также Science Skills для Antigravity. Эти skills интегрируют данные из более чем 30 крупных биологических баз и инструментов, включая UniProt, AlphaFold Database, AlphaGenome API и InterPro.

Этот блок лучше читать вместе с нашим разбором про AI-агентов Google Research для фигур и peer review. Google явно проверяет одну и ту же идею в разных вертикалях: агент должен не просто отвечать, а вести исследовательский процесс, спорить с гипотезами, работать с источниками и готовить артефакты.

Где пока границы

Gemini 3.5 Flash не стоит воспринимать как «автономного сотрудника». Даже в формулировках Google агент работает под надзором, а многие сценарии идут через preview, trusted testers или ограниченные подписки. Gemini 3.5 Pro ещё не выпущена публично: Google пишет, что модель используется внутри компании и должна выйти позже.

Ограничения, которые важны перед внедрением:

цена output-токенов высокая для бесконтрольных агентных циклов;
thought preservation улучшает многошаговые сессии, но может увеличивать входной токенаж;
Computer Use в самой Gemini 3.5 Flash не поддерживается;
Managed Agents пока требуют проектирования прав, логирования и тестов вокруг агента;
Spark и научные инструменты не следует считать массово доступными для всех пользователей.

Для разработчиков это означает, что агентный стек Google надо тестировать не только на «справилась ли модель», но и на стоимости полного цикла: сколько вызовов потребовалось, сколько output-токенов сгорело, какие инструменты были вызваны и где человек остановил неверное действие.

Что это меняет для рынка

Google делает ставку на агентную инфраструктуру, а не на один красивый чат-интерфейс. Gemini 3.5 Flash нужна как быстрый исполнитель, Antigravity — как рабочая среда, Managed Agents — как API-слой, Spark — как потребительская витрина, Science Skills — как пример применения в отдельной отрасли.

Если эта связка сработает, конкуренция между моделями сместится. Важными станут не только баллы в бенчмарках, но и то, как модель живёт в harness: умеет ли держать долгую задачу, не раздувает ли стоимость, сохраняет ли состояние, безопасно ли вызывает инструменты и насколько удобно команде проверять результат.

Для русскоязычных разработчиков и менеджеров вывод практичный: Gemini 3.5 Flash стоит оценивать как модель для агентных рабочих процессов, а не как замену чатбота. Начинать разумнее с ограниченных задач: анализ репозитория, генерация прототипа, обработка документов, внутренний исследовательский агент. Массовое подключение к продакшену без лимитов и наблюдаемости будет преждевременным.

Gemini 3.5 Flash: как Google I/O 2026 повернул Gemini к агентам

Что именно объявили

Почему именно Flash стала ключевой

Antigravity 2.0 превращает модель в рабочую среду

Managed Agents: агент как API-объект

Spark и Science Skills показывают второй фронт

Где пока границы

Что это меняет для рынка

Источники

Читайте также

Похожие статьи

Gemini API Managed Agents получили background execution и MCP

Gemini 3.5 Flash получил computer use: зачем Google учит агентов действовать в браузере

Gemini 3.5 Live Translate: голосовой перевод Google

Gemini проверили на scheming: что это значит для безопасности AI-агентов