Gemini 3.5 Flash: как Google I/O 2026 повернул Gemini к агентам
Google вывела Gemini 3.5 Flash из роли быстрой модели в центр агентной инфраструктуры: Antigravity, Managed Agents, Spark и научные сценарии.
По состоянию на 27 мая 2026 года Gemini 3.5 Flash — не просто новая быстрая модель Google. Компания выпустила её 19 мая на Google I/O 2026 и сразу поставила в центр агентной стратегии: Gemini app, AI Mode в Search, Antigravity, Gemini API, AI Studio, Android Studio и корпоративные продукты.
Суть анонса в том, что Google собирает вокруг Gemini не витрину для чата, а рабочий стек. Быстрая модель ведёт несколько подагентов, работает с инструментами, запускает код в изолированной среде, сохраняет состояние между вызовами и выходит в потребительские и научные сценарии.
Это важное продолжение линии, которую мы уже разбирали в материале про Gemini 3.1 Pro и стратегию Google. Тогда Google догоняла лидеров по reasoning и мультимодальности. Теперь акцент смещён: Flash-ветка стала двигателем для задач, где скорость, цена и параллельное выполнение важнее красивого ответа в чате.
Что именно объявили
В официальном анонсе Google называет Gemini 3.5 Flash первым релизом новой серии Gemini 3.5. Модель получила идентификатор gemini-3.5-flash, стабильный GA-статус и позиционирование для coding, agentic execution и long-horizon workflows.
Коротко по продуктовой связке:
- Gemini 3.5 Flash стала доступна в Gemini app и AI Mode в Google Search.
- Для разработчиков модель пришла в Google Antigravity, Gemini API, Google AI Studio и Android Studio.
- Для компаний она появилась в Gemini Enterprise Agent Platform и Gemini Enterprise.
- Antigravity 2.0 превратили в отдельное desktop-приложение для оркестрации агентов.
- Managed Agents в Gemini API позволяют поднять агента с Linux-средой через один API-вызов.
- Gemini Spark представлен как персональный агент, который работает поверх 3.5 Flash.
Количество анонсов здесь вторично. Сильнее выглядит связка: модель, среда разработки, API, изолированное исполнение и потребительский агент работают как одна техническая цепочка.
Почему именно Flash стала ключевой
Flash-модели обычно воспринимают как быстрый и сравнительно дешёвый слой. В Gemini 3.5 Google меняет смысл этой ветки: она должна быть достаточно сильной для агентных циклов, но достаточно быстрой, чтобы подагенты могли работать параллельно.
Google заявляет, что Gemini 3.5 Flash обходит Gemini 3.1 Pro в сложных coding и agentic-бенчмарках: Terminal-Bench 2.1 — 76,2%, GDPval-AA — 1656 Elo, MCP Atlas — 83,6%. Для мультимодального понимания компания приводит 84,2% на CharXiv Reasoning. Отдельно Google утверждает, что по скорости выдачи токенов модель в 4 раза быстрее других frontier-моделей. Эти цифры стоит читать как позиционирование Google, а не независимый вердикт рынка.

Техническая спецификация тоже показывает, что это не маленькая модель для коротких запросов. В документации Gemini API указаны окно входа 1 048 576 токенов и максимум 65 536 выходных токенов. Поддерживаются текст, изображения, видео, аудио и PDF на входе; на выходе — текст. Есть Batch API, caching, code execution, file search, function calling, search grounding, structured outputs, thinking и URL context. Computer Use для Gemini 3.5 Flash на момент проверки не поддерживается.
| Параметр | Данные на 27 мая 2026 года | Почему это важно |
|---|---|---|
| Модель | gemini-3.5-flash, stable / GA | Её можно брать в production-сценарии, а не только в preview-тесты. |
| Контекст | 1 048 576 input-токенов и 65 536 output-токенов | Агент может держать длинные сессии, документы и историю работы. |
| Standard API price | $1,50 за 1 млн input-токенов и $9,00 за 1 млн output-токенов | Flash уже не выглядит ультрадешёвым слоем, особенно при длинных reasoning-циклах. |
| Batch / Flex | $0,75 input и $4,50 output за 1 млн токенов | Асинхронные агентные задачи можно удешевлять, если не нужна мгновенная выдача. |
| Priority | $2,70 input и $16,20 output за 1 млн токенов | Низкая задержка в пиковых сценариях стоит заметно дороже. |
| Ограничение | Computer Use не поддерживается | Для управления компьютером напрямую придётся оставаться на других моделях или harness-слое. |
Цены взяты с официальной страницы Gemini API pricing. В этой части нельзя ориентироваться на старые обзоры: Google изменила стоимость Flash-линейки, и агентные циклы быстро умножают output-токены.
Antigravity 2.0 превращает модель в рабочую среду
Antigravity 2.0 — центральная часть истории для разработчиков. Google описывает его как agent-first платформу: отдельное desktop-приложение, CLI, SDK и корпоративный путь через Gemini Enterprise Agent Platform. В отличие от классического «помощника в IDE», здесь разработчик управляет несколькими агентами, подагентами и фоновыми задачами.
Агентные задачи редко укладываются в один запрос. Надо прочитать кодовую базу, выбрать план, запустить тесты, исправить ошибки, повторить цикл и не потерять контекст. Если модель медленная, каждый цикл становится дорогим по времени. Если она слабая, параллельные подагенты расходятся в разные стороны. Gemini 3.5 Flash пытается закрыть оба риска: скорость для итераций и достаточное качество для coding-задач.
Отсюда связь с UX. В материале про AI-курсор Gemini мы уже писали, что Google уводит агентность из чатового окна в интерфейс компьютера. Antigravity делает то же самое для разработки: агент не ждёт в боковой панели, а становится отдельным рабочим слоем с расписанием, окружением и подзадачами.
Managed Agents: агент как API-объект
Managed Agents в Gemini API — самый интересный слой для разработчиков продуктов. По официальному описанию, один вызов Interactions API может поднять агента, который рассуждает, вызывает инструменты и выполняет код в изолированной Linux-среде. Состояние среды можно продолжить в следующих вызовах: файлы и контекст не исчезают после одного ответа.

Для команд это меняет точку интеграции. Раньше нужно было отдельно собирать оркестратор, песочницу, файловое состояние, tool-use и правила агента. Google предлагает вынести часть этой инфраструктуры в управляемый слой. Поведение агента можно описывать через markdown-файлы вроде AGENTS.md и SKILL.md, а затем версионировать как обычную часть проекта.
Главный риск тут продуктовый. Managed Agents упрощают запуск агента, но не отменяют контроль качества. Если агент работает с кодом, данными или внешними системами, команде всё равно нужны права доступа, audit trail, лимиты на действия, тесты и понятная ответственность за результат.
Spark и Science Skills показывают второй фронт
Gemini Spark показывает, куда Google хочет вынести агентность для обычных пользователей. Компания описывает Spark как персонального агента на базе 3.5 Flash, который может работать 24/7 и действовать под руководством пользователя. В анонсе Google пишет о запуске для trusted testers и планах дать beta-доступ подписчикам Google AI Ultra в США.
Параллельно Google развивает научные сценарии. В Gemini for Science компания представила Hypothesis Generation на базе Co-Scientist, Computational Discovery с AlphaEvolve и ERA, Literature Insights на базе NotebookLM, а также Science Skills для Antigravity. Эти skills интегрируют данные из более чем 30 крупных биологических баз и инструментов, включая UniProt, AlphaFold Database, AlphaGenome API и InterPro.
Этот блок лучше читать вместе с нашим разбором про AI-агентов Google Research для фигур и peer review. Google явно проверяет одну и ту же идею в разных вертикалях: агент должен не просто отвечать, а вести исследовательский процесс, спорить с гипотезами, работать с источниками и готовить артефакты.
Где пока границы
Gemini 3.5 Flash не стоит воспринимать как «автономного сотрудника». Даже в формулировках Google агент работает под надзором, а многие сценарии идут через preview, trusted testers или ограниченные подписки. Gemini 3.5 Pro ещё не выпущена публично: Google пишет, что модель используется внутри компании и должна выйти позже.
Ограничения, которые важны перед внедрением:
- цена output-токенов высокая для бесконтрольных агентных циклов;
- thought preservation улучшает многошаговые сессии, но может увеличивать входной токенаж;
- Computer Use в самой Gemini 3.5 Flash не поддерживается;
- Managed Agents пока требуют проектирования прав, логирования и тестов вокруг агента;
- Spark и научные инструменты не следует считать массово доступными для всех пользователей.
Для разработчиков это означает, что агентный стек Google надо тестировать не только на «справилась ли модель», но и на стоимости полного цикла: сколько вызовов потребовалось, сколько output-токенов сгорело, какие инструменты были вызваны и где человек остановил неверное действие.
Что это меняет для рынка
Google делает ставку на агентную инфраструктуру, а не на один красивый чат-интерфейс. Gemini 3.5 Flash нужна как быстрый исполнитель, Antigravity — как рабочая среда, Managed Agents — как API-слой, Spark — как потребительская витрина, Science Skills — как пример применения в отдельной отрасли.
Если эта связка сработает, конкуренция между моделями сместится. Важными станут не только баллы в бенчмарках, но и то, как модель живёт в harness: умеет ли держать долгую задачу, не раздувает ли стоимость, сохраняет ли состояние, безопасно ли вызывает инструменты и насколько удобно команде проверять результат.
Для русскоязычных разработчиков и менеджеров вывод практичный: Gemini 3.5 Flash стоит оценивать как модель для агентных рабочих процессов, а не как замену чатбота. Начинать разумнее с ограниченных задач: анализ репозитория, генерация прототипа, обработка документов, внутренний исследовательский агент. Массовое подключение к продакшену без лимитов и наблюдаемости будет преждевременным.
Источники
- Google Keyword: Gemini 3.5
- Gemini API docs: Gemini 3.5 Flash
- Gemini API pricing
- Google I/O 2026 developer highlights
- Managed Agents in the Gemini API
- Gemini for Science