AI-агенты

Microsoft Fara1.5: зачем малые AI-агенты учатся действовать в браузере

Microsoft Research представила Fara1.5 — семейство browser-agent моделей 4B/9B/27B. Разбираем, почему здесь важны не только бенчмарки, но и синтетическое обучение, цена развёртывания и safety-паузы.

По состоянию на 27 мая 2026 года Microsoft Research представила Fara1.5, семейство моделей для браузерных computer-use agents. Такие агенты отвечают не только текстом: они смотрят на страницу, нажимают кнопки, заполняют формы и двигаются по сайтам как пользователь.

Сам релиз легко свести к одной цифре: Fara1.5-27B набрала 72,0% success rate на Online-Mind2Web, а в таблице Microsoft это выше результатов OpenAI Operator, Gemini 2.5 Computer Use и Yutori Navigator n1. Для рынка интереснее другой сюжет: браузерные AI-агенты переходят от витринных демо к компактным специализированным моделям, синтетическим средам обучения и обязательным паузам на подтверждение действий.

Мы уже разбирали, как устроены ИИ-агенты в браузере: Computer Use и Operator. Новый релиз Microsoft продолжает эту историю: команда пытается сделать browser-agent стек дешевле, локальнее и управляемее.

Что выпустила Microsoft

Microsoft Research опубликовала Fara1.5 21 мая 2026 года. В семейство входят три модели: Fara1.5-4B, Fara1.5-9B и Fara1.5-27B. Все они предназначены для browser computer-use задач: агент получает историю диалога и последние скриншоты браузера, рассуждает о следующем шаге и выдаёт одно атомарное действие.

Параллельно Microsoft представила MagenticLite и MagenticBrain. MagenticLite — экспериментальное приложение, которое объединяет работу в браузере и локальной файловой системе. MagenticBrain отвечает за планирование, делегирование и терминал, а Fara1.5 закрывает браузерные действия. В блоге Microsoft это подано как единый стек, оптимизированный под малые модели; Fara1.5 в нём часть окружения, а не одинокая модель без интерфейса.

Это важная деталь. Большие закрытые системы вроде Operator делают ставку на качество продукта целиком. Microsoft в этом релизе показывает исследовательскую альтернативу: подобрать модель нужного размера, обучить её на проверенных траекториях и встроить в агентный интерфейс с журналом действий, песочницей и точками подтверждения.

Почему размеры 4B, 9B и 27B важны

В Fara1.5 Microsoft явно разводит качество и стоимость развёртывания. Модель на 27B параметров показывает лучший результат в семействе, но 9B позиционируется как основной вариант для большинства сценариев. По данным Microsoft Research, Fara1.5-9B уже даёт 86,6% на WebVoyager и 63,4% на Online-Mind2Web.

Результаты Fara1.5 растут от 4B к 27B; справа — сравнение Fara1.5-27B с другими browser agents на Online-Mind2Web. Источник: Microsoft Research.

Модель	Размер	WebVoyager	Online-Mind2Web
Fara1.5-4B	4B	80,8%	57,3%
Fara1.5-9B	9B	86,6%	63,4%
Fara1.5-27B	27B	88,6%	72,0%

Task success rate в автоматических оценках Microsoft Research; числа Fara1.5 усреднены по трём независимым запускам.

В практическом смысле здесь важнее цена ошибки, чем сам рекорд. Если агент должен раз в день собрать информацию с пары сайтов, 27B может быть избыточной. Если он работает с формами, несколькими вкладками и длинной цепочкой действий, выигрыш старшей модели начинает окупаться. Microsoft отдельно пишет, что переход от 4B к 27B даёт +14,7 пункта на Online-Mind2Web и +7,8 пункта на WebVoyager.

Бенчмарк сильный, но читать его нужно осторожно

Online-Mind2Web состоит из 300 задач на 136 популярных сайтах. По таблице Microsoft, Fara1.5-27B набрала там 72,0%, Operator — 58,3%, Gemini 2.5 Computer Use — 57,3%, Yutori Navigator n1 — 64,7%. Для Fara1.5 это сильный результат: маленькая по меркам frontier-систем модель попадает в одну сравнительную таблицу с закрытыми продуктами.

Здесь важна оговорка из самого источника. Microsoft сравнивает автоматические оценки из официального leaderboard по состоянию на май 2026 года, а результаты Fara1.5 и Fara-7B усредняет по трём запускам. Такой результат нельзя переносить на любой реальный продукт без проверки. Браузерные агенты слишком чувствительны к блокировкам сайтов, капчам, состоянию сессии, логинам и тому, как именно сформулирована задача.

Рабочий вывод получается спокойнее заголовков: Microsoft добилась сильного результата на живых веб-задачах для модели до 27B параметров. Формула «Microsoft победила всех browser agents» звучит эффектнее, но для инженерной команды почти ничего не решает.

Главная ставка — синтетические среды

Fara1.5 обучалась на траекториях из FaraGen1.5. Под траекторией Microsoft понимает последовательность сообщений пользователя, наблюдений, рассуждений и действий агента, которая действительно решает задачу. В набор входят живые веб-задачи, синтетические домены, форм-заполнение, пользовательские взаимодействия, grounding, VQA и небольшая доля safety-данных.

FaraGen1.5 генерирует проверенные траектории через среды, solver и три фильтра качества. Источник: Microsoft Research.

У синтетических сред практическая роль. На живом сайте нельзя безопасно учить агента отправлять письмо, подтверждать бронирование, оформлять заявку или работать с аккаунтом пользователя. Microsoft решает это через sandbox-клоны доменов: там можно имитировать почту, календарь, медиа-платформу, маркетплейс и другие сценарии без реальных побочных эффектов.

Это одна из самых содержательных частей релиза. Браузерный агент получает опыт на задачах, которые в обычном вебе нельзя массово проходить до конца. Отсюда и рост в закрытых или «gated» сценариях: Fara1.5-9B на шести FaraEnvs показывает средний результат 71,8%, тогда как Fara-7B без такого обучения — 18,8%.

Safety-паузы становятся частью UX

Microsoft подчёркивает, что Fara1.5 остаётся research preview. Формулировка здесь содержательная. Computer-use agent действует в интерфейсе от имени пользователя, и цена ошибки выше, чем у чат-бота: можно отправить форму, купить не тот товар, раскрыть данные или выполнить действие, которое трудно отменить.

В Fara1.5 такие точки вынесены в обучение. Агент должен остановиться и спросить пользователя, если не хватает персональной информации, задача сформулирована неоднозначно или следующий шаг необратим и ещё не был подтверждён. Это ровно та граница, о которой мы писали в материале про риски автономных AI-агентов: автономность без подтверждений быстро превращается в риск для паролей, денег и рабочих аккаунтов.

Для продукта это означает, что «спросить пользователя» уже нельзя считать провалом агента. В браузерных задачах это нормальный слой интерфейса. Хороший агент должен не только нажимать правильно, но и понимать, когда действие требует паузы.

Что это значит для разработчиков

Fara1.5 дополняет универсальные большие модели; заменить их во всех задачах она не пытается. Она показывает, где у специализированных моделей появляется право на отдельную архитектуру. Если агентная система делает браузерные действия, ей нужны знания, длинный контекст, точное восприятие интерфейса, устойчивый action loop, проверенные траектории, логирование и границы для опасных шагов.

Это касается не только Microsoft. Вокруг computer-use сценариев сейчас идут разные эксперименты: от браузерных агентов до инструментов, где модель управляет IDE, терминалом или рабочим столом. Похожий класс задач виден и в истории о том, как Claude Code и Cowork научились управлять компьютером. Разница в том, что Fara1.5 детальнее показывает тренировочный контур: какие данные нужны, как проверяются действия и почему синтетические домены становятся обязательными.

Если вы оцениваете browser-agent стек для продукта, итогового процента в leaderboard недостаточно. Проверьте, как агент получает скриншоты, какие действия может выполнять, умеет ли задавать уточняющие вопросы, где хранятся логи, можно ли остановить выполнение, что происходит с логинами и как тестируются необратимые шаги. Именно эти детали чаще ломают пилот, даже когда модель хорошо выглядит на бенчмарке.

Главное

Ценность Microsoft Fara1.5 шире заголовка про победу над Operator и Gemini. Релиз показывает более практичный путь для browser computer-use agents: семейство моделей разных размеров, обучение на синтетических и живых веб-траекториях, верификация действий и встроенные паузы перед рискованными шагами.

Для рынка это сигнал: следующий этап browser agents будет решаться не только мощностью модели. Выигрывать будут системы, где модель, среда исполнения, данные, проверки и пользовательский контроль спроектированы вместе.

Microsoft Fara1.5: зачем малые AI-агенты учатся действовать в браузере

Что выпустила Microsoft

Почему размеры 4B, 9B и 27B важны

Бенчмарк сильный, но читать его нужно осторожно

Главная ставка — синтетические среды

Safety-паузы становятся частью UX

Что это значит для разработчиков

Главное

Похожие статьи

AI-агенты атакуют AI-агентов: защитники используют prompt injection против hacking agents

Stack Overflow for Agents спустя месяц: зачем агентам свой Stack Overflow

Long-Horizon-Terminal-Bench: почему AI-агенты теряют нить в долгих terminal-задачах

Ghostcommit: prompt injection через PNG и AGENTS.md