Google Genie Street View: AI-миры на базе реальных улиц
Genie теперь опирается на Street View: Google превращает реальные места в короткие интерактивные симуляции. Это не новый Google Maps, а шаг к world models для агентов и роботов.
По состоянию на 27 мая 2026 года Google DeepMind добавила в Project Genie новую функцию: модель теперь может начинать интерактивный мир с точки в Google Street View, а не только с текстового описания. Пользователь выбирает место в США, задаёт стиль вроде Ocean World, Desert Sands или Stone Age, описывает персонажа, а Genie строит короткую среду, по которой можно перемещаться.
Развлекательная часть заметна первой: затопить мост, пустить персонажа по знакомой улице, сменить эпоху или погоду. Но ценность запуска глубже. Google подводит к модели мира свой самый сильный актив: многолетний архив уличных снимков, связанный с картами, координатами и реальными объектами. Для рынка world models это важнее, чем очередной скачок качества картинки.

Что именно запустила Google
В официальном анонсе от 19 мая 2026 года Google пишет, что Street View grounding появился внутри Project Genie, экспериментального прототипа в Google Labs. Новый сценарий выглядит так: нажать на значок карты, выбрать место в США, добавить стиль и персонажа, после чего Genie создаёт воображаемый мир, стартовая точка которого привязана к реальным изображениям Street View.
Google подчёркивает: Street View в Genie доступен для локаций в США, а географию обещают расширять. Сам Project Genie вместе с новой функцией постепенно разворачивается для подписчиков Google AI Ultra за 200 долларов в месяц, которым исполнилось 18 лет. Про бесплатный режим в Google Maps речи нет: это платный исследовательский прототип.
Техническая связка опирается на Maps Imagery Grounding. На странице Google Maps Platform компания описывает этот слой как способ создавать визуальные AI-сценарии, заземлённые в геоданных и Street View. В Genie та же логика переносится из статичных визуалов в управляемую среду.
Чем модель мира отличается от видеогенератора
Genie 3 относится к мировым моделям Genie. В отличие от обычной text-to-video модели, она должна не только нарисовать ролик, но и предсказывать, что будет происходить после действий пользователя. На странице Google DeepMind указано, что Genie 3 создаёт 720p-среды, работает примерно на 20-24 кадрах в секунду и поддерживает взаимодействие в реальном времени.
Это принципиальное отличие от нейросетей для генерации видео. Sora, Veo или Runway в основном дают клип. Genie пытается дать пространство, которое реагирует на ввод: повернуть камеру, пройти вперёд, изменить точку зрения, сохранить часть уже увиденной сцены.
До игрового движка здесь далеко. DeepMind прямо перечисляет ограничения: Genie 3 не может идеально воспроизводить реальные места, плохо справляется с текстом без явного указания в описании и поддерживает лишь несколько минут непрерывного взаимодействия. TechCrunch после демо добавил ещё более приземлённую деталь: в показанных примерах миры всё ещё выглядят скорее как качественная игровая сцена, чем как фотореалистичный цифровой двойник улицы.

Street View как преимущество Google
Сильная часть анонса не в кнопке выбора стиля. Она в данных. Street View собирается с 2007 года: автомобили, трекеры, панорамы, внутренние пространства, дороги, набережные, туристические маршруты. В материале TechCrunch со ссылкой на Google приводится оценка: более 280 млрд изображений в 110 странах и на семи континентах.
Для модели мира такой архив полезен по двум причинам. Во-первых, он привязан к реальным местам. Во-вторых, он содержит огромное разнообразие сцен: городские улицы, мосты, парковки, частные кварталы, погодные и сезонные варианты, странные углы обзора. У конкурентов могут быть сильные видеомодели, но у них нет сопоставимого частного слоя картографических данных.
Поэтому самый сильный сценарий Google Genie Street View не прогулка по Манхэттену ради картинки. Намного важнее, насколько быстро Google сможет превратить картографический архив в тренировочные среды для AI-агентов, роботов и автономного транспорта.
Зачем это агентам, роботам и Waymo
Google в анонсе прямо пишет, что Genie уже используется как инструмент для исследований агентного поведения и виртуальных сред. Street View добавляет к этому заземление в реальности: робот или агент может тренироваться не в абстрактной комнате, а в среде, похожей на конкретную улицу, перекрёсток, двор или вход в здание.
Для робототехники Google это близкая тема. Роботу мало понимать текстовую команду. Ему нужно ориентироваться в пространстве, видеть препятствия, учитывать освещение, перспективу, неожиданное поведение объектов. Настоящие испытания дороги и медленны, поэтому симуляции становятся способом заранее прогнать редкие сценарии.
Waymo уже показывает, зачем Alphabet такая технология. В феврале компания описала Waymo World Model, построенную на базе Genie 3 и адаптированную для автономного вождения. По словам Waymo, модель создаёт мультимодальные симуляции с камерными и лидарными данными и позволяет проверять редкие дорожные случаи, которые трудно безопасно собрать в реальности.
Street View здесь может расширить набор стартовых условий. Вместо дороги в абстрактном городе появляется место, похожее на реальный район. До обучения робота в любой точке мира ещё далеко. Но направление понятно: карты перестают быть только интерфейсом навигации и становятся сырьём для обучаемых симуляторов.
Что пока нельзя обещать
У Google есть соблазнительная история: выбрать точку на карте и зайти внутрь альтернативной версии реального места. Редакционно важно не перепродать её. Сейчас Genie Street View остаётся прототипом с ограниченным доступом, американскими локациями и заметными ошибками точности.
Пока нельзя говорить, что Google построила точный цифровой двойник улиц. Нельзя говорить, что Genie заменит 3D-движки или симуляторы для робототехники. Нельзя делать из этого историю только про игры: демо выглядят игровыми, но стратегическая ценность лежит в обучении систем, которым нужно действовать в мире.
Самый трезвый вывод такой: Google проверяет, можно ли соединить генеративную модель, карты и интерактивность в один слой. Если получится, у компании появится преимущество не только в поиске и навигации, но и в следующем поколении моделей для агентов. Google Genie Street View показывает, почему данные о физическом мире становятся таким же важным активом, как вычисления и сами модели.