Google DeepMind открыла доступ к Project Genie экспериментальному прототипу для создания и исследования интерактивных миров на базе модели Genie 3. Новый инструмент позволяет генерировать среды в реальном времени, реагирующие на действия пользователя, и уже доступен подписчикам Google AI Ultra в США.
Вступление
Google DeepMind открыла доступ к Project Genie экспериментальному прототипу для создания и исследования интерактивных миров на базе модели Genie 3.
Генерация изображений и видео давно перестала быть пределом возможностей ИИ. Следующий шаг — создание целых миров, которые не просто выглядят правдоподобно, а ведут себя как живые среды. Именно в эту сторону Google DeepMind двигает свои исследования, открывая доступ к Project Genie — интерактивному прототипу, основанному на модели Genie 3. В отличие от привычных статичных сцен или заранее срендеренных пространств, Project Genie предлагает миры, которые формируются на ходу и изменяются в ответ на действия пользователя.Подробности
Project Genie построен вокруг Genie 3 универсальной world model, способной симулировать динамику среды, физику и взаимодействия в реальном времени. Ключевая особенность модели в том, что она не просто отображает пространство, а постоянно генерирует «путь вперёд» по мере перемещения пользователя. Проект работает как веб-приложение и сочетает сразу несколько моделей: Genie 3, Nano Banana Pro и Gemini. Пользователь может создавать, исследовать и ремиксировать собственные интерактивные миры, управляя как самим окружением, так и способом взаимодействия с ним. В основе Project Genie лежат три ключевых механики: World sketching. Мир создаётся с помощью текстовых описаний и изображений — сгенерированных или загруженных. Пользователь задаёт персонажа, окружение и способ передвижения: пешком, на транспорте, в полёте или любым другим образом. Интеграция с Nano Banana Pro позволяет заранее визуально «набросать» мир и доработать детали до начала исследования. Также можно выбрать перспективу — от первого или третьего лица. World exploration. Созданный мир становится навигируемой средой. По мере движения Project Genie генерирует пространство в реальном времени, подстраиваясь под действия пользователя. Камеру можно свободно настраивать, исследуя ландшафт, архитектуру или сцены так, как в интерактивной симуляции. World remixing. Пользователи могут брать существующие миры и переосмысливать их, опираясь на исходные промпты. Для вдохновения доступны курируемые миры и случайный генератор. Результаты можно сохранить — Project Genie позволяет скачивать видео сгенерированных миров и путешествий по ним.Контекст
Для Google DeepMind world models — ключевой элемент движения к более общим ИИ-системам. Если ранее агенты обучались в строго ограниченных средах вроде шахмат или го, то путь к AGI требует навигации в разнообразных, непредсказуемых мирах, ближе к реальности. Genie 3 разрабатывался с участием доверенных тестеров из разных индустрий. Потенциальные сценарии применения выходят далеко за рамки развлечений: от робототехники и симуляций до анимации, художественных миров и реконструкции исторических локаций. Project Genie следующий шаг после закрытых тестов. Его запуск позволяет исследователям и разработчикам напрямую поработать с моделью и понять, как люди взаимодействуют с генеративными мирами на практике.Ограничения
Google подчёркивает, что Project Genie — ранний исследовательский прототип. Сгенерированные миры могут выглядеть не полностью реалистично, иногда неточно следовать промптам или законам физики. Управление персонажами может сопровождаться задержками, а продолжительность генераций ограничена 60 секундами. Часть возможностей Genie 3, анонсированных ранее — например, событий, меняющих мир по мере исследования, — пока не реализована в прототипе. Доступ к Project Genie начинается с пользователей Google AI Ultra в США (18+) и будет расширяться на другие регионы позднее.Подпишитесь на наш Telegram-канал
Будьте в курсе последних новостей и обновлений, подписавшись на наш Telegram!
Перейти в Telegram