Google DeepMind представила обновлённую версию своей ИИ-модели генерации трёхмерных миров — Genie 3.
Новинка создаёт интерактивные пространства, в которых пользователи могут свободно перемещаться в реальном времени.
По заявлению разработчиков, теперь возможно гораздо дольше находиться в виртуальной среде, а сама модель запоминает расположение объектов, даже если они не видны на экране. Это делает Genie 3 важным этапом на пути к созданию продвинутого искусственного интеллекта с возможностями обучения в условиях, приближенных к реальности.
Мировые модели — это тип ИИ-систем, предназначенных для воссоздания трёхмерных миров с целью обучения, развлечений и научных исследований, а также для подготовки ИИ-агентов и роботов. В таких пространствах, созданных по текстовой подсказке, можно перемещаться словно в компьютерной игре. Google активно инвестирует в это направление: в декабре была выпущена версия Genie 2, генерирующая миры по изображениям. Теперь компания формирует команду под руководством бывшего главного разработчика видеогенератора Sora (OpenAI), сосредоточенную на развитии мировых моделей.
Genie 2 критиковали за короткую продолжительность взаимодействия — около минуты, и нестабильность окружения. Новая версия значительно улучшена: она поддерживает длительное присутствие в одном мире и «удерживает» предметы на месте в течение нескольких минут.
Genie 3 также предлагает динамические «подсказываемые события» — например, смену погоды или появление новых персонажей. Хотя возможности взаимодействия с миром пока ограничены, это уже серьёзный шаг вперёд.
Источник
Уникальность