• Добро пожаловать на инвестиционный форум!

    Во всем многообразии инвестиций трудно разобраться. MMGP станет вашим надежным помощником и путеводителем в мире инвестиций. Только самые последние тренды, передовые технологии и новые возможности. 400 тысяч пользователей уже выбрали нас. Самые актуальные новости, проверенные стратегии и способы заработка. Сюда люди приходят поделиться своим опытом, найти и обсудить новые перспективы. 16 миллионов сообщений, оставленных нашими пользователями, содержат их бесценный опыт и знания. Присоединяйтесь и вы!

    Впрочем, для начала надо зарегистрироваться!
  • 🐑 Моисей водил бесплатно. А мы платим, хотя тоже планируем работать 40 лет! Принимай участие в партнеской программе MMGP
  • 📝 Знаешь буквы и умеешь их компоновать? Платим. Дорого. Бессрочная акция от MMGP: "ОПЛАТА ЗА СООБЩЕНИЯ"
  • 💰 В данном разделе действует акция с оплатой за новые публикации
  • 📌 Внимание! Перед публикацией новостей ознакомьтесь с правилами новостных разделов

DeepMind считает, что ее новая модель мира Genie 3 представляет собой ступеньку к созданию искусственного интеллекта (ИИН)

DeepMind.jpg

Google DeepMind представила Genie 3, свою новейшую базовую модель мира, которая может быть использована для обучения универсальных ИИ-агентов. По мнению ИИ-лаборатории, эта возможность является важным шагом на пути к «искусственному общему интеллекту», или интеллекту, подобному человеческому.

«Genie 3 — это первая интерактивная универсальная модель мира, работающая в режиме реального времени», — заявил Шломи Фрухтер, директор по исследованиям DeepMind, во время пресс-конференции. «Она выходит за рамки узких моделей мира, которые существовали ранее. Она не привязана к какой-либо конкретной среде. Она может генерировать как фотореалистичные, так и воображаемые миры, а также все, что находится между ними».

Genie 3, которая все еще находится в стадии предварительного исследования и не доступна для общественности, основана как на своей предшественнице Genie 2 (которая может генерировать новые среды для агентов), так и на новейшей модели генерации видео DeepMind Veo 3 (которая, как утверждается, обладает глубоким пониманием физики).

С помощью простого текстового запроса Genie 3 может генерировать несколько минут интерактивных 3D-сред с разрешением 720p и частотой 24 кадра в секунду — это значительный скачок по сравнению с 10-20 секундами, которые мог производить Genie 2. Модель также обладает функцией «программируемых мировых событий», или способностью использовать запрос для изменения сгенерированного мира.

Возможно, наиболее важно то, что симуляции Genie 3 остаются физически последовательными во времени, поскольку модель может запоминать то, что она ранее генерировала — способность, которую, по словам DeepMind, ее исследователи не программировали в модель явно.

Фрухтер сказал, что, хотя Genie 3 имеет значение для образовательного опыта, игр или прототипирования творческих концепций, его реальное раскрытие проявится в обучении агентов для задач общего назначения, что, по его словам, необходимо для достижения AGI.

«Мы считаем, что модели мира являются ключом на пути к AGI, особенно для воплощенных агентов, где симуляция сценариев реального мира является особенно сложной задачей», — сказал Джек Паркер-Холдер, научный сотрудник команды DeepMind по открытости, во время брифинга.

Genie 3, по-видимому, разработан для решения этой проблемы. Как и Veo, она не полагается на жестко запрограммированный физический движок; вместо этого, по словам DeepMind, модель сама учится, как устроен мир — как объекты движутся, падают и взаимодействуют — запоминая то, что она сгенерировала, и рассуждая в долгосрочной перспективе.

«Модель является авторегрессивной, то есть она генерирует по одному кадру за раз», — сказал Фрухтер в интервью TechCrunch. «Она должна оглядываться на то, что было сгенерировано ранее, чтобы решить, что будет дальше. Это ключевая часть архитектуры».

По словам компании, эта память обеспечивает согласованность в симулированных мирах Genie 3, что, в свою очередь, позволяет ей развивать понимание физики, подобно тому, как люди понимают, что стакан, балансирующий на краю стола, вот-вот упадет, или что им следует пригнуться, чтобы избежать падающего предмета.
Примечательно, что DeepMind утверждает, что модель также имеет потенциал для доведения ИИ-агентов до предела — заставляя их учиться на собственном опыте, подобно тому, как люди учатся в реальном мире.

В качестве примера DeepMind поделилась результатами тестирования Genie 3 с последней версией своего универсального агента Scalable Instructable Multiworld Agent (SIMA), поручив ему достичь ряда целей. В условиях склада они попросили агента выполнить такие задачи, как «подойти к ярко-зеленому мусоропрессу» или «дойти до загруженного красного вилочного погрузчика».

«Во всех трех случаях агент SIMA способен достичь цели», — сказал Паркер-Холдер. «Он просто получает действия от агента. Таким образом, агент берет цель, видит симулированный мир вокруг себя, а затем предпринимает действия в этом мире. Genie 3 симулирует движение вперед, и тот факт, что он способен достичь цели, объясняется тем, что Genie 3 остается последовательным».

Тем не менее, Genie 3 имеет свои ограничения. Например, хотя исследователи утверждают, что он может понимать физику, демонстрация, показывающая лыжника, спускающегося с горы, не отражала, как снег будет двигаться по отношению к лыжнику.

Кроме того, диапазон действий, которые может предпринять агент, ограничен. Например, подсказываемые мировые события позволяют осуществлять широкий спектр вмешательств в окружающую среду, но они не обязательно выполняются самим агентом. И по-прежнему сложно точно смоделировать сложные взаимодействия между несколькими независимыми агентами в общей среде.

Genie 3 также может поддерживать только несколько минут непрерывного взаимодействия, тогда как для правильного обучения потребуются часы.
Тем не менее, модель представляет собой убедительный шаг вперед в обучении агентов выходить за рамки реакции на входные данные, позволяя им потенциально планировать, исследовать, искать неопределенности и совершенствоваться путем проб и ошибок — тот вид самоуправляемого, воплощенного обучения, который, по мнению многих, является ключом к продвижению к общему интеллекту.

«У нас еще не было момента Move 37 для воплощенных агентов, когда они могут действительно предпринимать новые действия в реальном мире», — сказал Паркер-Холдер, имея в виду легендарный момент в игре в го 2016 года между ИИ-агентом DeepMind AlphaGo и чемпионом мира Ли Седолом, в которой Alpha Go сделал нестандартный и блестящий ход, ставший символом способностей ИИ.

Оригинал

Уникальность
 

Похожие темы

Сверху Снизу