В среду Meta представила свою новую модель искусственного интеллекта V-JEPA 2, «мировую модель», которая призвана помочь агентам искусственного интеллекта понимать окружающий мир.
V-JEPA 2 является расширением модели V-JEPA, выпущенной Meta в прошлом году, которая была обучена на более чем 1 миллионе часов видео. Эти обучающие данные должны помочь роботам и другим ИИ-агентам функционировать в физическом мире, понимая и предсказывая, как такие понятия, как гравитация, повлияют на последующие события в последовательности.
Это те виды связей здравого смысла, которые маленькие дети и животные устанавливают по мере развития своего мозга — например, когда вы играете с собакой в аппорт, она (надеюсь) поймет, что отскок мяча от земли приведет к его отскоку вверх, или что ей нужно бежать туда, где, по ее мнению, мяч приземлится, а не туда, где мяч находится в данный момент.
Meta приводит примеры, когда робот может столкнуться, например, с ситуацией, когда он держит тарелку и лопатку и идет к плите с приготовленными яйцами. ИИ может предсказать, что следующим действием, скорее всего, будет использование лопатки для перемещения яиц на тарелку.
По данным Meta, V-JEPA 2 в 30 раз быстрее, чем модель Cosmos от Nvidia, которая также пытается улучшить интеллект, связанный с физическим миром. Однако Meta, возможно, оценивает свои собственные модели по другим критериям, чем Nvidia.
«Мы считаем, что модели мира откроют новую эру в робототехнике, позволяя агентам искусственного интеллекта в реальном мире помогать в выполнении домашних дел и физических задач без необходимости в астрономическом количестве данных для обучения роботов», — пояснил в видео главный научный сотрудник Meta по искусственному интеллекту Ян ЛеКун.
Оригинал
Уникальность