Physical Intelligence опубликовала исследование, демонстрирующее способность её модели π0.7 выполнять задачи, на которых робот не был обучен. По данным компании, это достигается за счет композиционной генерализации — комбинирования навыков, полученных в разных контекстах, для решения новых проблем.
Традиционный подход к обучению роботов основан на сборе данных для конкретной задачи и обучении специализированной модели. Модель π0.7, по информации Physical Intelligence, отходит от этого принципа. Сергей Левин, сооснователь компании и профессор UC Berkeley, отмечает, что когда модель переходит от воспроизведения обучающих данных к переработке информации новыми способами, её возможности растут нелинейно с увеличением объема данных.
В исследовании приводится пример с аэрофритюрницей, которую робот практически не видел во время обучения. В тренировочном наборе было всего два релевантных эпизода: один, где робот закрыл аэрофритюрницу, и другой из открытого источника, где робот поместил пластиковую бутылку внутрь. Модель синтезировала эти фрагменты с данными веб-предобучения и смогла функционально понять принцип работы устройства. Без инструкций робот сделал приемлемую попытку готовить сладкий картофель, а с пошаговыми устными инструкциями выполнил задачу успешно.
Исследователи подчеркивают ограничения модели. Ашвин Балакришна, научный сотрудник Physical Intelligence, указывает, что в одном из экспериментов с аэрофритюрницей успешность была 5%, но после получасового уточнения формулировки задачи повысилась до 95%. Модель не способна выполнять сложные многоэтапные задачи по одной высокоуровневой команде. Левин отмечает, что робот не может выполнить команду «приготовь мне тосты», но справляется хорошо, если получает пошаговые инструкции.
Компания также признает отсутствие стандартизированных тестов для робототехники, что затрудняет внешнюю валидацию результатов. Physical Intelligence измеряла π0.7 против собственных предыдущих специализированных моделей и обнаружила, что универсальная модель соответствует их производительности по ряду задач.
Источник: TechCrunch AI
Реклама: 🔥 Хочешь получить Telegram Premium и стать гуру Polymarket? Кликай сюда!