Sora, генератор видео от OpenAI, запускается в понедельник - по крайней мере, для некоторых пользователей.
Ютубер Маркес Браунли (Marques Brownlee) сообщил об этом в видео, опубликованном на его канале сегодня утром. Браунли получил ранний доступ к Sora и рассказал о своих первых впечатлениях в 15-минутном обзоре.
По словам Браунли, Sora живет на сайте Sora.com, на главной странице которого отображается прокрутка недавно сгенерированных и подготовленных OpenAI видеороликов Sora. (Примечательно, что этот инструмент не встроен в ChatGPT, платформу чатботов OpenAI, работающую на основе искусственного интеллекта. Пока что Sora выглядит как отдельный сервис.
Видеоролики на домашней странице Sora можно сохранять в закладки для последующего просмотра на вкладке «Сохраненные», организовывать их в папки и нажимать на них, чтобы увидеть, какие текстовые подсказки использовались для их создания. По словам Браунли, Sora может генерировать видео из загруженных изображений и подсказок, а также редактировать существующие видео, созданные Sora.
Используя функцию «Re-mix», пользователи могут описать изменения, которые они хотят видеть в видео, и Sora попытается включить их в новый клип. У функции «Re-mix» есть параметр «сила», который позволяет пользователям указать, насколько радикально они хотят, чтобы Sora изменила целевое видео, при этом более высокие значения дают видео с большей художественной вольностью.
По словам Браунли, Sora может генерировать кадры вплоть до 1080p, но чем выше разрешение, тем больше времени требуется для создания видео. Съемка 1080p занимает в 8 раз больше времени, чем 480p - самый быстрый вариант, а 720p - в 4 раза больше.
По словам Браунли, среднее видео в разрешении 1080p в его тестах занимало «пару минут». «И это еще, например, сейчас, когда почти никто не использует эту технологию», - сказал он. «Мне интересно, сколько времени это займет, когда это будет открыто для всех желающих».
По словам Браунли, помимо создания разовых клипов, в Sora есть функция «Storyboard», которая позволяет пользователям объединять подсказки для создания сцен или последовательностей видео. Предполагается, что это поможет добиться последовательности - известное слабое место видеогенераторов с искусственным интеллектом.
Но как работает Sora? По словам Браунли, она страдает от тех же недостатков, что и другие генеративные инструменты, а именно от проблем, связанных с постоянством объектов. В видеороликах Sora объекты проходят друг перед другом или друг за другом нелогичным образом, а также исчезают и появляются вновь без всякой причины.
Ноги - еще один серьезный источник проблем для Соры, говорит Браунли. Если человеку или животному с ногами приходится долго ходить в ролике, Сора путает передние и задние ноги. По словам Браунли, ноги будут «меняться» местами анатомически невозможным образом.
По словам Браунли, в Sora встроен ряд защитных механизмов, которые запрещают создателям генерировать кадры, демонстрирующие людей младше 18 лет, содержащие насилие или «откровенные темы», а также нарушающие авторские права третьих лиц. По словам Браунли, Sora также не будет генерировать видео из изображений с общественными деятелями, узнаваемыми персонажами или логотипами, и она помечает каждое видео водяными знаками - хотя и визуальными, которые можно легко вырезать.
Итак, чем же полезна Sora? Браунли считает, что она полезна для таких вещей, как титульные слайды в определенном стиле, анимация, абстракции и стоп-кадры. Но он не стал рекомендовать ее для создания фотореалистичных изображений.
«Впечатляет, что это видео, созданное искусственным интеллектом, но довольно быстро можно понять, что это видео, созданное искусственным интеллектом», - сказал он о большинстве клипов Sora. «Все становится очень странным».
Оригинал
Уникальность