ByteDance представила Lance — открытую мультимодальную модель искусственного интеллекта для работы с изображениями и видео. По данным компании, модель выполняет задачи понимания, генерации и редактирования контента в единой архитектуре.
Лаборатория интеллектуального создания ByteDance разработала Lance с использованием 3 миллиардов активных параметров. Модель работает как с изображениями, так и с видеоматериалами, обрабатывая их в одной системе без необходимости использования отдельных специализированных инструментов.
По информации разработчиков, Lance позволяет выполнять три основных типа операций: анализ визуального содержимого, создание новых изображений и видео, а также редактирование существующего материала. Компания выпустила модель в открытом доступе.
Разработка демонстрирует тренд объединения различных функций обработки визуального контента в единую архитектуру. Аналитики отмечают, что такой подход может снизить требования к вычислительным ресурсам и упростить развертывание систем.
Источник: Marktechpost
Реклама: 🔥 Хочешь получить Telegram Premium и стать гуру Polymarket? Кликай сюда!