В условиях, когда потребление контента в мире растет, а спрос на неанглоязычный контент превышает спрос на англоязычные фильмы и передачи, IMAX использует искусственный интеллект для расширения масштабов локализации своего оригинального контента.
Согласно отчету PwC, индустрия развлечений и СМИ выросла на 5 % и в 2023 году составит 2,8 триллиона долларов. Ожидается, что в ближайшие пять лет отрасль продолжит свое развитие, хотя и со скромными среднегодовыми темпами роста - почти на 4 % до 3,4 триллиона долларов. Неанглоязычный контент быстро растет даже на англоязычных рынках, включая США, Великобританию, Австралию и Канаду. В прошлом году компания Netflix сообщила о 90-процентном росте числа зрителей неанглоязычного контента в Великобритании за последние три года.
IMAX учла все это и теперь изучает возможности локализации с помощью искусственного интеллекта, чтобы привлечь больше зрителей.
В понедельник канадская компания, известная своими огромными кинотеатрами и захватывающими фильмами, объявила о сотрудничестве с дубайским стартапом Camb.ai, чтобы использовать свои речевые модели искусственного интеллекта для перевода оригинального контента, в том числе документальных фильмов.
Camb.ai, который уже использовал свои ИИ-модели дубляжа и перевода речи для прямых трансляций спортивных мероприятий и лиг, включая Australian Open, Eurovision Sport и Major League Soccer, предлагает свои модели Boli для перевода речи в текст и Mars для эмуляции речи. Модели доступны через платформу DubStudio, которая поддерживает 140 языков, включая различные языки с низким уровнем ресурсов, по которым нет значительного количества данных в Интернете.
«У таких компаний, как OpenAI и Anthropic, другое видение общества», - сказал Акшат Пракаш, соучредитель и технический директор Camb.ai, в эксклюзивном интервью. «Они пытаются построить модели, которые являются очень горизонтальными и могут охватывать большой спектр задач. ... Нам это совсем не нужно. Некоторые из наших моделей имеют менее 100 миллионов параметров и являются суперспециализированными».
Пракаш, бывший инженер Apple, который работал в команде, разрабатывающей ИИ и ML-модели для Siri, стал соучредителем Camb.ai вместе со своим отцом Авнишем Пракашем в прошлом году.
«Мы живем в одном поколении и выросли в Индии. За тридцать лет разницы мы столкнулись с одними и теми же языковыми проблемами», - рассказал технический директор.
По его словам, Camb.ai предварительно обучила 70 % своих моделей, используя академические наборы данных, лицензированные для коммерческого использования. Оставшиеся 30 % включают в себя тонкую настройку данных, которые компания получает через первых партнеров, использующих ее модели для дубляжа и перевода на основе ИИ.
«Чего мы не делаем, и мы были очень осторожны и полностью избегали этого, так это потенциального уничтожения интернета», - утверждает Пракаш. «Некоторые компании считают, что им это сойдет с рук, потому что они создают приложение или инструмент, ориентированный на потребителя, и считают, что вполне можно выскрести 10 петабайт из интернета».
Camb.ai использует «трехслойный» подход для обеспечения перевода на основе искусственного интеллекта, включающий в себя базовый уровень моделей Boli и Mars, инфраструктурный уровень, на котором размещаются эти модели искусственного интеллекта, и платформу DubStudio для фронт-энда.
По словам Пракаша, в отличие от других моделей, основанных на искусственном интеллекте, Boli компании Camb.ai принимает на вход речевые лексемы, создает выходные текстовые лексемы на переведенном языке и сохраняет нюансы. По его словам, после того как Boli сгенерирует текст, Mars переводит его в речь, используя тот же входной аудиосигнал, чтобы захватить исполнение фактического звука, включая окружающий звук, например фоновую партитуру зрительских аплодисментов в случае спортивных мероприятий.
Пракаш рассказал, что технология Camb.ai обеспечивает перевод речи на 10 языков одновременно с задержкой в 20-30 секунд, которая может быть покрыта задержкой потокового вещания и трансляции в 30-40 секунд.
IMAX будет внедрять перевод с помощью искусственного интеллекта поэтапно, начиная с языков с высокими ресурсами. Внедрение происходит после внутреннего тестирования технологии Camb.ai на оригинальном контенте.
«Хотя мы находимся только на начальном этапе сотрудничества, мы будем продолжать работать вместе, чтобы лучше изучить его потенциал и то, как оно может наилучшим образом продвинуть нас вперед», - сказал Марк Уэлтон, президент IMAX Global.
Уэлтон отметил, что внедрение искусственного интеллекта поможет сократить расходы на перевод, не раскрыв при этом конкретных деталей.
В настоящее время команда Camb.ai насчитывает 50 человек. В феврале компания привлекла 4 миллиона долларов в рамках посевного раунда под руководством Courtside Ventures. Пракаш сообщил, что стартап собирается провести более крупный раунд, предшествующий серии А, чтобы расширить сферу деятельности и увеличить численность персонала.
Оригинал
Уникальность