По оценкам различных аналитиков, мировой рынок переводческих услуг составляет около 40 миллиардов долларов. На этом рынке значительную долю составляют корпоративные услуги. Для потребителей доминируют такие приложения, как Google Translate и Apple Translate, но они не работают со звонками и голосовыми сообщениями.
Компания EzDubs, основанная Y Combinator, хочет решить проблему перевода между людьми с помощью своего приложения, которое поддерживает перевод звонков, голосовых сообщений и текста на более чем 30 языках.
Стартап был основан в 2023 году Падманабханом Кришнамурти, Амрутаваршем Кинаги и Каримом Нассаром. Кришнамурти и Кинаги познакомились во время учебы в колледже в Гонконге. В то время они создали проект, который читал по губам и переводил речь в текст для людей с нарушениями слуха.
В 2021 году дуэт переехал в Колумбийский университет и начал работать над дублированием видео. В университете они познакомились с Нассаром, который возглавлял группу речевого ИИ Cisco, параллельно обучаясь в магистратуре. Нассар работал над продуктами речевого ИИ в режиме реального времени. Позже он создал стартап Voicea, специализирующийся на интеллектуальном обеспечении переговоров, который продал компании Cisco. Трио официально приступило к созданию EzDubs после участия в программе Y Combinator 2023 с моделью дубляжа и ранней версией инструмента перевода.
Сначала компания создала бота для Twitter/X, который переводил клипы, размещенные на платформе, и выпустила его в январе 2023 года. Вы можете упомянуть бота и попросить его перевести видео на другой язык. У бота более 340 000 подписчиков, он получает более 500 запросов на перевод в день, а количество просмотров переведенных видеороликов превышает миллион в день.
В июле 2023 года компания запустила бота в WhatsApp, который позволял пользователям переводить голосовые сообщения и видео. Однако пользователю приходилось пересылать голосовое сообщение боту, получать ответный перевод и отправлять его оригинальному отправителю. Чтобы облегчить эту проблему и создать более надежный канал связи, компания решила создать свое приложение и выпустила раннюю версию в этом году.
«Партнеры из Y Combinator сказали нам, что если вы сможете решить сложную проблему задержки связи на разных языках, то коммуникационная платформа будет иметь гораздо больший эффект, чем видео», - отметил Кришнамурти, говоря о том, что он решил создать коммуникационное приложение, а не заниматься дублированием видео.
Приложение, доступное на iOS и Android, предлагает перевод звонков в режиме реального времени с поддержкой 30 языков. Вы можете позвонить человеку, говорящему на другом языке, и получить мгновенный перевод. При этом собеседнику не нужно иметь приложение EzDubs, чтобы разговаривать. Приложение также предлагает перевод текстовых, голосовых и видеосообщений.
Хотя пользователи могут делиться переведенными голосовыми или видеосообщениями за пределами приложения с помощью ссылки, создатели считают, что для людей, которые общаются на нескольких языках, такие платформы, как WhatsApp и iMessage, не подходят.
EzDubs отметил, что многие люди используют его приложение для совершения сотен звонков в день, при этом среднее время разговора составляет 17 минут. По словам представителей стартапа, среди наиболее популярных пользователей - люди, встречающиеся между представителями разных культур, и профессионалы, пытающиеся общаться с местными жителями, находясь за границей.
В основе стартапа лежат две модели: одна для клонирования голоса с сохранением передаваемых эмоций, а другая - для перевода. Модель перевода справляется с прерываниями и не ждет, пока кто-то закончит предложение, чтобы начать внутренний перевод.
Стартап привлек 4,2 миллиона долларов в качестве начального финансирования под руководством Venture Highway, основанной бывшим руководителем отдела по работе с клиентами WhatsApp Нираджем Аророй. В конференции также приняли участие партнер Y Combinator Джаред Фридман, генеральный директор Replit Амджад Масад, президент Replit Мишель Катаста, генеральный директор компании Applied Intuition, занимающейся разработкой программного обеспечения для автономных автомобилей, Касар Юнис и генеральный директор облачного стартапа Replicate, поддерживаемого компанией a16z, Бен Фиршман.
Фридман отметил, что компания находится на пути к тому, чтобы сделать инструменты перевода легкодоступными для пользователей. Кроме того, он верит в продукт, учитывая богатую историю основателей, занимающихся изучением речи и языков.
«Доступ к высококачественным переводчикам был ограничен корпорациями и государственными структурами. EzDubs пытается демократизировать доступ к этой услуге через свое приложение», - сказал Фридман в интервью.
Он добавил, что даже внутри компании существуют языковые барьеры, мешающие эффективному общению, и EzDubs может устранить их.
В скором времени компания запустит функцию, которая позволит человеку отсканировать QR-код и инициировать звонок EzDubs мгновенно, не скачивая приложение. По словам основателей, хотя в таких приложениях, как Google Translate, есть режим реального времени, для его работы необходимо передавать телефон туда-сюда. В конечном итоге стартап хочет сделать EzDubs приложением для звонков по умолчанию, чтобы оно также могло обрабатывать входящие звонки.
В ближайшие месяцы EzDubs также планирует создать расширение для таких приложений, как Google Meet, Microsoft Teams, Zoom и Slack.
Оригинал
Уникальность