• Реклама: 💰 Пополни свой портфель с минимальной комиссией на Transfer24.pro
  • Добро пожаловать на инвестиционный форум!

    Во всем многообразии инвестиций трудно разобраться. MMGP станет вашим надежным помощником и путеводителем в мире инвестиций. Только самые последние тренды, передовые технологии и новые возможности. 400 тысяч пользователей уже выбрали нас. Самые актуальные новости, проверенные стратегии и способы заработка. Сюда люди приходят поделиться своим опытом, найти и обсудить новые перспективы. 16 миллионов сообщений, оставленных нашими пользователями, содержат их бесценный опыт и знания. Присоединяйтесь и вы!

    Впрочем, для начала надо зарегистрироваться!
  • 🐑 Моисей водил бесплатно. А мы платим, хотя тоже планируем работать 40 лет! Принимай участие в партнеской программе MMGP
  • 📝 Знаешь буквы и умеешь их компоновать? Платим. Дорого. Бессрочная акция от MMGP: "ОПЛАТА ЗА СООБЩЕНИЯ"
  • 💰 В данном разделе действует акция с оплатой за новые публикации
  • 📌 Внимание! Перед публикацией новостей ознакомьтесь с правилами новостных разделов

Google сумела максимально точно синтезировать человечный голос

bizneser

ТОП-МАСТЕР
Крипто-блогер
Регистрация
04.09.2010
Сообщения
47,260
Реакции
7,866
Поинты
383.999

Компания Google завершила разработку технологии Tacotron второго поколения, позволяющей преобразовывать текст в речь. Поисковый гигант уже многие годы работает над совершенствованием машинной речи для своих сервисов вроде Google Assistant, «Переводчик», «Карты» и другие. Инженерам Google удалось добиться такого результата, что теперь синтетическую речь сложно отличить от человеческой.


Новая технология учитывает пунктуацию, правильно расставляет ударения, а слова, начинающиеся с заглавной буквы, будь то имена, названия городов или ещё что-то, выделяются, так как они являются важной частью предложения. Для достижения такого результата используется две нейронные сети. Первая превращает обычный текст в спектрограмму — визуальное представление звуковых частот. Полученный результат отправляется во вторую сеть под названием WaveNet, разработанную британской компанией DeepMind, которая занимается изучением искусственного интеллекта. Она и выполняет все последующие операции.

WaveNet уже используется в английской и японской версиях Google Assistant, а вскоре будет применена и в других языках. Основным преимуществом WaveNet над аналогами является возможность работать в полностью автономном режиме. Ей не нужен доступ к большой базе данных предварительно записанных звуков. Вместо этого сеть генерирует собственные звуки, основанные на спектрограммах, подаваемых ей первой нейронной сетью.

Оценить качество машинной речи Google можно по ссылке. Важно отметить, что в одной записи используется голос реального человека, а во второй — созданный Tacotron 2.

Источник.
 

Thunderlight

ТОП-МАСТЕР
Регистрация
01.12.2012
Сообщения
12,372
Реакции
4,372
Поинты
25.330

The Flash

ТОП-МАСТЕР
Верифицирован
Регистрация
12.09.2012
Сообщения
30,117
Реакции
13,366
Поинты
3.282
Сверху Снизу