Google сумела максимально точно синтезировать человечный голос

bizneser · 04.01.2018

Компания Google завершила разработку технологии Tacotron второго поколения, позволяющей преобразовывать текст в речь. Поисковый гигант уже многие годы работает над совершенствованием машинной речи для своих сервисов вроде Google Assistant, «Переводчик», «Карты» и другие. Инженерам Google удалось добиться такого результата, что теперь синтетическую речь сложно отличить от человеческой.

Новая технология учитывает пунктуацию, правильно расставляет ударения, а слова, начинающиеся с заглавной буквы, будь то имена, названия городов или ещё что-то, выделяются, так как они являются важной частью предложения. Для достижения такого результата используется две нейронные сети. Первая превращает обычный текст в спектрограмму — визуальное представление звуковых частот. Полученный результат отправляется во вторую сеть под названием WaveNet, разработанную британской компанией DeepMind, которая занимается изучением искусственного интеллекта. Она и выполняет все последующие операции.

WaveNet уже используется в английской и японской версиях Google Assistant, а вскоре будет применена и в других языках. Основным преимуществом WaveNet над аналогами является возможность работать в полностью автономном режиме. Ей не нужен доступ к большой базе данных предварительно записанных звуков. Вместо этого сеть генерирует собственные звуки, основанные на спектрограммах, подаваемых ей первой нейронной сетью.

Оценить качество машинной речи Google можно по ссылке. Важно отметить, что в одной записи используется голос реального человека, а во второй — созданный Tacotron 2.

Источник.

Thunderlight · 06.01.2018

В Обители Зла голосовой приказ был синтезирован из текста, но образчик голоса был.

ksyp · 13.01.2018

надеюсь,что это правда

The Flash · 13.01.2018

Thunderlight написал(а):
В Обители Зла голосовой

После прочтения темы тоже Обители Зла сразу напомнило

AlexBet · 14.01.2018

Гугл развивается в правильном направлении.

ohmonitor13 · 08.05.2018

Побольше бы аналогичных технологий и бесплатно.

Google сумела максимально точно синтезировать человечный голос

bizneser

ТОП-МАСТЕР

Thunderlight

ТОП-МАСТЕР

ksyp

Интересующийся

The Flash

ТОП-МАСТЕР

AlexBet

МАСТЕР

ohmonitor13

Новичок

Похожие темы