Языковые модели помогают воспроизводить Бетховена
Учитывая последовательный характер музыки, команда адаптировала трансформационные модели, используемые для обработки естественного языка.
В итоге они создали четыре нейронные сети. Две модели, используемые в языковом переводе, оказались лучшими для добавления гармонии и оркестровки, еще одна трансформационная модель служила для разработки тем, а модель BERT помогла связать темы.
Поскольку музыку можно представить в виде математических символов, серверы лаборатории, оснащенные рядом графических процессоров NVIDIA, включая TITAN RTX, легко справились с этой задачей.
«Наблюдать, как ИИ учится у такого гения, как Бетховен, было потрясающим опытом», - сказал Эльгаммал, чьи обучающие модели включали многочасовые музыкальные произведения немецкого мастера.
Источник
Уникальность