Китайский веб-гигант Baidu объявил о выходе улучшенной технологии, способной копировать речь человека после исследования короткого фрагмента оригинала. Это не первая система, выпущенная компанией: еще в 2017 году азиатские разработчики предложили продукт из ниши искусственного интеллекта, клонирующий голос после изучения 30-минутного исходного материала.
В технической аннотации обновленной версии системы на платформе нейронной сети раскрываются ее новые возможности:
- Имитация речи после прослушивания фрагмента продолжительностью всего несколько секунд;
- Дополнение созданного голоса акцентом и другими особенностями.
А что у конкурентов?
Примечательно, что наработки Baidu в этой сфере – далеко не единственные. Компания Adobe со своей программой VoCo справлялась с аналогичными задачами, опираясь на 20-минутную запись исходного контента. Канадский аналог Lyrebird повторял успех конкурентных разработок, анализируя всего три минуты оригинальной записи.
В чем преимущества технологии Baidu
Но обновленная технология Baidu оставляет соперников далеко позади, имитируя голоса после обработки коротких семплов, продолжительность которых составляет несколько секунд.
В будущем использование подобной технологии может быть использовано для помощи людям, утратившим возможность говорить. Программа позволит им вновь обрести голос, сгенерированный на основе нейронных сетей. Так же эта технология поможет усовершенствовать цифровых ассистентов, которые пока объясняются исключительно компьютерным голосом.
Однако активное использование голосовых клонов откроет новые возможности для мошенников. Уже сейчас текущая версия программы Baidu способна обвести систему распознавания голоса вокруг пальца хотя многие компании которые готовы купить искусственную нейронную сеть принимают все меры осторожности и защиты.
Улучшенный продукт, оказавшись в недобросовестных руках, может стать инструментом массового манипулирования мнением людей, ведь с ним создавать лживые аудиозаписи разговоров важных персон не составит труда. Уже сейчас использование программ-видеоредакторов, имитирующих человеческие лица, и даже знакомого всем инструмента Photoshop может значительно испортить репутацию политиков или селебрити.