Applio или как сделать из своего голоса женский?

Автор: Владимир Адам

Всем добрый день! С вами на связи Владимир Адам и я сегодня с достаточно интересным способом использования нейросетей в озвучке аудиокниг. Наверняка у всех и каждого, кто когда-то садился за это дело, возникал немаловажный вопрос... Как сделать свой голос противоположного пола?

На данный вопрос есть ответ! И это Applio - полностью бесплатное и opensource приложение, позволяющее использовать на сделанной вами ранее записи голосовые модели RVS v2 (технология голосовой конверсии на основе искусственного интеллекта).

Хочешь голос грозного Владыки Демонов? Пожалуйста! Хочешь стать кавайной аниме девочкой? Да хоть сразу тремя! Главное найди необходимую для этого голосовую модель и скачай её себе.

Приложение Applio достаточно просто в установке. Скачали и распаковали. В принципе, от вас больше не требуется на этом этапе (Кроме наличия около 4 гигабайт свободного места на диске, а также такого же количества трафика для скачивания программы).

Так где же её скачать? Всё просто. Вот ссылка.

Обязательно обратите внимание на следующий абзац в источнике (Именно эта ссылка нам и нужна):

Download Compiled Version: Get the zip from this link.

Далее вам необходимо зайти в разархивированную папку и соответственно запустить файл "run-applio.bat". Запускаете и ожидаете открытия веб-интерфейса данного программного обеспечения (Если говорить просто - то у вас откроется отдельная вкладка в браузере).

Что же нас интересует для наших целей? Конечно же вкладка "Скачать".

Здесь вы можете указать ссылку на модель для её установки или же попросту закинуть уже скачанные с интернета RVS-модели. Допустим, я предпочитаю использовать именно второй вариант установки, так как он куда проще в своей реализации.

Скачали? Установили? Дело уже осталось за малым!

Для преобразования записанного вами голоса - вам необходимо перейти во вкладку "Вывод", выбрать интересующую вас голосовую модель и загрузить ваш файл.

Но это не всё! Для получения наиболее качественного результата можете использовать следующие расширенные настройки (Они действенны для моего голоса и обеспечивают наилучший результат. В вашем же случае, вам, возможно, придётся немного поиграться и опробовать доступные вариации).

Примечание: Не отмеченные здесь значения - я оставляю на их базовой отметке.

Разделить аудио - включен
Очистить аудио - включен и значение на 0.8
Сдвиг формант - включен
Постобработка - включен
- Усиление - значение на 7 db
Высота тона - значение на 9
Радиус фильтра - значение на 2
Коэффициент поиска признаков - Значение на 0.4
Защита глухих согласных - значение на 0.3
Алгоритм извлечения высоты тона - hybrid[rmvpe+fcpe]

Обязательно не забудьте перед запуском генерации поставить отметку о согласии с правилами использования данного программного обеспечения. В противном случае - генерация не будет начата.

Ну, вот и всё. Генерация в среднем занимает около минуты на моём железе. Сколько будет у вас? Даже не подскажу, если честно. Всем приятного дня и, надеюсь, ещё услышимся!

аудиокниги, нейросети, творчество

1 482

0 комментариев, по времени, по убыванию времени, по возрастанию популярности

0 комментариев, по
времени, по убыванию

времени, по возрастанию

популярности