Создание аудиокниги с помощью синтезатора речи самостоятельно
Автор: Юрий БорУпомянул раз в каком-то комментарии, что делал аудиокнигу и сразу посыпались вопросы. Решил вынести в отдельную тему, может кому и пригодится.
Изначально делать аудиокнигу я не планировал, но через некоторое время, после выхода своей книги, обнаружил, что какие-то "умельцы", ее уже "озвучили" с помощью TTS родом из 90-х. Непонятно, правда, зачем, точнее непонятно зачем они это сделали в ТАКОМ ВИДЕ . Наверное они просто были не в курсе, что с 90-х годов прогресс в области синтеза речи немного продвинулся. В общем, то что у них вышло я посчитал издевательством над книгой и решил выпустить свою, более качественную, версию.
Поскольку ни красивым мужским баритоном, ни качественной звукозаписывающей аппаратурой я не обладаю, а оплачивать услуги чтецов дороговато, решил сделать ее с помощью того же TTS, но только современного и качественного.
Занялся изучением предлагаемых вариантов. Самым недорогим оказался синтез речи от ЦРТ - 535 руб./млн.символов. Но основной их голос Владимир показался мне не очень подходящим для начитки книг. Он больше подходит для объявления остановок в транспорте. Да и сложности в расстановке ударений предопределили мой выбор в пользу Яндекса. Тем более, что голос Филиппа ничуть не уступает Владимиру, а Алена так вообще считается лучшим на сегодняшний день русским голосом. Думаю многие его слышали, это голос Литрес Авточтец. Плюс сыграло значение, что в Яндексе очень легко поменять ударение и расстановку пауз. Правда Яндекс значительно дороже ЦРТ, они не работают с частными лицами, а сервисы, которые подключили их API берут по 5 руб./тысяча знаков за Премиум голоса. Очень дорого, чтобы слушать с их помощью книги, но как разовую трату на создание аудиокниги, я посчитал эту цену приемлемой.
Для озвучки своей книги я выбрал сервис Zvukogram который в этом плане предоставляет наиболее широкие возможности. Во-первых они подключили не только яндексовские голоса, но и практически все существующие на сегодняшний день, а во-вторых с помощью этого сервиса достаточно легко сделать многоголосую озвучку. Надо просто оборачивать соответствующими тегами фразы персонажей. Сделать это несложно даже обычному пользователю, поскольку реализовано с помощью визуального редактора.
Прошу понять меня правильно, я нисколько не рекламирую этот сервис, ребята они мутноватые. Ни один указанный на сайте e-mail не работает, да и в чате они отвечают через раз. Так что, если будете использовать - на свой страх и риск. Я закидывал им небольшую сумму, расходовал ее и только потом закидывал новую. Но проблем вроде не возникло.
Ну и сам работа над книгой. Сперва, с помощью автозамены, пришлось удалить все запятые. Правила пунктуации русского языка нелогичны и текст с правильно расставленными запятыми звучит просто по-идиотски. Затем расставить ударения (в яндексе это делается с помощью знака "+" перед ударным слогом) и заново расставить запятые, там где они действительно необходимы, ну и добавить паузы (-.).
Чтобы это сделать, тест приходилось прослушивать по многу раз. Делать это по цене 5 руб. за тысячу знаков было бы дороговато, поэтому эту работу я проделал в на демостраничке Yandex Speech Kit . Там, кстати, можно еще поиграть со скоростью текста и эмоциями.
После чего обработанный текст переносил в Звукограм, и уже там раскидывал диалоги по различным голосам. Для декламатора я выбрал голос Филиппа, главных героев озвучивали Захар и Алена, ну и прочие, не премиум голоса, для второстепенных персонажей.
На выходе получался МП3 файл с качеством 64 kbps, 44100 Hz. Понятно, конечно, что читал не заслуженный артист России, но по-моему получилось не хуже, чем у некоторых "чтецов". Можете оценить результат самостоятельно ЗДЕСЬ.
Ну вроде и все, надеюсь эта статья будет кому-то полезна.
Неплохо, (лучше чем у меня получилось), слушать можно.
А что у вас получилось? Можно где-то оценить?
Да вы, батенька, лукавите! Очень удачно подобранный под настроение книги голос, расстановка ударений, интонации, паузы, музыка, все это отдает махровым профессионализмом и нечеловеческим терпением. ИМХО это максимум того, что можно вытянуть из TTS на сегодняшний день. На месте всяких Яндексов, я бы демонстрировал ваше аудио в рекламных целях. Обязательно продолжайте!
Я сейчас работаю над новым проектом, читать некогда, поэтому книги только слушаю в машине. На вас подписываюсь, как закончите, с удовольствием прослушаю.
Интересно) Спасибо)
Есть в хроме приложение "Read Aloud". Если поставить его и зарегистрировать на свою гугл почту, появляется возможность выбора Amazon Russian.
Из всего что находил, этот голос больше всего по душе пришелся. Правда, это приложение для онлайн чтения, и в ней нет никаких дополнительных настроек, а записать можно будет, скорее всего отдельной программой для ловли звука )
Сам использую для себя, вычитываю с ним свои книги и вношу правки - на слух воспринимается иначе.
Голос Amazon Татьяна есть и на Звукограме
Расстроила меня ваша статья.
Ради эксперимента закинул абзац из своей книги - получилось гораздо лучше, чем думал. Но с другой стороны я, как любитель аудиокниг, привык к качественной озвучке.
послушал немного, персонажи получились хуже чем основной голос,которы просто шикарен
Да, есть такое. Там всего 2 премиум голоса Филипп и Алена, которые звучат просто отлично, а вот обычные хромают, да и мало их. Приходилось некоторых персонажей озвучивать одним и тем же голосом, меняя тембр и скорость.
Спасибо. Благодаря Вашей статье записала аудиоверсию своего самого ситового рассказа
https://litmarket.ru/books/emiliyu-pustili-po-krugu-na-svadbe
Читательницы очень довольны
"ее уже "озвучили" с помощью TTS родом из 90-х."
Это rh voice родом из 2010-ых! А качество низкое из-за сильного сжатия с потерями. Голоса бесплатные и работают на компьютерах или смартфонах.
какое "качество" для речи???