Создание аудиокниги с помощью синтезатора речи самостоятельно
Автор: Юрий БорУпомянул раз в каком-то комментарии, что делал аудиокнигу и сразу посыпались вопросы. Решил вынести в отдельную тему, может кому и пригодится.
Изначально делать аудиокнигу я не планировал, но через некоторое время, после выхода своей книги, обнаружил, что какие-то "умельцы", ее уже "озвучили" с помощью TTS родом из 90-х. Непонятно, правда, зачем, точнее непонятно зачем они это сделали в ТАКОМ ВИДЕ . Наверное они просто были не в курсе, что с 90-х годов прогресс в области синтеза речи немного продвинулся. В общем, то что у них вышло я посчитал издевательством над книгой и решил выпустить свою, более качественную, версию.
Поскольку ни красивым мужским баритоном, ни качественной звукозаписывающей аппаратурой я не обладаю, а оплачивать услуги чтецов дороговато, решил сделать ее с помощью того же TTS, но только современного и качественного.
Занялся изучением предлагаемых вариантов. Самым недорогим оказался синтез речи от ЦРТ - 535 руб./млн.символов. Но основной их голос Владимир показался мне не очень подходящим для начитки книг. Он больше подходит для объявления остановок в транспорте. Да и сложности в расстановке ударений предопределили мой выбор в пользу Яндекса. Тем более, что голос Филиппа ничуть не уступает Владимиру, а Алена так вообще считается лучшим на сегодняшний день русским голосом. Думаю многие его слышали, это голос Литрес Авточтец. Плюс сыграло значение, что в Яндексе очень легко поменять ударение и расстановку пауз. Правда Яндекс значительно дороже ЦРТ, они не работают с частными лицами, а сервисы, которые подключили их API берут по 5 руб./тысяча знаков за Премиум голоса. Очень дорого, чтобы слушать с их помощью книги, но как разовую трату на создание аудиокниги, я посчитал эту цену приемлемой.
Для озвучки своей книги я выбрал сервис Zvukogram который в этом плане предоставляет наиболее широкие возможности. Во-первых они подключили не только яндексовские голоса, но и практически все существующие на сегодняшний день, а во-вторых с помощью этого сервиса достаточно легко сделать многоголосую озвучку. Надо просто оборачивать соответствующими тегами фразы персонажей. Сделать это несложно даже обычному пользователю, поскольку реализовано с помощью визуального редактора.
Прошу понять меня правильно, я нисколько не рекламирую этот сервис, ребята они мутноватые. Ни один указанный на сайте e-mail не работает, да и в чате они отвечают через раз. Так что, если будете использовать - на свой страх и риск. Я закидывал им небольшую сумму, расходовал ее и только потом закидывал новую. Но проблем вроде не возникло.
Ну и сам работа над книгой. Сперва, с помощью автозамены, пришлось удалить все запятые. Правила пунктуации русского языка нелогичны и текст с правильно расставленными запятыми звучит просто по-идиотски. Затем расставить ударения (в яндексе это делается с помощью знака "+" перед ударным слогом) и заново расставить запятые, там где они действительно необходимы, ну и добавить паузы (-.).
Чтобы это сделать, тест приходилось прослушивать по многу раз. Делать это по цене 5 руб. за тысячу знаков было бы дороговато, поэтому эту работу я проделал в на демостраничке Yandex Speech Kit . Там, кстати, можно еще поиграть со скоростью текста и эмоциями.
После чего обработанный текст переносил в Звукограм, и уже там раскидывал диалоги по различным голосам. Для декламатора я выбрал голос Филиппа, главных героев озвучивали Захар и Алена, ну и прочие, не премиум голоса, для второстепенных персонажей.
На выходе получался МП3 файл с качеством 64 kbps, 44100 Hz. Понятно, конечно, что читал не заслуженный артист России, но по-моему получилось не хуже, чем у некоторых "чтецов". Можете оценить результат самостоятельно ЗДЕСЬ.
Ну вроде и все, надеюсь эта статья будет кому-то полезна.