Создание аудиокниги с помощью синтезатора речи самостоятельно

Автор: Юрий Бор

Упомянул раз в каком-то комментарии, что делал аудиокнигу и сразу посыпались вопросы. Решил вынести в отдельную тему, может кому и пригодится.

Изначально делать аудиокнигу я не планировал, но через некоторое время, после выхода своей книги, обнаружил, что какие-то "умельцы", ее уже "озвучили" с помощью TTS родом из 90-х. Непонятно, правда, зачем, точнее непонятно зачем они это сделали в ТАКОМ ВИДЕ . Наверное они просто были не в курсе, что с 90-х годов прогресс в области синтеза речи немного продвинулся. В общем, то что у них вышло я посчитал издевательством над книгой и решил выпустить свою, более качественную, версию.

Поскольку ни красивым мужским баритоном, ни качественной звукозаписывающей аппаратурой я не обладаю, а оплачивать услуги чтецов дороговато, решил сделать ее с помощью того же TTS, но только современного и качественного.

Занялся изучением предлагаемых вариантов. Самым недорогим оказался синтез речи от ЦРТ  - 535 руб./млн.символов. Но основной их голос Владимир показался мне не очень подходящим для начитки книг. Он больше подходит для объявления остановок в транспорте. Да и сложности в расстановке ударений предопределили мой выбор в пользу Яндекса. Тем более, что голос Филиппа ничуть не уступает Владимиру, а Алена так вообще считается лучшим на сегодняшний день русским голосом. Думаю многие его слышали, это голос Литрес Авточтец. Плюс сыграло значение, что в Яндексе очень легко поменять ударение и расстановку пауз. Правда Яндекс значительно дороже ЦРТ, они не работают с частными лицами, а сервисы, которые подключили их API берут по 5 руб./тысяча знаков за Премиум голоса. Очень дорого, чтобы слушать с их помощью книги, но как разовую трату на создание аудиокниги, я посчитал эту цену приемлемой.

Для озвучки своей книги я выбрал сервис Zvukogram  который в этом плане предоставляет наиболее широкие возможности. Во-первых они подключили не только яндексовские голоса, но и практически все существующие на сегодняшний день, а во-вторых с помощью этого сервиса достаточно легко сделать многоголосую озвучку. Надо просто оборачивать соответствующими тегами фразы персонажей. Сделать это несложно даже обычному пользователю, поскольку реализовано с помощью визуального редактора.

Прошу понять меня правильно, я нисколько не рекламирую этот сервис, ребята они мутноватые. Ни один указанный на сайте e-mail не работает, да и в чате они отвечают через раз. Так что, если будете использовать - на свой страх и риск. Я закидывал им небольшую сумму, расходовал ее и только потом закидывал новую. Но проблем вроде не возникло.

Ну и сам работа над книгой. Сперва, с помощью автозамены, пришлось удалить все запятые. Правила пунктуации русского языка нелогичны и текст с правильно расставленными запятыми звучит просто по-идиотски. Затем расставить ударения (в яндексе это делается с помощью знака "+" перед ударным слогом) и заново расставить запятые, там где они действительно необходимы, ну и добавить паузы (-.).

Чтобы это сделать, тест приходилось прослушивать по многу раз. Делать это по цене 5 руб. за тысячу знаков было бы дороговато, поэтому эту работу я проделал в на демостраничке Yandex Speech Kit . Там, кстати, можно еще поиграть со скоростью текста и эмоциями.

После чего обработанный текст переносил в Звукограм, и уже там раскидывал диалоги по различным голосам. Для декламатора я выбрал голос Филиппа, главных героев озвучивали Захар и Алена, ну и прочие, не премиум голоса, для второстепенных персонажей.

На выходе получался МП3 файл с качеством 64 kbps, 44100 Hz. Понятно, конечно, что читал не заслуженный артист России, но по-моему получилось не хуже, чем у некоторых "чтецов".  Можете оценить результат самостоятельно ЗДЕСЬ.

Ну вроде и все, надеюсь эта статья будет кому-то полезна.

+20
5 573

15 комментариев, по

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.

Саморский
#

Неплохо, (лучше чем у меня получилось), слушать можно.

 раскрыть ветвь  4
Юрий Бор автор
#

А что у вас получилось? Можно где-то оценить?

 раскрыть ветвь  1
Юрий Бор автор
#

Да вы, батенька, лукавите! Очень удачно подобранный под настроение книги голос, расстановка ударений, интонации, паузы, музыка, все это отдает махровым профессионализмом и нечеловеческим терпением. ИМХО это максимум того, что можно вытянуть из TTS на сегодняшний день. На месте всяких Яндексов, я бы демонстрировал ваше аудио в рекламных целях. Обязательно продолжайте!

Я сейчас работаю над новым проектом, читать некогда, поэтому книги только слушаю в машине. На вас подписываюсь, как закончите, с удовольствием прослушаю.

 раскрыть ветвь  1
Александр Волк
#

Интересно) Спасибо)

 раскрыть ветвь  0
Артемис Т. Мантикор
#

Есть в хроме приложение "Read Aloud". Если поставить его и зарегистрировать на свою гугл почту, появляется возможность выбора Amazon Russian.
Из всего что находил, этот голос больше всего по душе пришелся. Правда, это приложение для онлайн чтения, и в ней нет никаких дополнительных настроек, а записать можно будет, скорее всего отдельной программой для ловли звука )

Сам использую для себя, вычитываю с ним свои книги и вношу правки - на слух воспринимается иначе.

 раскрыть ветвь  1
Юрий Бор автор
#

Голос Amazon Татьяна есть и на Звукограме

 раскрыть ветвь  0
Олег Волков
#

Расстроила меня ваша статья.

Ради эксперимента закинул абзац из своей книги - получилось гораздо лучше, чем думал. Но с другой стороны я, как любитель аудиокниг, привык к качественной озвучке.

 раскрыть ветвь  0
Grentek
#

послушал немного, персонажи получились хуже чем основной голос,которы просто шикарен

 раскрыть ветвь  1
Юрий Бор автор
#

Да, есть такое. Там всего 2 премиум голоса Филипп и Алена, которые звучат просто отлично, а вот обычные хромают, да и мало их. Приходилось некоторых персонажей озвучивать одним и тем же голосом, меняя тембр и скорость.

 раскрыть ветвь  0
Саманта Джонс
#
 раскрыть ветвь  0
Артём Талипов
#

"ее уже "озвучили" с помощью TTS родом из 90-х."


Это rh voice родом из 2010-ых! А качество низкое из-за сильного сжатия с потерями. Голоса бесплатные и работают на компьютерах или смартфонах.

 раскрыть ветвь  2
Константин Волошин
#

какое "качество" для речи???

 раскрыть ветвь  1
Написать комментарий
70 38 4
Последние комментарии
5 / 98
Wendigo - Страшные истории
Литературный конкурс "Коллекция Ужасов 3" от ютуб канала Wendigo - Страшные истории.
18 / 18
Николай Берг
98% изнасилованных женщин?
23 / 23
Симона Л. Грэй
Новые иллюстрации Габриэля (18+)
23 / 23
Roxy Sloth
Доброе анимешное утро! #11 (сегодня 18+)
5 / 5
Евгения Литвиненко
Марафон драбблов!
39 / 56
Василий Панфилов
Американские попаданцы
15 / 15
Наиль Якупов
Матриархат или Мамкакратия?
1 / 1
Белова Юлия Рудольфовна
Какие подарки делают друг другу принцы?
119 / 272
Крутые бабки
Хотела в шутку, но не получилось... Слишком больная тема 18+
1 / 1
Марика Вайд
Субботний отрывок: выпуск 83
18 / 18
Лора Ли
Что могут фантасты?
5 / 5
Наталья Корнева
Предзаказ на печатную книгу открыт!
13 / 13
Дарья Гущина
Новости: май
103 / 103
Сергей Гладышев
Грязный приём для набора подписчиков
3 / 56
Петр Блэк
Просто вопрос
91 / 91
Иван Каминский
Почему девушки выбирают плохих мальчиков?/Первобытная романтика
6 / 6
Катерина Сычева "la_Rêveur"
Поймаешь?..
26 / 484K
Мерлин Маркелл
Флудилка
21 / 21
Александр Лещенко
Как я отметил 1 мая (2025)
22 / 22
Эдвард Март
Несколько фотографий с дачи
Наверх Вниз