Что такое TTS в настройках книги и как включить нормальный голос.

Автор: Алексей Сысоев

Похоже, не все знают, что за галочку предлагается поставить в настройках публикации книги, и некоторые ее не ставят, не зная, зачем это нужно. И не все знают, как включить в приложении красивый качественный голос, который будет с интонациями читать, почти как живой человек. И я хочу рассказать обо всем этом, и особенно как включить такой голос.

Что включает галочка?

Сначала для тех, кто не знает, что означает галочка TTS. Это включение очень хорошей и нужной фишки у книги, что читатель сможет, когда надо, нажать кнопку и послушать вашу книгу в аудиоформате. Как аудиокнигу. Синтетический голос ее озвучит. Вы хотели бы, чтобы у вас была аудиокнига и кто-то ее озвучил? Вот! Тут сам АТ это сделает бесплатно речевым движком. Это очень крутая и удобная функция, которой многие пользуются. Удобно слушать в машине, в поездке, за работой, когда больные глаза или плохое зрение, поэтому всегда включайте эту галочку, не лишайте читателя удобной функции!

Она включается в приложении, сверху на панельке появляется кнопка с наушниками.

 Читая книгу, вы можете нажать эту кнопку, и компьютерный голос будет читать вслух. А если вы галочку не нажали при публикации, то у ваших книг такой кнопки нет, представляете какая катастрофа? Но галочку можно включить в любой момент в настройках книги.

Эта функция озвучки пока работает только в мобильном приложении, на компьютере в браузере нет, но вроде собираются однажды сделать.


Как включить красивый голос, обученный нейросетью?

Теперь о том, как включить нормальный голос, а не эту синтетическую хрень, которая скрипит как из бочки, не угадывая интонации.

На панельке сверху есть шестеренка «настройки». На экранчике настроек внизу есть пункт настройка голоса. Нажав его вы попадаете на другой экранчик. Там надо в первом поле выбрать модуль голосовой Google Speech Services. А в поле ниже появляется список из десятка разных голосов. 

И вот те, которые отмечены словом network и надписью «Требуется подключение к  сети», это голоса которые обучены нейросетью гугла. Они очень высококачественные, чистые, читают с интонациями и эмоциями. В некоторых случаях невозможно на слух даже отличить от живого человека. Там есть мужские и женские голоса на любой вкус.

Еще чисто на мой вкус ползунки пауз между предложениями и абзацами убрать в ноль. Иначе голос совсем уж драматично делает паузы перед каждой фразой, что может раздражать.

Вероятно, это так выглядит только на телефонах на базе Андроид, не знаю, что там у Apple на айфонах. Но тоже наверняка есть какие-то голоса, которые можно переключить, вот только не уверен, что среди них есть нейросетевые, либо их надо как-то ставить отдельно. 

У андроид устройств вроде как этот Google Speech Services стоит всегда по умолчанию, если нет, его можно установить в плей маркете, тогда указанные голоса должны сразу появиться в настройках приложения АТ. 

У разных телефонов, например, у самсунга там в том верхнем поле стоит модуль самсунг с его стремными голосами, так вот надо переключить на гугловские.

Из минусов надо отметить, что да, требуется постоянно подключение к интернету при прослушивании нейросетевыми голосами, но оно не потребляет много трафика, я не замечал, чтобы больше 5-10 мегабайт в неделю высасывало, как бы часто я не слушал. При отсутствии интернета или перебоях, оно само переключится на обычный голос, не требующий интернета. Либо можно выбрать из того же списка. Они звучат хуже, но тоже можно слушать вполне.

У меня так же была проблема, что иногда озвучка глохла, сбивалась, переключалась на обычный голос, хотя интернет хороший. Я попробовал в настройках телефона включить разрешение приложению АТ работать в фоновом режиме, и эти повисания и запинки вроде бы прекратились.

В общем, авторы, включайте эту функцию, а читатели знайте, что можно включить красивый нормальный голос. Эти речевые движки можно еще и в интернете искать и устанавливать, если есть желание, хотя на мой вкус эти вот от гугла очень хороши и их достаточно.

UPD: Забыл упомянуть, что учет всей статистики так же происходит и при прослушивании. Просмотры идут, время чтения тоже, не переживайте.

+135
7 765

0 комментариев, по

459 20 576
Наверх Вниз