Что такое TTS в настройках книги и как включить нормальный голос.
Автор: Алексей СысоевПохоже, не все знают, что за галочку предлагается поставить в настройках публикации книги, и некоторые ее не ставят, не зная, зачем это нужно. И не все знают, как включить в приложении красивый качественный голос, который будет с интонациями читать, почти как живой человек. И я хочу рассказать обо всем этом, и особенно как включить такой голос.
Что включает галочка?
Сначала для тех, кто не знает, что означает галочка TTS. Это включение очень хорошей и нужной фишки у книги, что читатель сможет, когда надо, нажать кнопку и послушать вашу книгу в аудиоформате. Как аудиокнигу. Синтетический голос ее озвучит. Вы хотели бы, чтобы у вас была аудиокнига и кто-то ее озвучил? Вот! Тут сам АТ это сделает бесплатно речевым движком. Это очень крутая и удобная функция, которой многие пользуются. Удобно слушать в машине, в поездке, за работой, когда больные глаза или плохое зрение, поэтому всегда включайте эту галочку, не лишайте читателя удобной функции!
Она включается в приложении, сверху на панельке появляется кнопка с наушниками.
Читая книгу, вы можете нажать эту кнопку, и компьютерный голос будет читать вслух. А если вы галочку не нажали при публикации, то у ваших книг такой кнопки нет, представляете какая катастрофа? Но галочку можно включить в любой момент в настройках книги.
Эта функция озвучки пока работает только в мобильном приложении, на компьютере в браузере нет, но вроде собираются однажды сделать.
Как включить красивый голос, обученный нейросетью?
Теперь о том, как включить нормальный голос, а не эту синтетическую хрень, которая скрипит как из бочки, не угадывая интонации.
![]() | ![]() | ![]() | ![]() |
На панельке сверху есть шестеренка «настройки». На экранчике настроек внизу есть пункт настройка голоса. Нажав его вы попадаете на другой экранчик. Там надо в первом поле выбрать модуль голосовой Google Speech Services. А в поле ниже появляется список из десятка разных голосов.
И вот те, которые отмечены словом network и надписью «Требуется подключение к сети», это голоса которые обучены нейросетью гугла. Они очень высококачественные, чистые, читают с интонациями и эмоциями. В некоторых случаях невозможно на слух даже отличить от живого человека. Там есть мужские и женские голоса на любой вкус.
Еще чисто на мой вкус ползунки пауз между предложениями и абзацами убрать в ноль. Иначе голос совсем уж драматично делает паузы перед каждой фразой, что может раздражать.
Вероятно, это так выглядит только на телефонах на базе Андроид, не знаю, что там у Apple на айфонах. Но тоже наверняка есть какие-то голоса, которые можно переключить, вот только не уверен, что среди них есть нейросетевые, либо их надо как-то ставить отдельно.
У андроид устройств вроде как этот Google Speech Services стоит всегда по умолчанию, если нет, его можно установить в плей маркете, тогда указанные голоса должны сразу появиться в настройках приложения АТ.
У разных телефонов, например, у самсунга там в том верхнем поле стоит модуль самсунг с его стремными голосами, так вот надо переключить на гугловские.
Из минусов надо отметить, что да, требуется постоянно подключение к интернету при прослушивании нейросетевыми голосами, но оно не потребляет много трафика, я не замечал, чтобы больше 5-10 мегабайт в неделю высасывало, как бы часто я не слушал. При отсутствии интернета или перебоях, оно само переключится на обычный голос, не требующий интернета. Либо можно выбрать из того же списка. Они звучат хуже, но тоже можно слушать вполне.
У меня так же была проблема, что иногда озвучка глохла, сбивалась, переключалась на обычный голос, хотя интернет хороший. Я попробовал в настройках телефона включить разрешение приложению АТ работать в фоновом режиме, и эти повисания и запинки вроде бы прекратились.
В общем, авторы, включайте эту функцию, а читатели знайте, что можно включить красивый нормальный голос. Эти речевые движки можно еще и в интернете искать и устанавливать, если есть желание, хотя на мой вкус эти вот от гугла очень хороши и их достаточно.
UPD: Забыл упомянуть, что учет всей статистики так же происходит и при прослушивании. Просмотры идут, время чтения тоже, не переживайте.