И вновь помощь слепым и слабовидящим
Автор: ГедеонПрошлый блог о помощи библиотеке для слепых неожиданно имеет продолжение.
Оказалось, что человек, с которым мы давно общаемся в сети, тоже слепой. И, зная не понаслышке, о сложностях, с которыми слепые сталкиваются в повседневности, он с тремя товарищами начал свой проект для облегчения повседневных дел вроде звонка по телефону, или деловой переписки.
Представляю вашему вниманию обращение от Артема Плаксина, проекту которого вы можете помочь своим голосом. Буквально: не голосованием, а записью голоса.
"Друзья, сегодня я хочу обратиться к вам с просьбой поддержать незрячих и слабовидящих информационно, профессионально и, возможно, финансово.
Вы знаете, как незрячие люди пользуются компьютером или мобильным телефоном? Сидят в мессенджерах, социальных сетях, а то и создают сайты? Все это возможно при помощи программ экранного доступа (скринридеров) в связке с синтезатором речи, который преобразуют весь текст на экране в роботизированный голос.
В августе мы, команда из четырех тотально слепых людей, запустили иновационный, технически уникальный на данный момент проект - лабораторию по созданию новых голосов для отечественного синтезатора речи RHVoice. Хочу отметить, что мы не являемся фондом, некоммерческой организацией или государственной структурой. У нас банально нет средств на юриста и регистрацию НКО. Да и не нужно это на практике, потому что сейчас мы делаем, а зарегистрировавшись официально рискуем превратиться в еще один обезличенный фонд, сидящий на грантах и штампующий проекты ради денег. А никто из нашей команды этого не хочет.
Поддержать лабораторию и ознакомиться подробнее с информацией о ней вы можете на нашем сайте: https://rhvoice.su
Существует наш, российский синтезатор речи, созданный в 2010 году Ольгой Яковлевой, простой слепой девушкой из Чувашии. До недавнего времени существовало всего четыре голоса, мужской из которых всего один, и все они были не самого лучшего качества.
Кроме RHVoice, бесплатно доступны на русском языке синтезаторы речи Newfon и Espeak, но методы синтеза (фонемный и формантный соответственно) не дают человеческое звучание. Получается исключительно роботизированный голос, который трудно воспринять без длительного опыта работы с ним.
Разумеется есть и зарубежные синтезаторы речи с русскими голосами, и конечно же они платные, поэтому все используют ломанные версии. И опять же, эти голоса созданы при помощи метода Unit Selection, при котором слова и предложения складываются из ранее предзаписанных кусочков речевой базы. Поэтому все голоса однотипны и не имеют индивидуальности, и на некоторых стыках слогов они подбулькивают и звучат неестественно для русского уха, ведь создавалось это все зарубежными компаниями. В случае с RHVoice же каждый голос снимает индивидуальную модель голоса диктора.
Если же говорить о синтезе речи от Google, Yandex ЦРТ и подобных компаний, который построен на нейронных сетях, то это облачный синтез, и он полноценно не доступен для использования на обычном устройстве. Кроме того, большинство облачного синтеза платное, по 150-600 рублей за мегабайт текста.
Бытовой синтез речи, не на нейронных сетях для каких-то развлечений, о котором все слышали, а для озвучивания компьютера и телефона слепого человека развит в России не достаточно. Многие незрячие люди читают текстовые электронные книги при помощи синтеза. Я, например, при помощи RHVoice сейчас пишу этот текст, переписываюсь с друзьями и коллегами и читаю книги любимых писателей. Я их покупаю на Litres или Author Today и читаю при помощи синтезатора речи. Мне не требуется для этого аудиокнига.
И чем больше качественных разнообразных голосов, тем тщательнее можно подобрать индивидуальное звучание под себя, чтобы и читать книги было удобно, и работать с операционной системой.
В целом мы во многом справляемся сами, так как лаборатория создана в рамках Тифло Хоста, и у нас есть серверные мощности от партнеров. Первым нашим продуктом стал голос "Артемий", прототипом для которого согласился бесплатно стать дизайнер Артемий Лебедев. Сейчас с нами согласились работать несколько ведущих с радио Energy и Comedy Radio.
Есть две основные проблемы:
1. Не хватает денег. Банальная причина, но она есть. Я вложил уже больше двадцати тысяч в этот проект, осознавая, что это без отдачи, потому что все конечные голоса бесплатны. Я готов сам работать бесплатно, и вся наша команда из четырех человек, но донаты нужны, и мне ничуть не стыдно их просить. Нам нужно оплачивать время дикторов, которые не могут работать бесплатно, нужно оплачивать аренду студии, если у диктора нет подходящих условий, банально повысить настроение членов команды вкусняшками.
Вряд ли вы подумаете, что два месяца работы звукорежиссера с двенадцатилетним стажем не стоит денег (а примерно столько по времени занимает создание одного голоса).
2. Не хватает дикторов со студийными, или приближенными к таковым условиями записи. Возможно кто-то из чтецов аудио-книг заинтересуется? Или у кого-то вдруг есть актеры озвучания или радийщики в знакомых?
Тут есть специфический момент. Озвученные выше категории дикторов (кроме радийщиков) боятся принимать участие в проектах, связанных с синтезом речи, потому что у всех перед глазами пример качественного синтеза от Яндекса, Сбербанка, Тинькофф или Mail.ru.
Фактически же, наш синтез не имеет отношения к нейронным сетям, как я писал ранее, и голос получается слишком роботизированным, его не получится использовать как замену диктору, тем более в коммерческих проектах.
Однако, если диктор все равно опасается, я могу пойти на заключение договора, в котором будут прописаны пункты, что:
1. Речевая база не будет передана третьим лицам или выложена в публичный доступ;
2. Речевая база не будет использоваться для синтеза при помощи нейронных сетей;
3. Готовый продукт - голос для RHVoice - будет выпущен под лицензией "Публичная лицензия Creative Commons С указанием авторства-Некоммерческая-Без производных версии 4.0 Международная".
Еще ни один диктор не запросил подобного, но как дополнительную гарантию мы предоставить сможем и такой вариант.
Я уже больше двух лет занимаюсь созданием новых полезных сервисов для слепых и слабовидящих, поддерживаю существующие проекты, получаю от компаний серверные ресурсы, чтобы поддерживать все это на безвозмездной основе. За эти два года мы с ребятами (такими же слепыми как и я) сделали множество крутых и полезных вещей, отчеты можно посмотреть тут:
https://tiflohost.ru/reports/
Или тут @tiflohost
А список всех проектов лежит тут: https://tiflohost.ru/reports/
"Тифло Хост" двукратный лауреат фестиваля "Интеграция", финалист конкурса федерального уровня "Доброволец России 2019 года" и конкурса "Позитивный контент 2018".
В конце будет ссылка на благодарственные письма от организаций, которым мы помогли в рамках https://tiflohost.ru/freesite/
Сайт лаборатории:
https://rhvoice.su
Благодарственные письма:
https://cloud.tiflo.org/s/2JLAsK7LUtCCM2N "
Вы поможете распространением этого обращения, своим голосом, помощью в проекте или небольшим пожертвованием.
Сделаем мир немного лучше.