Озвучка книг в веб-версии Author.Today средствами OpenAI.

Автор: Chamie

Пользуюсь давно чат-ботом ChatGPT от OpenAI, и когда они добавили в него голосовой чат, удивился, насколько хорош их синтезатор речи — читает с выражением и даже периодически делает вид, что набирает воздух или чмокает губами. (Пример) Тот самый набор голосов, что у бота в приложении, из него не вытащить, но в их платном API есть другие неплохие голоса. Пытался прикрутить их к мобильному приложению АТ, благо там есть какая-то поддержка TTS-движков, но НИСМОХ. К счастью, я Веб-разраб, пишущий «юзерскрипты» для всякой фигни аж уже, кажется, 20 лет.

Кто не знает, что такое юзерскрипты — это отдельные куски JS, которые с помощью специального расширения (например, Tampermonkey для Хрома и Фаерфокса) запускаются поверх других сайтов, дорабатывая то, чего вам там не хватало. По сравнению с полноценными отдельными расширениями, их намного проще писать, буквально в 1-2 строчки для простых задач.

Так вот, к чему это я? Один вечер СДВГ-шного гиперфокуса, и ВСТРЕЧАЙТЕ И ТРЕПЕЩИТЕ! Озвучка OpenAI TTS для веб-читалки АТ!

Для работы, правда, вам понадобится аккаунт на OpenAI (можно просто зайти под гугловым), ключ (получается там в 1 клик) и от $5 на счету (хватить должно надолго, я надеюсь, тариф у них — $15 за миллион знаков).

Вот сам скрипт:
https://github.com/chamie/userScripts/blob/main/AuthorToday-OpenAI-TTS.user.js

Генерируется примерно такое

Из функционала: кнопки старт, стоп, пауза, индикация загрузки, подсветка текущего абзаца, автоподгрузка абзацев по мере чтения.

P.S. Завтра думаю постучаться с этим скриптом в поддержку, в подарок. Может, возьмут и встроят. Там же если на их стороне кэширование прикрутить, то на всех читателей/слушателей же один запрос в OAI будет, совсем копейки выйдут. Готов даже какую-нибудь доп подписку приплачивать, если сделают.

232

0 комментариев, по

0 1 0
Наверх Вниз