Эксперимент: Создание аудиокниги с AI — от текста до готового видео за 50 рублей!
Автор: Носоленко ВадимПривет, друзья!
Давно не черкал в блоге строки — работа, проекты, вы знаете, как оно бывает. Но тут решил найти минуту и поделиться опытом, который меня самого немного ошарашил. Речь о создании полноценной аудиокниги с помощью нейросетей. Причем не просто озвучки текста роботом, а настоящего аудиопроизведения с кинематографичной музыкой, обложками и даже видеороликом.

Что я использовал:
1. Suno AI v5 — для создания музыкального сопровождения
2. Kling AI — для генерации видеороликов
3. Нейросети для изображений (Нана Банана от Google) — для обложек глав
4. TTS-движок — для озвучки текста
Что получилось:
Взял свой текст «Откровения богоубийцы» (темная фантастика про парня, который убил бога и унаследовал его силу) и решил превратить его в мультимедийный проект. Разбил все это дело значит я на 5 глав, каждой задал свою музыкальную тему, создал обложки и смонтировал видео для первой главы.
Первая глава: «Слои забвения» — главный герой сидит в темнице, закованный в магические кандалы, и вспоминает, как все произошло.
Как это работает:
Suno AI использует метатеги — специальные маркеры, которые указывают, какую музыку генерировать. Вы просто вставляете их в текст, и нейросеть понимает, где нужна тишина, где драма, где кульминация.
Примеры метатегов:
Структурные теги:
[Intro]— вступление (музыка начинается плавно)[Verse]— основная часть (куплет)[Chorus]— припев (кульминация)[Bridge]— переход между частями[Outro]— завершение (музыка затухает)
Теги настроения:
[Mood: Ominous, Tense]— зловещее, напряженное настроение[Energy: Low]— низкая энергия (для медленных, созерцательных сцен)[Energy: High]— высокая энергия (для экшена и кульминации)
Вокальные эффекты:
[Whispers]— шепот (для интимных моментов)[Echoing]— эхо (для воспоминаний)[Dramatic]— драматичное прочтение[Silence]— пауза (для акцента на значимости момента)
Инструменты и жанры:
[Genre: Dark Ambient]— темная атмосфера[Instrument: Deep Bass, Strings]— глубокий бас и струнные[Tempo: 45 BPM]— темп музыки (45 ударов в минуту = медленно)
Пример использования в тексте:
[Intro] [Genre: Dark Ambient] [Mood: Ominous, Isolated] [Instrument: Deep Bass, Distant Strings, Echoing Drips] [Tempo: 45 BPM] [Energy: Low] [Whispers] Темнота здесь не просто отсутствие света. Она живая, вязкая, она вползает в легкие... [Verse] Я сижу на холодном камне уже столько времени, что перестал считать дни. Или годы. Или века. [Dramatic] Я убил бога. И стал им. [Silence]
Видите? Теги указывают Suno, что нужна темная атмосфера (Dark Ambient), медленный темп (45 BPM), шепот в начале и драматичная пауза после ключевой фразы.
Конечно, это не Голливуд. Но для атмосферного видео под аудиокнигу — вполне себе годится. И главное — быстро.
Обложки — отдельная история
Для каждой главы создал кинематографичную обложку:
- Глава 1: Темница, светящиеся кандалы
- Глава 2: Кровавые следы на белом мраморе (восхождение на Олимп)
- Глава 3: Удар кинжалом в сердце бога (момент в slow motion)
- Глава 4: Золотой ихор течет вверх (трансформация)
- Глава 5: Падающий ключ от кандалов (выбор)
Все обложки выдержаны в едином стиле: темные тона, золотые акценты, драматичное освещение.
Мой вопрос к вам, коллеги:
Как вы относитесь к такому формату?
- Озвучка Suno AI — стоит ли использовать для аудиокниг? Качество синхронизации музыки и текста вас устраивает?
- Метатеги — считаете ли удобным размечать текст для робота-чтеца, или это лишняя морока?
- Видеоролики — есть ли смысл делать визуализацию для аудиокниги, или это уже перебор?
- Телеграм vs YouTube — где вам удобнее слушать такой контент? Или лучше на обеих площадках?
Мне правда интересно, что вы думаете. Сам я в восторге от возможностей, но понимаю, что у аудитории могут быть сомнения насчет «искусственности» звучания.
Немного статистики:
- 5 глав с уникальной музыкой
- 55 000 символов текста
- 90 минут общей длительности аудио
- 5 кинематографичных обложек
- 1 видеоролик (пока только для первой главы ((
Все это сделано за 3 дня работы (с учетом экспериментов и отбраковки неудачных вариантов).
Что уже сделано и что дальше?
Уже запущено:
- Телеграм-канал «РАУДИО»
Публикую аудиокниги с кинематографичной музыкой. Первая глава «Пантеона мертвых богов» уже там! - YouTube-канал — параллельно выкладываю видеоверсии с обложками и визуализацией
Планирую:
- Создать видео для всех пяти глав
- Поэкспериментировать с разными жанрами (не только темная фантастика)
- Попробовать интерактивный формат (опросы, голосования за развитие сюжета)
Напишите в комментариях:
- Слушали бы вы аудиокниги с AI-озвучкой и музыкой?
- Что важнее: качество голоса или атмосферная музыка?
- Готовы ли вы сами попробовать такой формат для своих текстов?
Буду рад любой обратной связи — как положительной, так и критической. Для меня это эксперимент, и ваше мнение поможет понять, стоит ли развивать это направление.
P.S. Если кому интересно попробовать самому — пишите в личку, поделюсь инструкциями и ссылками на инструменты. Это реально не так сложно, как кажется.
P.P.S. Первая глава уже доступна для прослушивания (ссылка на видео выше и в телеге). Жду ваших реакций! 

P.P.P.S. Подписывайтесь на эксперимент:
Телеграм: Тыц