Эксперимент: Создание аудиокниги с AI — от текста до готового видео за 50 рублей!

Автор: Носоленко Вадим

Привет, друзья! ✌ Давно не черкал в блоге строки — работа, проекты, вы знаете, как оно бывает. Но тут решил найти минуту и поделиться опытом, который меня самого немного ошарашил. Речь о создании полноценной аудиокниги с помощью нейросетей. Причем не просто озвучки текста роботом, а настоящего аудиопроизведения с кинематографичной музыкой, обложками и даже видеороликом.

Что я использовал:

1. Suno AI v5 — для создания музыкального сопровождения
2. Kling AI — для генерации видеороликов
3. Нейросети для изображений (Нана Банана от Google) — для обложек глав
4. TTS-движок — для озвучки текста

Что получилось:

Взял свой текст «Откровения богоубийцы» (темная фантастика про парня, который убил бога и унаследовал его силу) и решил превратить его в мультимедийный проект. Разбил все это дело значит я на 5 глав, каждой задал свою музыкальную тему, создал обложки и смонтировал видео для первой главы.

Первая глава: «Слои забвения» — главный герой сидит в темнице, закованный в магические кандалы, и вспоминает, как все произошло.

Как это работает:

Suno AI использует метатеги — специальные маркеры, которые указывают, какую музыку генерировать. Вы просто вставляете их в текст, и нейросеть понимает, где нужна тишина, где драма, где кульминация.

Примеры метатегов:

Структурные теги:

  • [Intro] — вступление (музыка начинается плавно)
  • [Verse] — основная часть (куплет)
  • [Chorus] — припев (кульминация)
  • [Bridge] — переход между частями
  • [Outro] — завершение (музыка затухает)

Теги настроения:

  • [Mood: Ominous, Tense] — зловещее, напряженное настроение
  • [Energy: Low] — низкая энергия (для медленных, созерцательных сцен)
  • [Energy: High] — высокая энергия (для экшена и кульминации)

Вокальные эффекты:

  • [Whispers] — шепот (для интимных моментов)
  • [Echoing] — эхо (для воспоминаний)
  • [Dramatic] — драматичное прочтение
  • [Silence] — пауза (для акцента на значимости момента)

Инструменты и жанры:

  • [Genre: Dark Ambient] — темная атмосфера
  • [Instrument: Deep Bass, Strings] — глубокий бас и струнные
  • [Tempo: 45 BPM] — темп музыки (45 ударов в минуту = медленно)

Пример использования в тексте:

[Intro] [Genre: Dark Ambient] [Mood: Ominous, Isolated] [Instrument: Deep Bass, Distant Strings, Echoing Drips] [Tempo: 45 BPM] [Energy: Low] [Whispers] Темнота здесь не просто отсутствие света. Она живая, вязкая, она вползает в легкие... [Verse] Я сижу на холодном камне уже столько времени, что перестал считать дни. Или годы. Или века. [Dramatic] Я убил бога. И стал им. [Silence]

Видите? Теги указывают Suno, что нужна темная атмосфера (Dark Ambient), медленный темп (45 BPM), шепот в начале и драматичная пауза после ключевой фразы.

Конечно, это не Голливуд. Но для атмосферного видео под аудиокнигу — вполне себе годится. И главное — быстро.

Обложки — отдельная история

Для каждой главы создал кинематографичную обложку:

  • Глава 1: Темница, светящиеся кандалы
  • Глава 2: Кровавые следы на белом мраморе (восхождение на Олимп)
  • Глава 3: Удар кинжалом в сердце бога (момент в slow motion)
  • Глава 4: Золотой ихор течет вверх (трансформация)
  • Глава 5: Падающий ключ от кандалов (выбор)

Все обложки выдержаны в едином стиле: темные тона, золотые акценты, драматичное освещение.

 Мой вопрос к вам, коллеги:

Как вы относитесь к такому формату?

  1. Озвучка Suno AI — стоит ли использовать для аудиокниг? Качество синхронизации музыки и текста вас устраивает?
  2. Метатеги — считаете ли удобным размечать текст для робота-чтеца, или это лишняя морока?
  3. Видеоролики — есть ли смысл делать визуализацию для аудиокниги, или это уже перебор?
  4. Телеграм vs YouTube — где вам удобнее слушать такой контент? Или лучше на обеих площадках?

Мне правда интересно, что вы думаете. Сам я в восторге от возможностей, но понимаю, что у аудитории могут быть сомнения насчет «искусственности» звучания.

 Немного статистики:

  • 5 глав с уникальной музыкой
  • 55 000 символов текста
  • 90 минут общей длительности аудио
  • 5 кинематографичных обложек
  • 1 видеоролик (пока только для первой главы ((

Все это сделано за 3 дня работы (с учетом экспериментов и отбраковки неудачных вариантов).

Что уже сделано и что дальше?

Уже запущено:

  1. Телеграм-канал «РАУДИО»
    Публикую аудиокниги с кинематографичной музыкой. Первая глава «Пантеона мертвых богов» уже там!
  2. YouTube-канал — параллельно выкладываю видеоверсии с обложками и визуализацией

Планирую:

  1. Создать видео для всех пяти глав
  2. Поэкспериментировать с разными жанрами (не только темная фантастика)
  3. Попробовать интерактивный формат (опросы, голосования за развитие сюжета)

💬 Напишите в комментариях:

  • Слушали бы вы аудиокниги с AI-озвучкой и музыкой?
  • Что важнее: качество голоса или атмосферная музыка?
  • Готовы ли вы сами попробовать такой формат для своих текстов?

Буду рад любой обратной связи — как положительной, так и критической. Для меня это эксперимент, и ваше мнение поможет понять, стоит ли развивать это направление.

P.S. Если кому интересно попробовать самому — пишите в личку, поделюсь инструкциями и ссылками на инструменты. Это реально не так сложно, как кажется.

P.P.S. Первая глава уже доступна для прослушивания (ссылка на видео выше и в телеге). Жду ваших реакций! 🎧🔥

P.P.P.S. Подписывайтесь на эксперимент:
📱Телеграм: Тыц

+122
276

0 комментариев, по

4 496 564 2 428
Мероприятия

Список действующих конкурсов, марафонов и игр, организованных пользователями Author.Today.

Хотите добавить сюда ещё одну ссылку? Напишите об этом администрации.

Наверх Вниз