Поэтам и не только, "Укуси меня" или снова тема: "озвучка текстов с использованием музыкального ИИ"
Автор: Erik BauerВидя то как простые сервисы озвучки озвучивают роботом текст, литераторы, особенно поэты утверждают "я читаю лучше" (
)
ну.. и часто это так, в целом наверное да, а вообще то как правило читают они очень часто и хреново. Но тоже верят в то, что нет..
однако действительно, эта робото-озвучка тоже далеко не айс. Тогда уже лучше пусть и хреновое, но от автора.
Чтец - часто недешево. (Хоть это пока и лучший вариант, без сомнений. Тут не поспоришь,
)
...
как быть?
ну я не раз многим тут рассказывал, что в принципе можно попробовать использовать ИИ для создания песен. Там, собственно, оно неплохо делает голоса.
Однако тут есть подводные камни - вообще то ИИ для песен создавали именно чтоб петь. А не говорить. И он сопротивление оказывает.
Долго уговаривая ИИ сделать мне нужный промт я набрёл таки на нужные комбинации. И вот вы знаете, а получается неплохо, многим зайдет. Музыка полностью не исчезла, оказывается а авторы наоборот хотят там какую то на заднем плане или шумы. Так я в этот раз стиль её немножко даже добавил.
***
ну вот набросал для нашего эксперимента пример, это ногой так рыба для пробы:
это ставим в основной текст:
(обязательно и все ударения)
команды обязательно в квадратные скобки, а то он их будет петь/говорить
[spoken word], [spoken Lyric], [no music], [no melody], [no beat], [no rhythm], [no singing] [female vocals]
потом через некоторые промежутки так:
[spoken word, no Musik, female vocals]
укуси́ меня в но́гу оха́льник
я цвету́ у предго́рий Эльбру́са...
у тебя́ голова́ как репе́йник
я страстна́, вожделе́ю уку́са
[spoken word, no Musik, female vocals]
укуси́ меня в но́гу (укуси́ меня́)
я страстна́, вожделе́ю уку́са (вожделе́ю уку́са)
[spoken word, no Musik, female vocals]
где то там завыва́ют блудни́цы
в переу́лках влача́сь под дождя́ми
укуси́ меня́, плю́нув на при́нцип
восхища́ясь мои́ми перся́ми
[spoken word, no Musik, female vocals]
укуси́ меня в но́гу (укуси́ меня)
я страстна́, вожделе́ю уку́са (вожделе́ю уку́са)
[spoken word, no Musik, female vocals]
вот она́, воспалённая го́рдость
почему́ ты не хо́чешь куса́ться?
ведь так гру́стно зако́нчится по́весть
не уку́сишь - не ста́ну е...ся!
[spoken word, no Musik, female vocals]
не уку́сишь - не стану е...ся! (это тут, а в Suno полностью)
не ста́ну е...ся
[spoken word, no Musik, female vocals]
укуси! и-ии-иии..
[spoken word, no Musik, female vocals]
укуси́ меня в но́гу
(укуси́ меня)
я страстна́, укуси́ меня́...
[spoken word, no Musik, female vocals]
укуси! и-ии-иии.. и-ии-иии - йййееехуу... у
куси́ меня... укусииииии́.... и-иии-и....
В "Styles" пишем как то так
Atmospheric spoken word, Avantgarde Underground Delivery, no singing, say words Like Poet variable tempo, minimalist r soundscape with noir elements, emotive
[spoken word], [spoken Lyric], [no music], [no melody], [no beat], [no rhythm], [no singing] [Low underground female vocals]
spoken word, no Musik, Low underground female vocals
"spoken word, narration, clear voice, no music, no instruments , announcer style" "no beat, no melody, no rap, no singing"
произнести текст как аудиокнигу, без посторонних звуков и без музыки,
голос окрашенный эмоциями , Low underground female voice
dark electro-clash, gritty spoken word vocals, dramatic avant-garde atmosphere, focus on corrected phonetic accents in lyrics
(тут много и длинно, но хорошо работает)
вы можете ещё раз у какого то ИИ уточнить, тем более если вам стиль чтения по своему.
можно так:
Atmospheric spoken word, soft theatrical delivery, no singing, say words Like Poet slow tempo, minimalist rainy soundscape with subtle noir elements, emotive and intimate.
[spoken word], [spoken Lyric], [no music], [no melody], [no beat], [no rhythm], [no singing] [female vocals]
spoken word, no Musik, female vocals
"spoken word, narration, clear voice, no music, no instruments , announcer style" "no beat, no melody, no rap, no singing"
произнести текст как аудиокнигу, без посторонних звуков и без музыки,
голос спокойный не истеричный а повествовательный, но окрашенный эмоциями , female vocals (или Male vocals)
или просто
spoken word, narration, clear voice, no music, no instruments , announcer style" "no beat, no melody, no rap, no singing" произнести текст как аудиокнигу, без посторонних звуков и без музыки, голос спокойный не истеричный а повествовательный, окрашенный эмоциями но спокойными эмоциями , female vocals
уточняйте или переписывайте, пробуйте
***
получается вот так, первый вариант стиля:
https://suno.com/s/tjxCVjghhUjcH6it
https://suno.com/s/qU7gIkn1zvr3YmKB
***
для сравнения, если делать просто песню, то будет так
https://suno.com/s/L4akOhXIq1D31N2H
dark electro-clash with heavy distorted synths, industrial rhythm, gritty vocals, dramatic avant-garde atmosphere, Low female underground voice
***
получается и проза. Меняем Lyrik на Proze, даже удобнее, стихи он чаще порывается петь. Желательно недлинные отрывки, потом соедините. 5000 знаков, его лимит, он стал мне на середине "птичьим языком" говорить. Я поделил и стало нормально.
А вот новый эксперимент, рассказ для Vovka Vo, аналогичными командами.
https://suno.com/s/M5l7AouQaTqVuuny
или тут варианты, плюс для сравнения один просто генератором речи, клоном моего голоса
https://disk.yandex.com/d/1PU3r3RVIyOZdA
лайфхак: чтоб расставить ударения в длинном тексте, без вручную, идите в ИИ Gemini (может и другие, но тут сработало) и попросите ударения. Он очень хорошо в контексте делает. в смысле "тени уставшего гОрода" а не "городА"
один раз ошибся написал "демОнами" а не "дЕмонами" но думаю тут можно простить. наверное думал так правильно. То есть - проверяем конечно.
***
итак, главным было то, что я у ИИ выцарапал нужные команды. Так и имейте это ввиду, промты что вы видите, вы сможете заполировать с ИИ ещё раз.
Ну, как вам такое ноу-хау?
Думаю, очень многие порадуется этой интересной возможности!
Салют, ваш Эрик
***
P.S. а картинки это producer.ai, Grok, прям по тексту пробника как промт сделали. Я попросил ЧБ, графику, лайны, только черный без полутонов, ну и потом вдогонку "поавантгарднее" - хорошо в печать.







***
Профи советуют:
Проблема озвучивания автором в оборудовании и помещении.
Я, на профессиональном оборудовании, смогу нормально озвучить. Не идиально, но нормально. Так-то я не профессиональный диктор и не актёр и даже не любитель, но знаю основы.
Это не похвальба, а констатация факта. Был у меня опыт озвучки закадрового текста. Так потом подходили к организаторам проекта с вопросом: "где вы взяли профессионального диктора".
Однако я тогда озвучивал в сносной студии, с нормальными микрофонами и магнитофонами.
Дома добиться даже такого малореально:
1. Нужна пустая комната обитая войлоком, это как минимум. Хотя, некоторые, забираются в шкаф или под одеяло.
2. Нужна минимизация шума, а то на кухне звенит посуда, за окном едет автомобиль, у соседей гафкает барбос и бренчит пианино, если не перфаратор долбящий стену.
3. Я сказал тишина в комнате, сюда же включая шум от электроники. А то компьютер тоже гудит.
4. Нужен нормальный микрофон. По моему сейчас на топовых смартфонах неплохие ставят. Это сносно, но лучше всё же что-то поприличнее, чтобы не резал частоты.
5. Нужна нормальная аудиокарта и кабель к микрофону. А то будет шипение, гудение, всякие наводки и прочие пакости. Не говоря уже о звуковых артефактах в самом аудио потоке.
6. Нужно нормально держать этот микрофон. Чуть сбоку, не далеко и не перед самым ртом. А то одни бубнят прямо в микрофон с перегрузками, с плевками, с вздохами. Другие же отнесут подальше и что-то бубнят мимо микрофона.
Музыка на фоне.. Это такая фигня, чтобы замаскировать дефекты записи. Она редко бывает в тему, а зачастую раздражает или отвлекает.
Другая проблема музыки в том, что прослушивание на ускорении портит эту музыку. Она сама по себе портится при сильном сжатии.
Эмоции диктора нужны, но вмеру, чтобы обозначить вопрос, восклицание и так далее. Однако когда диктор переигрывает, добавляя больше эмоций, это тоже отвлекает и раздражает. Тем, кстати, плохи профессиональные актёры озвучки.
В общем, лично меня, вполне устраивает озвучка обычным синтезатором, без всяких ухищрений