Дал трём ИИ одно и то же задание. Вот что получилось )

Автор: Георгий Федоров


Есть у меня задумка, делать небольшие ролики с участием персонажей книг. 

1. Нейросеть генерирует изображение героя

 2. Озвучиваю его реплику (из произведения)

3. Совмещаю картинку и звук, анимирую артикуляцию персонажа. 

Ради эксперимента решил создать «классического гнома». Китайская нейронка DeepSeek помогла сформулировать на английском техническое задание для ИИшек-художников. В роли «подрядчиков» выступили отечественный Kandinsky и двое американцев - Dall-E и GPT-4o. 

Текст промта (на русском):

« Воин-гном в стиле Толкиена, густая рыжая борода, заплетенная в металлические кольца, мускулистое телосложение, круглый нос, свирепые карие глаза, в стальном шлеме с рогами, кольчужных доспехах, с боевым топором за спиной, на фоне подземной каменной таверны, теплый свет костра, иллюстрации для фэнтезийных RPG, сверхдетализированный».

Итог: Все справились, молодцы! Но каждый по своему.) 

– Гном от Кандинского так и просится на обложку книги (ребёнку он больше всех понравился 😊)  

– Dalle прекрасно и объемно прорисовал детали (доспехи и украшения)

– У GPT персонаж получился самым реалистичным  

Бонусом ещё решил попробовать британскую Midjourney. (Нашёл наконец бесплатного бота). Очень харизматичный вышел гном. Такой, вероятно, лучше всего подойдёт для озвучки.  

+12
75

0 комментариев, по

350 5 16
Наверх Вниз