Дал трём ИИ одно и то же задание. Вот что получилось )
Автор: Георгий ФедоровЕсть у меня задумка, делать небольшие ролики с участием персонажей книг.
1. Нейросеть генерирует изображение героя
2. Озвучиваю его реплику (из произведения)
3. Совмещаю картинку и звук, анимирую артикуляцию персонажа.
Ради эксперимента решил создать «классического гнома». Китайская нейронка DeepSeek помогла сформулировать на английском техническое задание для ИИшек-художников. В роли «подрядчиков» выступили отечественный Kandinsky и двое американцев - Dall-E и GPT-4o.
Текст промта (на русском):
« Воин-гном в стиле Толкиена, густая рыжая борода, заплетенная в металлические кольца, мускулистое телосложение, круглый нос, свирепые карие глаза, в стальном шлеме с рогами, кольчужных доспехах, с боевым топором за спиной, на фоне подземной каменной таверны, теплый свет костра, иллюстрации для фэнтезийных RPG, сверхдетализированный».
Итог: Все справились, молодцы! Но каждый по своему.)
– Гном от Кандинского так и просится на обложку книги (ребёнку он больше всех понравился )
– Dalle прекрасно и объемно прорисовал детали (доспехи и украшения)
– У GPT персонаж получился самым реалистичным
Бонусом ещё решил попробовать британскую Midjourney. (Нашёл наконец бесплатного бота). Очень харизматичный вышел гном. Такой, вероятно, лучше всего подойдёт для озвучки.