Нейрохудожества. Личный опыт.

Автор: Росс Олбак

Повальное увлечение нейросетевыми иллюстрациями не обошло меня стороной. Впервые я попробовал заставить ИИ "рисовать" интересные мне картинки года два назад или около того. Результат оказался плачевным: как ни старался, но нужного результата добиться не смог, нейросети (Кандинский и Шедеврум) легко схватывали идею, но косячили в деталях, причём настолько упорно, что не реагировали даже на тщательно прописанные промпты. Короче, поигрался и плюнул, надолго об этом деле забыв. 

Однако месяц назад с удивлением обнаружил, что за прошедшее время нейросети сделали гигантский скачок. Поводом для такого открытия стал случай: в одном из блогов человек, который хотел сделать открытку к 9 мая, пожаловался, что нейросеть от Яндекса напрочь отказывается генерировать картинки с советскими и современными российскими воинами. И даже русских богатырей (идеей было "нарисовать" воинов трёх эпох бок о бок) изображает так, что лучше бы вообще ничего не делала. Захотелось проверить, как обстоит дело с подобными задачами у иностранцев. К моему изумлению, американский Чат ГПТ выполнил требуемое, что называется, с полпинка, о чём я с радостью сообщил обескураженному пользователю яндексовской программы. Вот та самая картинка, с которой началось второе пришествие нейроиллюстраций в мою жизнь:

Здесь есть несколько ошибок, на мой взгляд, некритичных: самая заметная — петлицы на форме советского солдата при наличии погон, но всё это легко редактируется, да и сама нейросеть скорее всего устранила бы огрехи, обрати я на них её внимание. Важен, однако, был сам принцип возможности правильной генерации ИИ советской, российской и православной символики, особенно в рамках поставленной задачи.

Следующим шагом стала попытка создать иллюстрацию к собственному роману, ибо в прошлый раз я столкнулся с тем, что понятия о японцах и японских средневековых реалиях у нейросетей весьма специфическое. Новые результаты оказались куда пристойнее. Не определившись со стилем, я попробовал сгенерировать картинки в разных стилях — от анимации а-ля Миядзаки до традиционного рисунка. Вот этот разномастный набор. 

К Кандинскому с Шедеврумом обращаться, памятуя прошлый опыт, не стал. Всё это сделано в Whisk. Эту нейросеть посоветовали знакомые, решил попробовать. Результаты, однако, меня не удовлетворили: много огрехов, а времени уходит изрядно. Хотя по сравнению с тем же Кандинским — в том, что касается японской тематики — Whisk однозначно лучше. Самой же большой проблемой оказалось дублирование персонажей в разных сценах. Несмотря на наличие референсной картинки, один и тот же герой всё время получался хоть немного, но другим, ещё более изменяясь в процессе новых генераций, и это реально бесило. Поразмыслив, я решил вернуться к Чату ГПТ...

(Продолжение следует)

+30
135

0 комментариев, по

749 95 212
Мероприятия

Список действующих конкурсов, марафонов и игр, организованных пользователями Author.Today.

Хотите добавить сюда ещё одну ссылку? Напишите об этом администрации.

Наверх Вниз