Как получить на иллюстрации индивидуальность
Автор: ТарнавскиеОдинаковость - действительно, большой недостаток нейросетей. Особенно, если важно не только качество, но и количество. Напомню, что для иллюстрирования первой книги цикла “Время жить” мне понадобилось 96 картинок. А в книге “Время жить-5. Весенний бег”, выкладка которой начнется в конце сентября, я стараюсь иллюстрировать если не каждую первую, то, как минимум, каждую вторую проду.
Поэтому заботливо отлаживать каждую иллюстрацию, прогонять ее через фильтры, создавать единый стиль с помощью Канвы, как делает (и описала в предыдущем блоге Мила) у меня нет времени. Впрочем, и с Шедеврумом можно получить если не шедевральные, но приемлемые результаты.
Нейросеть, в принципе, тоже учится, и это заметно. У меня возникали специфические трудности, так как значительная часть моих персонажей - инопланетяне. Одни похожи на людей, надо только не забывать о том, что они не могут быть небритыми, поскольку волосы у них на лице не растут. Но у других цвет кожи - голубовато-сиреневый, а третьи - вообще зеленые, лысые и с большими длинными ушами.
Вот с этими зелеными у меня вначале и было больше всего проблем. Нейросеть рисовала то каких-то чебурашек, то мимишек с глазами на пол-лица - то есть, совершенных инопланетян, что меня совершенно не устраивало. Я добавлял в описания “с человеческими глазами, человеческие пропорции тела”, но это не слишком помогало.
Но со временем “Шедеврум” начал меня лучше понимать и стал выдавал изображения, более-менее похожие на человеческие, только с иным цветом кожи и большими длинными ушами, как и заказывалось. Кстати, внизу персонаж тот же самый, что и на иллюстрации выше, и его (точнее, ее) описание практически не изменилось.
Кстати, с голубокожими инопланетянами проблемы еще остаются. То нейросеть нарисует их с длинными эльфийскими ушками, то в виде персонажей из “Аватара”, то вообще показывает мне обычных землян со светлой кожей. Приходится многократно крутить изображение, переставлять или как-то менять слова в описании - в общем, шаманить. Чаще всего помогает.
Вообще, “Шедеврум” не отличается большой фантазией. Лица, которые он генерирует, достаточно однотипны. Причем, подробный словесный портрет зачастую не дает нужного эффекта.
Так, у одного из моих персонажей один глаз был на вид немного больше другого, из-за чего его прозвали “Недреманным Оком”. Вот эту особенность мне отразить в иллюстрации не удалось, как я не изгалялся. Так что, надо учитывать, что у нейросети есть определенные шаблоны, за пределы которых она не заходит и нешаблонные описания не воспринимает.
Тем не менее, даже в таких условиях можно добиваться достаточной индивидуальности и узнаваемости персонажей. Вот Мила, например, спрашивала о том, как создавать иллюстрации со злодеями? В одном случае я просто включил в описание такую фразу “Агрессивный, опасный. Грубое жесткое лицо”. И получился вполне таки колоритный злодей.
Для придания персонажем большей узнаваемости я порой использовал сравнения с известными личностями или героями. Иногда это помогало. Так, одним из первых моих удачных опытов в этом направлении стала “симпатичная девушка 25 лет, похожа на Гермиону Грейнджер”. Среди моих персонажей это, пожалуй, самое краткое описание. Тем не менее, нейросеть сгенерировала практически тот же самый образ даже после трехмесячного перерыва.
Однако это далеко не всегда получается. Некоторые сравнения нейросеть просто игнорирует. Например, мне не удалось получить в “Шедевруме” персонажа, похожего на молодого Александра Абдулова, хотя ранее, при генерации в Playground, такой проблемы не возникло. А вот, например, тип, напоминающий знаменитого в прошлом вратаря Рината Дасаева, вполне получился.
Хотя вообще-то “Шедеврум” обычно категорически отказывается использовать в качестве “моделей” реальных личностей, кроме актеров. Особенно, наверное, политиков. Так, на попытки получить образы, похожие на теннисиста Марата Сафина или американского экс-президента Билла Клинтона в молодости, меня неизменно ждали черная планка и носорожья морда.
Еще одна большая засада заключается в том, что для актеров используются их современные фото. Например, одну из своих героинь я описал как похожую на молодую Софи Марсо. Однако нейросеть, увы, раз за разом выдавала мне образы, показывающие, как эта замечательная женщина выглядит сегодня, в 2025 году. Попытки поставить в описании “похожа на молодую Софи Марсо”, “18 лет” и даже ссылки на конкретный фильм (”За облаками”) дали строго нулевой результат. Потом точно такая же нерешаемая проблема возникла у меня с Биллом Мюрреем.
Кстати, при замене Софи Марсо на молодую Изабель Аджани получился более приемлемый вариант. А окончательно решить проблему удалось посредством правильного текстового описания. Нашел в интернете характеристику внешности молодой Марсо, составил на ее основании задание для нейтросети, немного добавил черт характера и получил в итоге то, что меня в целом удовлетворило.
Впрочем, персонаж - это только часть иллюстрации, хотя и пожалуй, самая главная. Но обо всем остальном речь пойдет уже в следующие разы.