Иллюстрации из нейросети: искусство возможного

Автор: Тарнавские

Или по одежке протягивай ножки, да...

Опыт по иллюстрированию книги в жанре “фантастика” (первая книга в цикле “Время жить”) с помощью нейтросети “Шедеврум” оказался двояким. С одной стороны, удалось подготовить 96 иллюстраций для 21 главы и пролога, получить годную визуализацию персонажей (в том числе, инопланетной наружности), добиться их индивидуальности, повторяющихся или очень близких изображений персонажей в различных главах.

С другой... Возможности нейросети достаточно ограничены, поэтому получить с ее помощью нечто большее, нежели изображение персонажа анфас, довольно сложно. Тем не менее, даже так можно создавать приемлемые изображения. Не просто лицо, но и какую-либо сцену, иллюстрирующую конкретный момент.

“Шедеврум” отводит на описание не более 500 знаков. На самом деле, это очень мало. Часть из них сразу уходит на персонажа. Чем большая индивидуальность требуется, тем более подробная нужна характеристика. В некоторых случаях, когда я хотел получить инопланетного персонажа с определенным цветом кожи, но похожего на человека, на эту часть описания у меня уходило почти 300 знаков.

Потом хотя бы одну фразу надо отвести на описание одежды персонажа. В некоторых случаях этот вопрос можно оставить на усмотрение нейросети. Например, когда действие происходило в главной рубке космического корабля, она рисовала что-то более-менее подходящее. Но чаще всего итоговый результат окажется не соответствующим текущему моменту.

Кстати, для меня это был достаточно интересный опыт. Ранее как-то совсем не задумывался о том, во что одеты большинство моих персонажей (конечно, если речь не идет о красивых девушках). А тут пришлось озаботиться этим вопросом.

В результате на описание места действия и самого действия остается не так уж и много места. А если персонажей на иллюстрации двое, и каждого из них надо прописывать, приходится быть очень лаконичным. Из-за этого они, как правило, могут выполнять только довольно простые действия и в антураже, который можно коротко описать.

Скажем, неплохо проходят такие места действия как “богатая комната во дворце”, “небольшой аскетично обставленный офис”, “коридор фантастического космического корабля” или “слабо освещенный трактир девятнадцатого века”.

Но при попытке затребовать что-то, выходящее за привычные шаблоны, нейросеть обычно теряется и сворачивает к известным ей образцам. Например, в одной из иллюстраций мне так и не удалось создать приемлемую альтернативу земному стадиону.

Если снова вернуться к групповой тематике, то лучше всего “Шедевруму” удаются влюбленные парочки. На каких-то вариантах они даже не будут дружно смотреть в “камеру”, а если указать в описании: “Смотрят друг на друга”, то результат будет статистически отличным от одного процента.

А вот усадить кого-то за стол лицом к лицу намного тяжелее. Мне это редко удавалось. В лучшем случае, персонажи сидят боком друг к другу. Впрочем, если учитывать, что они ведут конфиденциальный разговор, это, может, и не так уж плохо.

Мне однажды пришлось усадить за стол троих, и это была сложная задача. Пришлось сделать, наверное, десятка полтора попыток, пока не получилось нечто более-менее соответствующее заданию.

Вообще, отсутствие ограничений на количество попыток при подписке на ПРО весьма помогает. При каждой генерации картинка несколько отличается, поэтому в достаточно большой выборке можно случайным образом получить примерно то, что требуется.

Самое главное здесь - понять, можно ли добиться нужного изображения в принципе. Некоторые (многие) вещи “Шедеврум” не нарисует никогда, и никакое самое детальное описание не поможет.

В одном случае мне был нужен персонаж, перебирающийся (с использованием не совсем обычных способностей) через высокий забор. Но выходила, в самом лучшем варианте, какая-то кладбищенская ограда.

Одна из попыток выдала вариант, в котором персонаж выглядел так, будто собрался перескакивать через забор. Его я и использовал в качестве иллюстрации.

Но это еще далеко не все проблемы. У “Шедеврума” есть длинный список запретов, фобий и табу. Как их обходить, это отдельная история.

+123
246

0 комментариев, по

12K 702 848
Наверх Вниз