А мы положим вето на табу!

Автор: Тарнавские

Создавать иллюстрации с помощью нейросети “Шедеврум” - достаточно захватывающее занятие, вызывающее весьма разнообразные эмоции. Чаще всего - досаду на “электронного художника”, который никак не может или не хочет понять, что от него требуется, или удовлетворение от более-менее правильно выполненного им задания.

В процессе иллюстрирования первой книги цикла “Время жить” и подготовки к выкладке пятой книги “Время жить. Весенний бег”, которая стартовала на АТ 27 сентября, понадобилось подготовить более ста пятидесяти картинок. И ситуации в ходе этого процесса возникали... всякие.

Так, неоднократно приходилось сталкиваться с тем, что нейросеть по каким-то своим внутренним заморочкам напрочь отказывается рисовать по описаниям, в которых содержатся определенные “запрещенные” слова.

В первую очередь, под запретом милитаризм. Слова “солдат”, “военный”, “автомат” и другие означают появление черной плашки и носорожьей морды в любом контексте. У меня однажды зарубили сочетание “военный городок”. Более того, под категорическим запретом оказалась даже “фуражка”! Недавно нейросеть отказалась рисовать “длинную глубокую узкую сухую выемку в бетонном покрытии”. Наверное, посчитала ее слишком похожей на окоп.

Впрочем, некоторые из этих препятствий можно обойти. Например, нейросеть ничего не имеет против “спецназовцев”, “офицеров” и “генералов”, носящих “униформу”, “китель”, “мундир” или “камуфляжную куртку”. Она может не принять слово “пистолет”, но если ей сказать, что некто целится из “оружия”, которое держит в руке, то, как правило, рисует именно то, что надо.

Вообще, слово “оружие” очень многогранно. Оно может быть ручным, большим, огнестрельным или холодным. В контексте задания при упоминании этих выражений может генерироваться нужное изображение. Не всегда сразу, но после нескольких попыток вполне можно получить нечто, близкое к желаемому.

Проблема возникает, когда требуется конкретика. Однажды мне понадобился персонаж, носящий на голове фуражку с эмблемой в форме скрещенных сабель. Он него, увы, пришлось отказаться. А вот дать другому персонажу в руки нечто, отдаленно напоминающее пулемет (допустим, что инопланетный), после десятка проб получилось.

Второй большой блок запретов относится к определенным взаимоотношениям между полами. Причем некоторые из них весьма тяжело понять. Например, персонажи могут целоваться, обниматься и даже вместе лежать на постели. Но почему-то в любом контексте под запретом находится слово “колени”. Например, заставить какого-то персонажа опуститься на колени - это табу.

Этот запрет удалось обойти, заменив фразу “Упал на колени” на “Опустился на пол”. Нейросеть практически сразу поняла, что имеется в виду, и дала требуемое изображение. Ну почти.

Некоторые вещи вообще находятся вне нормального понимания. Например, при наличии в задании слова “космонавт” в любом контексте, пусть даже это Памятник погибшим космонавтам, как у меня в одной из глав первой книги из цикла “Время жить”, на экране появляется примерно такая картинка.

Обойти этот “бзик” не так сложно. Достаточно просто не упоминать это слово. Персонаж может, например, сидеть в рубке космического корабля. Тут даже одежду упоминать не нужно. Нейросеть сделает все сама.

Правда, поначалу дико раздражало стремление нейросети рисовать на всех космолетчиках непременно американские флажки. Избавиться от них было крайне сложно, так как “Шедеврум” не воспринимает слова “без” или “нет”. Если он что-то втемяшил в свои виртуальные мозги, наподобие окон в каюте на космическом корабле или фикуса в кабинете в подземном бункере, переубедить его невозможно. Можно только изменить текст задания (в данном случае изображение персонажа требуется на фоне стены).

Однако в последнее время нейросеть, кажется, немного обучилась, так что американские флажки стали появляться гораздо реже. Даже на форме космонавтов.

Причем слово “флаг”, равно как и упоминание национальности персонажа, - это тоже табу. Правда, “флаг” можно заменить “полотнищем” нужного цвета, но пока что получается довольно грубый эрзац.

Персонажей можно описывать как “восточного типа” или “европейское лицо”. Иногда нейросеть проявляет в этом плане понятливость. Например, мне понадобилась девушка, похожая на грузинскую принцессу. Это не прокатило, но описание: “Молодая девушка, красивая, черноволосая, одета в длинное черное платье с обильной золотой вышивкой...” дало вполне неплохой результат.

Кстати, когда я весной этого года только начинал подбирать иллюстрации с помощью “Шедеврума”, дети тоже были табу, но сейчас с ними стало намного проще. Перестала нейросеть шарахаться и от слов “больница” и ей подобных. Так что, она тоже учится и, похоже, способна на обучение, хотя процесс это очень не быстрый.

В общем, работать с “Шедеврумом” можно, а порой из этого появляется нечто вполне симпатичное. Но об этом - как-нибудь в следующий раз.

+124
328

0 комментариев, по

12K 702 848
Наверх Вниз