Нейробояра и нейроиллюстрации
Автор: Александр СтаматинНикто особенно не спрашивал, но в свежевышедшей нейронной бояре моего авторства в каждой главе есть иллюстрации. Не сказать, что это прям хороший тон, но всегда хотелось чего-то более погружающего в мир, чем голый текст. Оттого взгляд и упал на нейронки. Правда, по собственному опыту читателя знаю, что, как правило, иллюстрации выглядят весьма искусственно и совонатягиваемо. Например, как-то так:
Это не плохо и не хорошо. Достаточно зайти на ЦивитАИ (один из ключевых сайтов по тематике), чтоб увидеть распространённые ошибки тех, кто стал немного «нейронно одержим». Рассмотрим их на примере работ топик-стартера и рассмотрим обычные способы их исправления. Да, этот гайд будет упрощённым, как GRisk GUI, неполным, как бот-нейрогенератор и косноязычным, как мои литературные труды. Но возможно, кого-то это натолкнёт на нужные мысли.
1) Игнорирование брака.
Двойные изображения, лишние пальцы, смазанные и отсутствующие конечности. Даже с такими недостатками изображения могут выглядеть весьма впечатляюще — но стоит приглядеться и вся магия рушится. Это можно поправить надстройками для нейронки, внесением негативных промптов с усилением (например: bad anatomy:1.3), (big forehead:1.2), (blurry:1.2), (cloned arms:1.2), (cloned hands:1.2), (cross eyed:1.2)
2) Отсутствие стилизации или же — банальная стилизация.
Мужчины-«гигачады» и женщины со стереотипными лицами достаточно быстро забили все посты класса «Х как его/её видит Нейросеть». Но так как речь об иллюстрациях, то однообразие приедается, как любимое блюдо на завтрак, обед и ужин. Первый выход из проблемы простой и очевидный: использование кастомных моделей, LoRA, LyCORIS и прочего. Ниже — результаты одной и той же генерации (один сид, один промпт, но несколько разных Лор и результатов). Одна из генераций и пошла в текст в качестве иллюстрации... а заодно можете посмотреть на один из самых браков, описанных в п.1:
Впрочем, некоторые варианты генерации такие возможности не дают. И тут нам на помощь приходят художники, которых мы добавляем в промпт напрямую, будь то Грег Рутковски (конкретно его не стоит), Ганс Гигер или Гарри Кларк. Выбирайте тех, что более соответствуют вашему тексту, и не забывайте указывать их в промптах.
3) Несоответствие тексту.
Тут всё очень тонко. Нейросеть может сгенерировать очень красивое, захватывающее дух изображение... которое будет абсолютно не соответствовать ситуации или соответствовать слабо. К «Одержимости» я нагенерировал штук пятьдесят мостов — гротескных, изящных или бруталистских, но из них лишь не все из них подходили к описанию местности:
Выход простой — уточнять промпт, не забывать сверяться с текстом, вносить правки и генерировать снова. В крайнем случае всегда можно поправить текст (но не стоит).
4) Слишком явные отсылки.
Сеть позволяет сгенерировать вам Гомера, Питера Гриффина или Джонни Сильверхэнда в любом антураже. Но это не значит, что им действительно стоит там появляться. Кроме того, что они будут выглядеть чужеродно — они ещё и нарушат восприятие текста читателем. Так что лучше избегать и ненамеренных проявлений «чужаков» (вроде ковбоев, вызываемых иногда промптом cowboy shot) и осознанных.Как-то вот так вышло, весьма сумбурно. Если у вас есть дополнения — всегда можете их дописать в комментарии. Если хотите оценить, насколько автор сам придерживался собственных критериев качества — загляните в текст нейробояры.
Надеюсь, было полезно.