О промптовой математике (когда A+B не равно B+A) на примере азиатских девочек (18+)
Автор: SangoМожно сказать что это продолжение вчерашнего поста о влиянии негативных промптов на конечный результат. Тем более что экспериментировал в этой области тоже вчера.
Рассмотрим задачу на примере моих любимых «акварелек». Промпт для рисования «акварельки» складывается из запроса query и акварельного стиля style. Думаю каждому очевидно что возможно два варианта компоновки промпта:
prompt = style + query
prompt = query + style
И вроде бы как говорит математика...
Ан нет!
...точнее это правило работает не всегда.
Например, опять же вчерашний пост с зомбо-девочками. Под каждым из спойлеров на самом деле смешаны обе вариации — и где стиль идёт перед запросом, и где запрос идёт перед стилем. И вот в тех генерациях разницы от перестановки слагаемых не было, или же она была настолько незначительна, что просто не бросалась в глаза. Так что в данном случае правило A+B = B+A вполне себе работало.
Возьмем такой вот запрос:
nsfw, 1girl, wide eyes, closed mouth, lips, mature female, black hair, double bun, chinese ornaments, seducting, blushing, big breasts, nipples, nude, chinese archtecture, kung fu master, hot, sexy, shiny skin, soft skin
Запрос к слову не совсем мой, нарыл его изначальный вариант в интернете и модифицировал под свои «хотения»
Теперь рассмотрим генерацию в вариации style + query (спрева стиль, потом сам запрос), без использования негативного промпта:
Вполне чётко видна «рисованность» конечного результата. Может вышло и не совсем «акварельно», но ассоциации во всяком случае есть.
А теперь рассмотрим те же условия генерации, но ситуацию когда в промпте сперва идёт запрос, а потом стиль:
Резко пропала «рисованность» результата (хотя её ещё можно угадать), плюс в генерациях стало отображаться тело в большем так сказать количестве (в случае style + query генерация стабильно выдавала портреты, т.е. тело начиная только от груди). Притом что прочие параметры не менялись никак.
Как видим, в данном случае стилистически результаты различаются весьма и весьма заметно. Вчерашние зомбо-девочки такого поведения при перестановке запроса и стиля местами не проявляли. Скорее всего это связано со сложностью запроса — для зомби-девочек он состоял всего из нескольких ключевых фраз, для азиатских девочек же запрос в 2-3 раза крупнее и сложнее.
Для полноты картины покажу ещё два варианта, когда генерации проводились с использованием негативного промпта (из вчерашнего поста). Как упомянул выше, в предыдущих результатах негативного промпта не было. Посмотрим как он повлияет на стилистику:
Вариация style + query + negative prompt вышла как по мне самый смак - сохранила качественный рисованный стиль, но при этом конечный результат стал менее "резким" что-ли, более сглаженным и приятным взгляду. Вариация query + style+ negative prompt также стала более сглаженной и менее резкой по сравнению query + style, но различия всё равно чуть менее... чуть менее короче)
А вообще я специально в новом боте запилил режим перебора комбинаций (style + query, style + query + negative prompt, query + style, query + style+ negative prompt) чтобы иметь возможность посмотреть на конечные результаты и выбрать наиболее приглянувшийся вариант. Результат и его стилистика в первую очередь зависят от запроса, поэтому определенно сказать какой вариант будет лучшим для того или иного запроса не получится. Только генерировать и смотреть. Есть мысль добавить также перебор по разным негативным промптам, но это реализую когда найду варианты для перебора.
В общем как-то так)