Мелкие радости нейросети... Опыты. День первый
Автор: Zuki Zu.
Пост создан при активном участии
нейросети kandinsky 2.2 (телеграм-бот)
Всё опять началось совершенно неожданно: старое желание победить хаос в мелких зарисовках и «строчках по случаю», которые прячутся везде, где найдется кусочек чистой памяти, вылилось в новый будущий сборник... Сборник пожелал нарядной обложки, совесть — не грузить карму картинками из интернета... решила создать нужное в нейросети...
...и всё — залипла!
Сначала-то хотелось обложку соорудить самую примитивную: чтобы простой квадратик с россыпью гладких камешков, и всё вместе обязательно мило-уютно. Само название «Безделушки и безделицы» особых наворотов в оформлении не предполагало, виделось что-то такое неяркое, светлое и спокойное...
— Ага, — радостно фыркнула я, — это мы быстренько! — и уверенно потёрла лапки.
Так скромная обложка «без претензий» странным образом превратилась в бесконечное «да-да-да, я уже сейчас... я почти совсем встала» — и честно заняла всё доступное свободное время. Сначала получалось явно не то и не так, потом из воздуха стали проявляться удивительные вещи... Я попалась.
И как-то показалось любопытным проанализировать некоторые факторы влияния «на процесс» — и потому итоги длительной осады нейросети даны в табличной форме... Мне показалось, что это нагляднее — и легче будет проследить взаимные влияния и ограничения, задаваемые словами или изображениями-прототипами. К тому же очень уж хотелось порулить процессом, а не плестись печально по всем колдобинам, догоняя хвост машинного гения.
...и ведь даже почти не обидно, что сеть уже сейчас рисует намного лучше меня... Но вот навязчивое желание получить от «бездушной машины» именно то, что хочется... как с этим быть?!
*
PS. Никаких глубоких и потаённых смыслов в этой публикации нет: чисто похвастать просто показать, что удалось найти. К тому же мне самой стало интересно разобраться, что и почему происходит «в процессе уговоров» упрямой сетки.
PPS. С материалами удобней знакомится на мониторе, на телефоне местами форматирование слетает — и таблицы могут отображаться некорректно.
PPРS. Все картинки кликабельны, их можно рассмотреть поближе. Удачные варианты — хотя бы в первом приближении — отмечены жирным шрифтом. Особо неудачные — почищены и забыты.
Соотношение сторон — 1:1 (квадрат)
№№ попытки | Результат генерации | Текст запроса | Стиль генерации | |||
А.1 | ![]() | Безделушки и безделицы, яркие камешки сплошным слоем, цветная галька россыпью | artstation | |||
А.2 | ![]() | Безделушки и безделицы, яркие камешки сплошным слоем, цветная прозрачная галька россыпью, мелкая и крупная, россыпь, неровности, серое и золотое | artstation | |||
А.3 | ![]() | Безделушки и безделицы, яркие камешки сплошным слоем, цветная прозрачная галька россыпью, мелкая и крупная, россыпь, неровности, серое и золотое | 4к | |||
А.4 | ![]() | Безделушки и безделицы, яркие камешки сплошным слоем, цветная прозрачная галька россыпью, мелкая и крупная, россыпь, неровности, природный камень, агат, нефрит, яшма, хрусталь | без стиля | |||
А.5 | ![]() | Безделушки и безделицы, яркие камешки сплошным слоем, цветная прозрачная галька россыпью, мелкая и крупная, россыпь, неровности, природный камень, агат, нефрит, яшма, хрусталь, акварель, вода, ветер | без стиля | |||
А.6 | ![]() | Безделушки и безделицы, яркие камешки сплошным слоем, цветная прозрачная галька россыпью, мелкая и крупная, россыпь, неровности, природный камень, агат, нефрит, яшма, хрусталь, акварель, вода, ветер, золотистый, серый, бежевый, пастельные тона | без стиля | |||
А.7 | ![]() | Безделушки и безделицы, яркие камешки сплошным слоем, цветная прозрачная галька россыпью, мелкая и крупная, россыпь, неровности, природный камень, агат, нефрит, яшма, хрусталь, акварель, вода, ветер, золотистый, серый, бежевый | без стиля | |||
А.8 | ![]() | Тот же | 4к | |||
А.9 | ![]() | Безделушки и безделицы, яркие камешки сплошным слоем, цветная прозрачная галька россыпью, мелкая и крупная, россыпь, неровности, природный камень, агат, нефрит, яшма, хрусталь, акварель, вода, ветер, золотистый, серый, бежевый, пастельные тона, акварель | без стиля | |||
А.10 | ![]() | Безделушки и безделицы, яркие камешки сплошным слоем, цветная прозрачная галька россыпью, мелкая и крупная, россыпь, неровности, природный камень, агат, нефрит, яшма, хрусталь, акварель, вода, ветер, золотистый, серый, бежевый, акварель, пастельные тона | без стиля |
Хорошо видно, что первые четыре заплыва — унылый, ничем не примечательный реализм. Крики души про акварель и силы природы в запросе А.5 машиной были приняты, но в ответ выданы самые кислотные цвета. А вот А.6 уже вполне приемлем — и можно сказать, даже симпатичен.
По мне, так очень интересная разновидность генерации, которой стоит научиться управлять... с какой-то долей вероятности — и под крылом у самой дикой удачи. Для большей наглядности «смешивание с текстом» и «смешивание картинок» собраны в отдельные разделы.
Б1. Смешивание картинки и текста
Соотношение сторон - 1:1 (квадрат)
№№ попытки | Результат генерации | Исходная картинка | №№ исходника (с ЧГ)* | Текст для смешивания | ||||
Б1.1 | ![]() | ![]() | А.6(1) | (повторяет исходный запрос А.6) Безделушки и безделицы, яркие камешки сплошным слоем, цветная прозрачная галька россыпью, мелкая и крупная, россыпь, неровности, природный камень, агат, нефрит, яшма, хрусталь, акварель, вода, ветер, золотистый, серый, бежевый | ||||
Б1.2 | ![]() | ![]() | А.6(1) | Тот же |
* ЧГ, или число генераций - количество условных циклов генерации нейросети, пройденное изображением перед загрузкой в качестве исходных данных при текущем обращении пользователя (примерное значение термина - ZZ).
** ОИ - оригинальное изображение с нулевым числом генераций, предполагающее либо результат творческого процесса человека (электронное изображение либо оцифровка изображения, выполненного в традиционных художественных техниках), либо фотографию с натуры.
Б2. Смешивание картинок
Соотношение сторон - 1:1 (квадрат)
№№ попытки | Результат генерации | Исходная картинка #1 | Исходная картинка #2 | №№ исходников (с ЧГ)* | ||||
Б2.1 | ![]() | ![]() | ![]() | Б1.1(2) / А.6(1) | ||||
Б2.2 | ![]() | ![]() | ![]() | В1.1(2) / ОИ1.1(0)** | ||||
Б2.3 | ![]() | ![]() | ![]() | А.9(1) / В1.1(2) | ||||
Б2.4 | ![]() | ![]() | ![]() | А.9(1) / ОИ1.1(0) | ||||
Б2.5 | ![]() | ![]() | ![]() | В1.1(2) / ОИ1.1(0) | ||||
Б2.6 | ![]() | ![]() | ![]() | А.8(1) / ОИ1.1(0) | ||||
Б2.7 | ![]() | ![]() | ![]() | ОИ1.1(0) / А.7(1) | ||||
* ЧГ, или число генераций — количество условных циклов генерации нейросети, пройденное изображением перед загрузкой в качестве исходных данных при текущем обращении пользователя (примерное значение термина — ZZ).
** ОИ — оригинальное изображение с нулевым числом генераций, предполагающее либо результат творческого процесса человека (электронное изображение либо оцифровка изображения, выполненного в традиционных художественных техниках), либо фотографию с натуры.
Похоже, что-то новенькое — в прошлый мой раз в версии 2.0 (которая с вальяжным котом) такого не было... но сейчас у нас популярен модный лис! При обращении доступны два варианта переноса стиля: с текста или с изображения. Мне понравился второй — с заданной картинки (первый пока даже не попробовала). Похоже, что богатые возможности у этого способа. Очень увлекательно... только бы понять, как этим правильно пользоваться!
В1. Перенос стиля с картинки
Соотношение сторон - 1:1 (квадрат)
№№ попытки | Результат генерации | Картинка, куда переносим стиль #1 | Картинка, которой задаем стиль #2 | №№ исходников (с ЧГ)* | ||||
В1.1 | ![]() | ![]() | ![]() | А.6(1) / ОИ1.1(0)** | ||||
В1.2 | ![]() | ![]() | ![]() | А.5(1) / ОИ1.1(0) | ||||
В1.3 | ![]() | ![]() | ![]() | А.4(1) / ОИ1.1(0) | ||||
В1.4 | ![]() | ![]() | ![]() | В1.1(2) / ОИ1.2(0) | ||||
В1.5 | ![]() | ![]() | ![]() | А.5(1) / ОИ1.3(0) | ||||
В1.6 | ![]() | ![]() | ![]() | ОИ(0) / А.6(1) | ||||
В1.7 | ![]() | ![]() | ![]() | А.7(1) / ОИ1.1(0) | ||||
* ЧГ, или число генераций - количество условных циклов генерации нейросети, пройденное изображением перед загрузкой в качестве исходных данных при текущем обращении пользователя (примерное значение термина - ZZ).
** ОИ - оригинальное изображение с нулевым числом генераций, предполагающее либо результат творческого процесса человека (электронное изображение либо оцифровка изображения, выполненного в традиционных художественных техниках), либо фотографию с натуры.
Соотношение сторон - 1:1 (квадрат)
№№ попытки | Результат генерации | Исходная картинка | №№ исходника (с ЧГ)* | Комментарий | ||||
Г.1 | ![]() | ![]() | А.6(1) | Очень неудачная попытка - картинка потеряла всю прелесть - и ничего не приобрела взамен. Имхо. | ||||
Г.2 | ![]() | ![]() | В1.1(2) | Забавно получилось: все округлилось и сгладилось, но, похоже, из картинки #2 для предыдущего изображения выползли смешные кусты и деревья.Чем не открытка к Пасхе, например? |
* ЧГ, или число генераций - количество условных циклов генерации нейросети, пройденное изображением перед загрузкой в качестве исходных данных при текущем обращении пользователя (примерное значение термина - ZZ).
** ОИ - оригинальное изображение с нулевым числом генераций, предполагающее либо результат творческого процесса человека (электронное изображение либо оцифровка изображения, выполненного в традиционных художественных техниках), либо фотографию с натуры.
А на следующий день у меня были грандиозные планы...
(продолжение следует)