Как я нейросеть уговариваю палаточку на марсе изобразить

Автор: wayerr

Намедни мне подсказали что можно скачать нейросеть на комп, и пусть у меня древняя видяха со всего двумя гигами (почему-то я всё время думал, что там 4гига), но вся эта штука впихнулась и даже что-то генерирует за десяток секунд на картинку.

Итак, я для рассказа про марсианского садовода думаю сделать простенький пейзажик: озеро, серебристая палаточка и марсианские безжизненные скалы. Буду показывать картинку и prompt к ней.

epic painting of metallic silver tent on shore of lake in martian crater at red rocky desert, detailed fantasy concept art,  artstation,  8k,  atmospheric colors, ambient lighting
Steps: 20, Sampler: DDIM, CFG scale: 8

Тут я замечу, что мусор воде "epic" и т.п. теоретически нужен, чтобы был относительно нормальный рисунок, а не фоточка или упражнение из пейинта.

Параметры (шаги, семплер и т.п.) здесь и далее всегда одинаковые.

Ну ладно, палаточка есть, но нам нужна закрывающаяся палаточка! Попробуем поменять.

epic painting of silver tent between red rocks at shore of lake in red mesas, silver tent on Mars, detailed fantasy concept art,  artstation,  8k,  atmospheric colors, ambient lighting

Ой. А палаточка? При том ведь, что я её добавил в prompt ещё раз.

epic painting of silver tent between martian rocks, lake on front, silver tent, detailed fantasy concept art,  artstation,  8k,  atmospheric colors, ambient lighting

Ага, палаточка маскируется под скалу. Это видно сравнив с первой картинкой. Попробуем иначе:

painting of silver tent between martian rocks, lake on front, metallic tent shelter, detailed fantasy concept art,  artstation,  8k,  atmospheric colors, ambient lighting

Палаточку уже проще угадать. Попробуем ещё чуть:

painting of metallic tent between martian rocks, lake on front, metallic tent shelter, detailed fantasy concept art,  artstation,  8k,  atmospheric colors, ambient lighting

О, добавилось чуть больше ровных линий, и это уже похоже на то, что надо. Конечно отражение в воде так себе, но оно хотябы есть.

Вспоминая предыдущие блоги, то можно представить себе работу мага: он говорит некое заклинание и получает меджик, а потом если удалось это пережить, то записывает результат и перебором пытается понять закономерности или просто улучшить результат.

ps. нейросеть stable diffusion, я брал проект stable-diffusion-webui засовывал в докеровский образ от rocm (это для амд видях на линуксе), туда ставил кастомный tensorflow под gfx803 серию карт (т.е. для RX 560), всё это даже работает, как видно.

+66
328

0 комментариев, по

2 345 425 206
Наверх Вниз