Нейросетевые возможности и невозможности: Кентавр
Автор: Макс ДалинГородской Кентавр
Интересная всё-таки штуковина - нейросети. Даже не столько тем, что с их помощью можно сделать, сколько тем, что они - индикатор. Лакмусовая бумажка такая. Отношения к миру, к искусству, к творчеству, к жизни. Некоей внутренней настройки.
Новое - вообще индикатор. И удивительно, у какой толпы народу новое вызывает страх и отвращение, что-то, созданное человеческим разумом и руками, вызывает страх и отвращение... Какие-то тут архетипические процессы запускаются в мозгах, древние. Не смотреть вокруг - можно подумать, что живём в достаточно благополучном и безопасном мире. Посмотреть - и увидишь и Общество Верящих В Плоскую Землю, и тех, кто утверждал, что от "Дженнеровской заразы", вакцинации против чёрной оспы, у людей вырастут рога, и тех, кто утверждал, что чудовищные скорости железных дорог вызовут у пассажиров безумие и остановки сердца... Каждое новое изобретение, каждая новая идея вызывают у изрядной части людей пароксизм ужаса - и пачку пророчеств о падении нравов и конце света. С незапамятных времён. Всегда.
Вот интересно, когда-нибудь это кончится?
Нынче нейросети того и гляди объявят главной угрозой человечеству. Ну уж культуре-то и искусству - как минимум. Крах всего, кошмарный ужас. Такие умилительные аргументы... Создаётся впечатление, что до изобретения нейросетей живые художники никогда не рисовали пошленьких глянцевых картинок, чтобы все - на одно лицо. Что до изобретения нейросетей не было подражателей и эпигонов, что не существовало копий, которые продавались за подлинники, имитаторов стилей, воровства идей, тиражирования модных сюжетов, армии клонов, ляпающих годами одно и то же в продающейся манере... Вот жило человечество в чистом искусстве - и вдруг сатанинские нейросети весь этот ужас на несчастных творцов и обрушили. Караул, мы все умрём.
Так, ей-богу, трогательно... Самый распространённый посыл: "А вы знаете, что нейросеть умеет только то, чему её обучили?" А вы знаете, что вы - тоже? Что любого из нас тоже, сцабака марсианская, обучали на всё той же классике? И что наш мозг тоже неявно всё это обрабатывает и компилирует, и что искусство - это не сферический конь в вакууме, а то, что создаётся на основе тысяч и миллионов уже созданных произведений. Переход на новый виток - выход на новый уровень - но там должны быть нижние ступеньки. Мы все стоим на плечах титанов. Есть масса направлений в искусстве, которая строится на переосмыслении творчества предшественников. Постмодерн, фанфик, пародия, римейк - аллюзии, отсылки, реминисценции - символы и намёки, преемственность и создание своего через достаточно древнее чужое.
А как забавно разнятся критерии оценки произведения искусства, дорогие друзья! Ну, у профессионала - своё. У дилетанта - своё. Широкие народные массы плевать на это хотели. Искусство элитарно? Тогда вопрос, что в большей степени искусство: утончённый салонный романс или народная песня? Романс проживёт сезон, народную песню уже триста лет поют. Но что скажут искусствоведы?
Вот древний сериал "Следствие ведут Знатоки" - искусство или кусок масскульта? Но ведь какая дивная серия "Подпасок с огурцом"! Мысль выражена просто кристально, я больше нигде не видел такой точности формулировки: для колоссального количества людей, которые ощущают себя ценителями искусства, главное в этом самом искусстве - признанное имя. Клеймо. Бренд. Стоит убедиться, что на шедевре нет клейма, как он тут же становится в глазах такого ценителя забавной поделкой - и не больше. Признать, что современник выше великого предшественника? Не укладывается в голове.
* В эту же папку: признать, что "жанровая проза", "низкий жанр", "развлечение для подростков" - духовная пища нескольких поколений? Да лучше удавиться. А уж признать, что какую-то литературную ценность имеет самиздат... ну, это легче убиться об стену. Это потрясение основ. Мемы и пирожки - новый фольклор? Не смешите.
Литература и изобразительное искусство - в одном и том же положении. Непонятно, сцабака лысая, шестиногая, где кончается искусство и начинается неискусство! И дофига, ну просто дофига всякого разного появилось, на котором нет клейма - и не предвидится, потому что... Это машинное творчество? Или человеческое? Или машинное? А машина на современном технологическом уровне может творить? Или человеческое?
А фотография - творчество? А коллаж? А цифровая живопись?
Как же, блин блинский, это всё сложно-то.
Ладно, вот что. Попробую показать, как это делается, в деталях.
Почему-то в широких кругах бытует мнение, что создатели рисующих нейросетей создали, наконец, знаменитую кнопку с надписью "сделать зашибись". То есть, стоит только захотеть - говорите сети: сделай, чтоб зашибись! - и профит. А потом выдают массу претензий к качеству этого "зашибись"... ну, собственно, можно перечитать паблик сначала.
Но дело-то в том, что по клику никакого особого "зашибись" вы не получите. В один клик нейросеть очень прилично генерирует привычное. Типичное, стандартное. То, на чём её учили. Самое верное - дивная дева в стиле прерафаэлитов, бушующее море в стиле Айвазовского, кубистический натюрморт в стиле Пикассо. Стандартную фотореалистичную картинку "красивый живчик на красивом ландшафте". Но, кто пробовал, тот знает: машина сбойнёт или выдаст что-то принципиально не то, если вам понадобится изображение, например, космонавта на Луне в стиле Рембрандта. Машина не представляет. Дорогой уважаемый товарищ Рембрандт такого и близко не писал. Далее: пытаясь изобразить то, чего не рисовал никто, вы получите охапку глюков, один другого угарнее.
Да и вообще: создавая сложное изображение, вы получите кучу глюков. Создавая жанровую сценку, вы получите мешанину рук, ног, голов и странных объектов.
Нейросеть, строго говоря, не ИИ. Она не знает, что это руки и ноги, не знает, зачем нужны штаны или уши. Она может создать определённый набор линий и пятен, если представляет, как их гармонично расставить. Вот цвет и форма - то да, это конёк машины: гармонию она может хорошо, гармония просчитывается по вполне существующим математическим формулам.
Геометрия и цвет - да. А вот всякие там радость, грусть, презрение, скорбь, тоска, лукавство - уже нет. Это уже дело вашей удачи или приложения рук.
Поэтому инопланетяне и мифические существа - беда. Даже наипростейшие из них, тех, кого легко может условно изобразить дошкольник, для нейросети очень сложная задача. Русалка. Птица Сирин. Не дай бог, кентавр.
Точно, красиво, гармонично, без глюков изобразить кентавра - даже без особых эмоций, просто кентавра вообще, но приличного, у которого целы все ноги и все руки, есть какая-нить одежонка, создать более или менее детализированный фон - практически невыполнимая задача. Говорю, как человек, который на кентаврах уже собаку съел. Компьютерную. Вот такую: @ - и даже не одну.
Я сначала делал кентавра на заказ, а потом - для собственной радости. Очень люблю старые стихи Арбенина - и давно хотел сделать иллюстрацию к ним:
Я купил проездной, мне буквально чуть-чуть не хватило на лошадь.
Я хотел стать героем, чтоб быть на коне, чтоб звучали литавры.
Но я приехал один на пустую Сенную базарную площадь,
Променял пол-себя на коня и к утру стал настоящим кентавром.
Человеческий верх, нечеловеческий низ, вся в бинтах середина.
Две подковы напра, две подковы нале, плюс запаска на счастье.
И всё бы было путём, но маршруты кентавра неисповедимы,
И закрываются двери не предупредив, благодарю за участье.
Запряженные в варево спальных районов реки без теченья
Утолят свою жажду бутылочкой моря в ближайшей аптеке.
Ну а мне бы всё заново, мне бы просечь то золотое сеченье.
А не справлюсь я сам - что ж, помоги мне, Сезам, приподними эти веки...
Ну и вот. То, что у меня получилось - вы уже видели. А как оно получалось - я попробую рассказать.
Дело в том, что когда я начал рисовать Кентавра Арбенина, я уже никаких иллюзий не питал вообще. Я знал точно: в данном случае кнопки "сделать зашибись" нет даже в проекте. Даже архаический, архетипический, мифологический кентавр в позлащённых лесах Эллады - для нейросетей непосильная задача. Я пробовал Проблембо, Маджу, Вомбо, Кандинского и ещё полдесятка ботиков - нет, пролёт. Вот такое даёт Вомба:
Такое - Маджа:
Вот такое - Проблемба, Миджорни:
Отметим, что для этой красоты требуется референс. То есть, худо-бедно нарисованный руками кентавр - иначе не будет и такого. Промт тут неважен. Я перепробовал около сотни вариаций - вотще.
Дальше требуется приложение собственных рук.
Итак, в данном случае требования у меня были такие. Стиль, близкий к стилю комикса или книжной графики, карандаш или перо, подтонированные акварелью. Не хочу, чтоб он был узнаваемый, "в манере кого-то" - вернее, хочу, чтобы он был узнаваемо мой. Жёлто-серый колорит поздней печальной осени. Кентавр - этакий городской интель в очочках, может, малость хиппи. Почему-то хочу, чтоб в свитере - а свитер на кентавра надеть, сцабака бешеная, практически невозможно. На этом деле, оговорённом в промте, нейросети выдают такое неприличие, что и показать-то срамно:
И это у нас антураж с референса. А мне нужен был мегаполис, дождь, условные далёкие дома-автомобили, мокрые облезлые деревья. И вот я начал помаленьку всё это обрабатывать и собирать.
Работал в нейросетях dream.ai и Mage, они бесплатные - ошибайся не хочу! Просто нужно было очень, очень много вариантов.
Итак, у меня был тот самый старый референс, который я набросал ещё для заказного кентавра, обложечного. Я взял его за основу и попытался изменить в том стиле, который мне нужен. Прописал графику, серо-жёлтый колорит, очки и хайр, дома и автомобили - плюс общую печаль.
Вышло вот так - ну в среднем:
Таких эскизов я сделал штук, наверное, сто или около того - чтобы выбрать из них самые годные и что-то из них собрать. Собираю я обычно не в фотошопе, а в paint.net - хорошая, лёгонькая, честная программа, где есть все те же функции, в сущности. Что нам нужно: вырезать-вставить, растушёвка разной степени яркости, клонирование - ну и там по мелочи, вроде разных областей выделения, чтобы при необходимости легко очистить фон.
Когда что-то более-менее менялось в лучшую сторону, я заменял референс новой картинкой - ну такой аналог естественного отбора в природе. Когда Вомба подошла к своему пределу понимания, я перелез в Маджу - и уже там прогнал референс по тому же алгоритму. В общем, конскими усилиями я за несколько дней собрал примерно это:
Тут уже начало что-то просвечивать, по крайней мере, в смысле стиля, фона и общего настроения. Дальше я уже каждую получившуюся генерацию немного подкручивал в пайнте, чтобы она становилась точнее - ну и делал из неё следующий референс. Потихоньку товарищ кентавр начал вырисовываться чётче.
Всякие левые руки и ноги можно вычистить в пайнте или в фотошопе, а можно - в Редакторе Проблембо, но это уже за деньги, хоть и небольшие. Поэтому я оставил для Редактора только самые сложные вещи, где обязательно надо было сохранить фактуру.
В конце концов, мы с Маджой общими усилиями сделали годный фон и голову, которая мне понравилась. Вот такое выражение я хотел, надменное и печальное: "Я хотел стать героем, а стал божеством - и это невыносимо. И я тащу этот дар, я - одинокий кентавр среди гуингмов и йеху..." Теперь уже оставался сущий пустяк: надо было убрать остатки глюков, сдвоенную заднюю ножку, куски сбруи - Кентавр не любил, когда его пытались взнуздывать - и надеть на него свитер.
Я не хотел искать свитер в сети и клеить его в пайнте следующим слоем: так всегда получается немного неточно - и придётся ещё разок выстраивать позу Кентавра, которая уже получилась и меня устраивала. К тому же я уже вроде сделал более или менее достоверные руки. Вы ж понимаете, дорогие друзья: руки - самая большая беда у сетевых картинок.
Поэтому я стал прорисовывать свитер в Редакторе Проблембо. Пришлось прописать промт специально для Редактора - там свои заморочки. Начали мы с ним с такого:
Почему так - не знаю. Подобных глюков у меня набралось множество, разных. Но в итоге мы с Редактором кое-как договорились и потихоньку, в несколько слоёв, опустили свитер ровно настолько, чтобы закрыть Кентавру его воображаемые бинты.
Финальная картинка на этой стадии выглядела так:
Тут уже оставался совсем пустяк: убрать странную штуковину, которую нейросеть сунула в руки Кентавра в виде полезной нагрузки к свитеру - и немного расширить фон. Мне хотелось, чтобы простора Кентавру было побольше - чтобы дождю и октябрю тут было чем дышать.
Я вставил картинку в белый прямоугольник большего размера, набросал парой штрихов, что бы я хотел на фоне - и послойно его прорисовал в Редакторе Проблембы. И вот! Вот он, Кентавр!
Герой одного из любимых стихотворений. Какие-то паршивые две недели - и мы в дамках: получилась картинка, которая мне нравится. Красивая иллюстрация того, как нейросеть убивает художников, сходу создавая шедевры.
Думаю, "художник руками" нарисовал бы такую картинку раз в пять быстрее. Но фишка в том, что я такую нарисовать руками вообще не могу. То есть, нейросеть тут сработала как протез моих возможностей рисовальщика: я вижу, чего хочу, я всякими способами объясняю машине, чего хочу, время от времени помогая ей приложением рук - и в конце концов, как и "художник руками", я получаю точно то, чего хочу!
Понимаете, дорогие друзья, точно то! Именно так, как увидел! Я убился об нейросеть - как художник убивается об лист бумаги, чтобы добиться точного соответствия рисунка внутреннему образу. Только голову Кентавра я руками поправлял, потом генерировал по эскизу, снова поправлял, генерировал уже по новому эскизу восемнадцать раз.
Эта работа чисто технически сильно отличается от работы "художника руками" - но ведь в сущности-то я тоже руками. Мне как-то сказали: в нейросетевом рисунке отсутствует человеческое целеполагание, он случаен - так вот, нет. Не случаен. Вернее, не более случаен, чем рисунок карандашом на бумаге.
Возможно, у других людей - другие методы. Но по сути, те, кто создаёт нейросетевые обложки и прочие картинки, точно так же прикладывают собственные руки, как и вся прочая рисующая братия. Если, конечно, человека не устраивает первоначальная, глючная, случайная, неточная или зализанная картинка. То есть, даже степень удовлетворённости результатом плюс-минус такая же: кому-то достаточно "так-сяк", кто-то убивается, чтобы сделать точно как на внутреннем экране.
Простите за слишком длинный пост, дорогие друзья. Просто - давно хотел это сказать. Может, это что-то немного прояснит.
Запряженные в зарево спальных районов реки без истока
Оторвут свою правду куском кирпича на пожелтевшем заборе.
Не а мне бы всё заново, мне бы отпить от мирового потока.
И если дело за мной - я предъявлю проездной и перейду это море.