Про новые нейросети и потенциальные обложки на халяву
Автор: Макс ДалинКартинка создана нейросетью by Wombo по команде
"Замок на закате"
Похоже, художникам, которые хотят за сляпанные на коленке коллажи и плоховато нарисованные картинки больших денег, приходит скорый и немилостивый конец. Потому что фигню разной степени красоты и качества каждый из нас может генерировать в нейросетях погонными километрами - и та фигня часто выглядит лучше, чем сляпанное на коленке вдохновенной творческой личностью.
Сейчас уже можно сказать: машине не заменить творца, но машина лихо отделит творцов от всех, кто что-то где-то по чуть-чуть. С картинками это происходит уже сейчас, с текстами, видимо, будет происходить потом - ну и отличный философский повод есть, задуматься о том, чего мы все в своей профессии стоим.
Так я это всё к чему, дорогие друзья. Мы посмотрели, как могут помочь в иллюстрировании текстов нейросетки Hero Forg и Artbrider, а за это время появились новые боты-художники - Сбер и by Wombo. Натурально, я интересуюсь, я заглядываю, я тестирую - и докладываю всем, кто тоже интересуется, о результатах.
Сбер, к сожалению, годится, скорее, для развлечения, чем для иллюстрирования текстов всерьёз. Но если кому охота поржать - это завсегда, потому что изображения она выдаёт настолько уморительные, что зритель просто под стол сползает. Чтоб не быть голословным - изображение по запросу "зайчик" (уберите ваших детей от наших голубых экранов):
Сетка Сбер умеет изображать людей так, что сразу можно сказать: вот человек, а не чайник и не крендель с маком. Это большой плюс. Но людей она изображает настолько криво, а хуже того - как-то нелепо, не гармонично, безобразно, что даже после обработки они не особенно подходят для потенциального портрета героя. Меня, впрочем, очаровала картинка по запросу "незнакомка" - на ней мы видим печальную девушку с аккуратными чаплиновскими усиками:
Пейзажи даются сетке Сбер, пожалуй, полегче - но они... в общем, не дует от них ветер вдохновения. Они выглядят, как очень кривая компиляция самых банальных фотографий - надо быть очень нетребовательным, чтобы использовать такое всерьёз.
Вот, например, запрос "ночной город" - ну ему бог велел получиться отлично, потому что самое расхожее, может быть не детализированным, часто встречающееся... и вот:
То есть - ну да, это ночной город, не перепутаешь. Но как-то уныло до оскомины, глаз не цепляется, похоже на неудачную фотку - даже не смешно. Обработки особо не улучшают дела. В общем, с сетью Сбер я поразвлекался и бросил: для нашей работы она не годится.
И тут промелькнуло где-то в блогах название by Wombo - натурально, я немедленно туда кинулся, поглядеть, что новая нейросеть нам хорошего нарисует.
И она таки превзошла мои ожидания далеко! Потому что Вомбо - похоже, единственная нейросеть из тех, что нынче существуют, чью картинку реально поставить на обложку без дополнительного кручения и верчения, фотошопа и прочей возни. Потому что это круто! То есть - ну вот замок красивый. Вправду красивый. Но мало того - он, пожалуй, взгляд цепляет, некая безуминка там есть, а это всего лишь замок, сетка Вомбо может организовать безумия полной ложкой. Для любого ценителя жанра.
С Вомбо я возился несколько дней, прям плотно. И хорошо представляю себе её достоинства и недостатки, которые хорошо бы иметь в виду, если начнёте её использовать - иначе можно сразу нарезаться на недостаток и бросить, не дойдя до самого сладкого.
Значит, так. Начнём с плохого.
По-русски Вомбо не понимает или понимает криво, надо по-английски. По-английски надо как можно примитивнее формулировать, без всяких идиом и метафор, не дай бог. Вот прямо с пролетарской прямотой: зимний лес и маленький домик. Тогда есть неиллюзорный шанс получить почти то, что вы бы хотели.
Людей Вомбо рисовать не умеет. То есть вообще, даже так, как Сбер, не может. На запрос "лицо красивой девушки" выдаёт что-то такое, от чего дорогой и уважаемый товарищ Пикассо пришёл бы в восторг, вроде такого:
Причём, тут что интересно: я бы не сказал, что это не красиво. Не лишено: цвет хорош, композиция в своём роде гармоничная, даже понятно, что лицо, что девушка имеется в виду красивая... Но в качестве портрета персонажа, по-моему, не очень подходит, если по вашему замыслу этот портрет не рисовал обитающий в вашем мире подражатель Сальвадора Дали.
С другой стороны, а ведь не факт, что такая дико странная дива на обложке не привлечёт внимания... В общем, мне, как ни странно, скорее, нравится. Но всё равно, не стоит ожидать, что Вомбо нарисует вам именно вашего персонажа - и будет похоже. А с фигурой человека там ещё хуже, чем с лицом, фигура - это сложно, это даже Артбридер не может сделать толком, хотя он именно для этого и создан.
Далее. Зверей и птиц Вомбо рисует с переменным успехом. Иногда просто очумительно здорово, иногда - совсем никак. Вот, например, по запросу "морской змей" она сделала прям потенциальную иллюстрацию, очень интересную:
А вот "зайчик" (удобный тестовый зверь), по-моему, намерен съесть обитателей крохотного города у него под лапами:
Интересно, что крабы, скорпионы, пауки, осьминоги или кальмары даются Вомбо, как будто, легче - а вот зайчик или котик идёт тяжело. Котика, хоть чуть-чуть похожего на котика, у меня не получилось добиться вообще.
Конкретные предметы Вомбо рисует настолько же с переменным успехом. По запросу "ваза с фруктами" я получил вполне интересный натюрморт:
А вот запрос "настольная лампа" поставил его в тупик: всякие огоньки, фонарики, какие-то абстрактные огонёчки - но ничего похожего на настольную лампу Вомбо не выдала.
С другой стороны, вы всегда можете получить забавную и смутно узнаваемую абстракцию - будто рисовал слегка спятивший футурист. Вот, например, запрос "гоночный болид":
Узнаваемо ведь - если знать, на что смотреть, правда? Вомбо старалась, вышло красиво - и, видимо, на взгляд машины, вполне понятно. Вот, например, колесо, там, наверху.
Ясно, что сеть манипулирует фрагментами известных ей образов, которые совмещает, как ей диктуют алгоритмы. Но у Вомбо выходит элегантнее, чем у Сбера - видимо, потому, что она сразу обрабатывает изображение в стиле, который вы ей предлагаете. А ещё она различает цвета: если ей сказать, что нужен "зелёный блик в окне", она изобразит именно зелёный, не перепутает, это тоже плюс:
Теперь плотно о главных плюсах.
Вомбо вдохновенно генерирует пейзажи. Реально красивые, довольно сложные. Она сделает вам совершенно безумные деревья, немыслимую и прекрасную архитектуру, город будущего, руины, стимпанковские или фэнтезийные замки. Некоторые изображения просто завораживают:
У неё здорово выходят катастрофы и всякий ужас. Запрос "город в огне":
Ей здорово удаются объекты с яркой и странной фактурой. Запрос "корявое старое дерево":
Вомбо отлично исполняет кровищщу, черепа и кости, всяческую готику и хтонь, мрачные подземелья, надгробные памятники - иногда настолько красиво и необычно, что удивишься. Запрос "череп чудовища":
А вспомнив о Дали, я задал ей повторить его тему, "окровавленные розы"" - вышла очень годная иллюстрация к ужастику:
В общем-целом, после того, как я гонял Вомбо в хвост и в гриву, сделал, наверное, картинок двести, из которых штук пятнадцать отложил для будущего использования - могу сказать, что рекомендую вам эту программу, дорогие друзья. Картинки, которые генерирует Вомбо, конечно, не шедевры живописи... но ведь процентов восемьдесят "нарисованного руками", "тёплого-лампового" - тоже не шедевры, чтоб не сказать сильнее. Компиляций из случайных кусков полно на обложках, ещё больше их продаётся - и они сильнее узнаваемы, чем те образы, что использует нейросеть. Мне кажется, что слегка безумные глюки Вомбо очень подходят товарищам фэнтезюшникам и фантастам, эта сетка делает то, чего мне почти никогда не удавалось получить от живого-настоящего художника.
Ощущение больной фантазии. Сновидения. Соскальзывания на другую сторону зеркала.
Иногда я видел такие штуки в картинах очень больших мастеров - или в случайных картинках, мелькавших в Сети. И всегда это было мне совершенно недоступно. Но теперь... теперь - спасибо создателям Вомбо.
Я никогда не посмею гонять живого художника так, как буду гонять бездушную машину, добиваясь того, чего мне хочется увидеть. И я добьюсь. Это шикарный инструмент.
Не для художника - у художника есть свои голова и руки. Для писателя, который может найти правильные слова, чтобы сформулировать тему - и имеет достаточно терпения, чтобы искать нужную формулировку долго.
У нас появилась отличная кисточка, дорогие друзья! Которой можно сказать "сделай, чтоб зашибись было!" - и не исключено, что она сделает.
Но, конечно, необходимо отметить, что для ценителей классического стиля, реализма, узнаваемого, плотного, настоящего, не сказочного или грёзового мира эта сеть не подойдёт вообще. Ещё бессмысленно требовать от Вомбо жанровые сценки. Хорошую и эмоциональную жанровую сценку не изобразит никакая нейросеть, я предположу - так же, как сеть не зажжёт глаза персонажа огоньками живой мысли и настоящего чувства. Для этого нужны руки и душа художника, человека.
И работы, сделанные этими руками, стоят оправданно дорого. Как-то так.