Midjourney для писателей
Автор: Глеб КащеевО Midjournal, наверное, уже слышали все, кто имеет хоть какое-то отношение к творчеству. Статей о том, как начать в нем работать уже огромное количество, но я пока не встречал материалов о том как применять нейросеть именно в писательском деле для двух конкретных задач: создание обложек и иллюстраций к конкретным сценам книги.
Решил восполнить этот пробел, ибо у меня уже 40+ часов чистой генерации и несколько десятков иллюстраций такого качества, которые даже в midjourney-art сообществах собирают кучу лайков.
Вот несколько примеров.
Обложка для рассказа
Иллюстрация к роману Лабрис: Уровень 2
Иллюстрация к роману «Живые отражения: Красная королева»
Богиня из романа Лабрис.
Я не буду учить как начать работать с нейросетью — на этот предмет куча статей и гуглятся они легко. Также безусловным является то, что вам нужно иметь платный аккаунт в нейросети, иначе халявных 25 минут хватит ровно на одну качественную картинку (с учетом перебора вариантов). Мы в рамках статьи будем решать две конкретные задачи: обложки и иллюстрации.
Кстати, лирическое отступление. Если про обложки все понятно, то вопрос про иллюстрации не столь очевиден. Они нужны в первую очередь для соцсетей, ибо визуальный контент+текст всегда лучше, чем просто текст. Если вы хотите опубликовать отрывок книги или уже в десятый раз просто прорекламировать книгу в своем сообществе, то лепить все время только обложку не лучшая стратегия. Красивая иллюстрация в тему добавит вам и лайков и перепостов.
Начну я с того, что нейросеть не может сделать в принципе, и какие сцены нужно сразу отбросить, потому что на создание иллюстраций к ним вы убьете кучу времени, а результат будет так себе.
Все дело в том, что нейросеть большей частью обучалась на портретах и пейзажах и заточена большей частью под них. Более того, она всегда старается выровнять по стилистике картинку, так что из этого следует несколько врожденных проблем:
1. У вас не выйдет смешать стили в том плане, что если у вас по задумке щегольски одетый бизнесмен из современности в деловом костюме противостоит солдатам в средневековых латах, то нейросеть этого не сделает качественно никогда. На бизнесмена напялят латы или охрана будет не средневековая, а вполне современная.
У меня была потребность в сцене, где красивая девушка в вечернем платье преграждает путь брутальному демону. Так вот, пока я не ввел абзац текста как описание внешности девушки, она тоже была зеленокожей, да и потом половина картинок была с рогатой малифисентой или зеленой Гаморрой вместо обычной девицы либо демон становился женщиной
То есть нужно заранее смириться, что вся картинка будет в одном стиле. К примеру, либо средневековье, либо стимпанк, либо современность.
2. Аналогично с точки зрения персонажей, если их более двух. У меня была необходимость сделать атаку пантеры на группу рыцарей, но нейросеть упорно наряжала пантеру в латы, ставила на задние лапы и давала в руки секиру. То есть животное и человек — нормально. Животное и группа людей в стандартном антураже (собачка играет с детьми) — тоже без проблем. Но как только начинается специфическая конкретика типа а давайте все это в стимпанковском мире, да еще и динамическая сцена — быть проблемам.
3. Из-за заточенности под портреты нужно заранее смириться с тем, что все герои будут одного роста.
В приведенном выше примере мне нужно было создать иллюстрацию, когда маленькая худая девушка противостоит огромному демону. Интересных и реалистичных персонажей я в итоге получил, но вот разницы в росте пытался добиться два дня подряд, но ничего похожего на задумку так и не сгенерил.
Иллюстрация к роману «Отельер Смерти»
4. Нейросеть плохо рисует непопулярных животных. То есть собачку — без проблем. Пантеру уже сложнее, а вот когда я пытался генерировать дельфинов, то это был набор комиксов о том как не стоит рисовать этих животных. Все уродцы были с акульими жабрами, неимоверным количеством плавников, которые торчали из совершенно производных мест. А уж «Девочка и дельфин» приводило в 80% к тому, что либо это русалка, либо у девочки плавники вместо рук, либо она держит маленького дельфина размером с селедку в руках.
промежуточные варианты
Итоговый вариант, в котором тоже полно дефектов
При этом со сказочными животными нейросетка более-менее справляется, потому что никто толком не знает, как должен выглядеть дракон или грифон, и там ее косяки не так заметны.
5. Про количество пальцев уже неоднократно ходили мемы, так что старайтесь придумывать сцены, где рук не видно, или готовьтесь к тому, что придется перебирать сотни вариантов, прежде чем найдете более-менее реалистичные руки с пятью пальцами.
Иллюстрация к роману «Мастер реальности»
Исходя из всего перечисленного: Midjourney идеально рисует портреты на любом даже очень фантастическом фоне и крутые пейзажи. Чуть хуже справляется со взаимоотношениями двух героев (желательно в спокойной обстановке), еще хуже с динамическими сценами, где есть драка, агрессия, резкие движения и т.п. И совсем плохо, если все это сочетается (драка на троих).
фантастический пейзаж
Динамичная сцена атаки огромной птицы
Далее: сетку можно, конечно, гонять в режиме абсолютной свободы действий по абстрактным запросам, но если вам нужна прямо конкретная сцена из книги, то будьте готовы, что прописывать нужно буквально все, включая угол камеры, возраст героев, их положение в пространстве, то, что снимок нужен в полный рост и т.п.
При этом у Midjouney есть четкое правило, что первые слова в запросе наиболее приоритетны, а то, что стоит последним он зачастую и вовсе игнорирует. Так что если у вас непременно молодая и красивая девушка в сцене в красивом средневековом замке рядом со служанкой, то начинать нужно описание именно с девушки, а не со служанки или интерьера, иначе главным героем сцены будет служанка или лестница замка.
Если у вас два персонажа, то мой опыт показывает, что нужно начинать именно со слов «два» и дальше описывать каждого. Иначе будет явный перекос в сторону первого.
Например «Две девушки пристально смотрят друг на друга, одна девушка рыжеволосая в красных латах, вторая блондинка в белом платье.»
Вот в этом запросе я смог добиться нужных лиц и выражения, но заставить сочетать платье и латы так и не вышло, однако картинка меня устроила.
Иллюстрация к роману Живые отражения: Белая принцесса
Что касается параметров запроса. Забудьте про генераторы запросов для нейросети — у них очень кастрированный набор. Сидите в дискорде и смотрите на то, что употребляют другие, когда получают картинку в интересующей вас стилистике.
Например я предпочитаю иллюстрации киношного качества, и мой обычный запрос (то, что идет после описывающего сцену текста)
HD, cinematography, photorealistic, epic composition Unreal Engine, Cinematic, Color Grading, portrait Photography, Ultra-Wide Angle, Depth of Field, hyper-detailed, beautifully color-coded, insane details, intricate details, beautifully color graded, Unreal Engine, Cinematic, Color Grading, Editorial Photography, Photography, Photoshoot, Depth of Field, DOF, Tilt Blur, White Balance, 32k, Super-Resolution, Megapixel, ProPhoto RGB, VR, Halfrear Lighting, Backlight, Natural Lighting, Incandescent, Optical Fiber, Moody Lighting, Cinematic Lighting, Studio Lighting, Soft Lighting, Volumetric, Contre-Jour, Beautiful Lighting, Accent Lighting, Global Illumination, Screen Space Global Illumination, Ray Tracing Global Illumination, Optics, Scattering, Glowing, Shadows, Rough, Shimmering, Ray Tracing Reflections, Lumen Reflections, Screen Space Reflections, Diffraction Grading, Chromatic Aberration, GB Displacement, Scan Lines, Ray Traced, Ray Tracing Ambient Occlusion, Anti-Aliasing, FKAA, TXAA, RTX, SSAO, Shaders, OpenGL-Shaders, GLSL-Shaders, Post Processing, Post-Production, Cel Shading, Tone Mapping, CGI, VFX, SFX, insanely detailed and intricate, hypermaximalist, elegant, hyper realistic, super detailed, dynamic pose, photography, 8k --q 2 --v 4
И поверьте, все попытки убрать из этого набора несколько параметров приводили к резкому ухудшению качества картинки. Но повторю, что это все употребляется для гиперреализма киношного качества. Если вам нужен рисованный арт в стиле WLOP или другого художника, то так и пишите.
Портрет девочки в технике пастели
И последнее. Идеально будет, если при генерации ряда иллюстраций у одного и того же героя будет одно и то же лицо. Добиться этого применяя только Midjourney не выйдет. Для этого я дорабатываю изображения в другой нейросетке - FaceApp. Она позволяет делать морфинг лиц и приводить их к похожим вариантам.
Княгиня Ирма из романа Мастер реальности
Она же в другой сцене.
Надеюсь эти небольшие лайфхаки сэкономят вам кучу времени и позволят генерировать идеальные обложки и иллюстрации без привлечения художников :)