Нейросеть Midjourney для иллюстрирования книги. Личный опыт.

Автор: Леонид Демиров

Всем привет! Хочу поделиться результатами своих экспериментов с генерацией иллюстраций для книги при помощи нейросети Midjourney. С картинками вечная проблема. То, что мы находим в сети, чаще всего нельзя использовать из-за нарушения авторских прав и т.д. Я давно слышал про использование нейросетей, но только сейчас руки дошли до практики.

Если кратко - эта штука работает, и работает хорошо. Вы потратите день-два на то, чтобы разобраться, как пользоваться сервисом, какие команды ему давать, но по итогу получите быстрый и гибкий инструмент, способный за приемлемое время выдать почти любую ахинею, которая придет вам в голову. Подписка стоит 10 баксов, за нее вы получаете 200 минут времени видеокарты, этого хватит, чтобы генерировать 300-400 картинок. Конечно, большей частью это будут пробы и мусор, и готовых изображений получится несколько десятков, но все равно - это дешево и удобно, по сравнению с наймом художника и даже с поиском подходящей иллюстрации в интернете.

Работает эта штука через бот в дискорде. По умолчанию у вас есть 25 бесплатных попыток. Советую не тратить их бездумно, заглянуть на https://www.midjourney.com/app/feed/all/ и посмотреть примеры "правильных запросов", поэкспериментировать с ними, меняя разные параметры. Большое значение имеют ключевые слова, вроде "photorealistic, concept art, intricate detailed,3D character design ,8K," и т.д. Можно делать рисунки в стиле разных художников, вроде эскизов разных устройств от Леонардо и т.п.

Минусы:

- Нужно знать инглиш, хотя бы на полу-интуитивном уровне. Ну или гугл в помощь.

- Заставить сетку сгенерировать именно то, что у вас в голове непросто. Думаю, стоит сразу забыть о сложных сценах с участием нескольких персонажей. Но с простыми концептами она справляется на "ура".

- Пожирает много времени, которое можно потратить на проду.

Примеры моих первых попыток:

Лицо пожилого священника (прототип - Хью Лори) глазами младенца (немного доработал фотошопом). Давно мечтал сделать эту картинку, но заказывать было западло )))

close up very old Hugh Laurie with big nose, wrinkles and white hair, intricate stunning highly detailed man by artgerm and RHADS, portrait, soft studio lighting, ultra realistic, photorealistic, octane render, unreal engine, hyper detailed, volumetric lighting, hdr, fantasy, 4k, 8K --no beard --ar 3:4 --test --creative --upbeta --upbeta


Футуристичная яхта.

sci-fi futuristic yacht, cinematic lighting, intricate filigree metal design, ultra realistic, photorealistic, unreal engine, hyper detailed, fantasy, 4k, 8K

- Подводный мир, в котором живут русалки

mermaids in the underwater reef

- Плавающий в океане риф, на котором они живут

underwater island floating in the deep sea, colourful reef, water surface, clear water, photography, intricate details, highly detailed, 8K, cinematic lighting, realistic, photo realism, sharp focus, unreal engine

Падающие на дно обглоданные кости кита. Обратите внимание, что в тегах присутствует Ханс Гигер )))

pile of fish skeletons and whale bones and skulls falling down in the deep sea, giger, biopunk, photo realism, unreal engine, 8k

Плавучий остров с огромной башней.

Механический паучок (Широ!)

Для себя сделал вывод, что сервисом буду пользоваться часто. Результаты хорошие, времени тратит не больше, чем на поиск иллюстраций в интернете, можно работать даже с телефона, никаких проблем с авторскими правами, стоимость вполне приемлемая (на все эти эксперименты я потратил примерно пять долларов, при том что поначалу ничего не смыслил в этом деле).

UPD. Есть еще нейронка Stable Diffusion, которую можно установить на комп совершенно бесплатно, если у вас есть мощная видюха.

Помощник для подбора заклинаний тегов:

https://midjourney-prompt-helper.netlify.app/?ref=dtf.ru

+199
4 776

59 комментариев, по

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.

rusich_alex
#

интересная идея и красивые примеры

с какого примерно раза получается что-то вменяемое?

 раскрыть ветвь  9
Леонид Демиров автор
#

да просто лучше взять готовый пример (похожий) и переделать под свои нужды. Яхта у меня получилась с третьей-четвертой попытки. Но было дело, что я долбился над одной картинкой раз двадцать и так ничего и не получил ))) Это должна была быть девушка с мышиными ушками )) но нейронка мне просто рисовала дохлую мышь. постоянно.

 раскрыть ветвь  8
SoByX
#

Буквально два дня назад начал выкладку, только потому что, в ней сделал себе обложку. 


Даже несмотря на то что картинка получилась мыльной, размытой и "дымчатой", мне очень понравилось. 

 раскрыть ветвь  0
Елена Бабинцева
#

могу ещё нейронку посоветовать: https://neural.love

Качество уступает Миджорни, но там можно баловаться сколько угодно 

 раскрыть ветвь  0
Arachniddeus
#

Я:

Блин, делал внешность разных персонажей. Хоть на обложку книги ставь)

И Леонид такой:

 раскрыть ветвь  0
Иннокентий Белов
#

Круто!

 раскрыть ветвь  0
ИИС
#
 раскрыть ветвь  5
Александр Вер
#

а что это за програмерские строчки? так и должно быть? как их юзать?

 раскрыть ветвь  4
Феликс Райт
#

Особо отчаянные пираты могут забить на подписку, и создавать новые аккаунты в ДС на каждые 25 изображений ¯\_(ツ)_/¯

 раскрыть ветвь  0
Соловьёв
#

Пожалуй придется вычёркивать учёбу на любые работы связанные с картинками и иллюстрациями и уходить в садовники.

 раскрыть ветвь  4
Игорь Бобель
#

"Переквалифицируюсь в управдомы!" (с) 😉 

 раскрыть ветвь  0
Леонид Демиров автор
#

Не думаю, нейросети упростят работу, но не заменят художников полностью. Во всяком случае, это произойдет очень нескоро. Даже эта программа не способна пока справляться со сложными запросами, подходящий вариант приходится выбирать из десятков "попыток" или дорабатывать в фотошопе. Сейчас все автоматизируется, есть даже программы, которые пишут компьютерный код или создают вполне осмысленный текст. В 3Д тоже идет тенденция уже не модели создавать, а универсальные "конструкторы", например, генераторы зданий, трубопроводов, улиц и т.д. Это не отменяет человеческого труда, зато дает возможность художникам производить больше контента за меньшее время.

 раскрыть ветвь  2
Андрюс Ли
#

Нейросеть – звучит, конечно, пафосно, но что касается создания изображений этой самой сетью, то здесь виден вполне себе понимаемый механический процесс, построенный на компиляции изображений, разумеется, учитывающий реальную технику художников-реалистов (цвет, тень, пропорции и тд.). Более того, если вы начнете внимательно рассматривать детали полученных артов, то вскоре поймете очевидную накладочность фото-объектов, подобную той, что делается в Фотошопе. 

Строго говоря, любой из нас может использовать аналогичную "методику рисования". То есть, открывайте Фотошоп, составляйте из вырезанных картинок композицию, а затем подбирайте общий цвет. тон, чтобы все сливалось в едином колорите. До кучи смазывайте края картинок блюром – и получайте результат... Причем вы сделаете это гораздо лучше, ибо вам не придется подбирать набор мучительных фраз, чтобы получить от этой так называемой "нейросети" нужную иллюстрацию.

А в целом, "эта сеть" напоминает мне проект Сколково. Шуму о новых технологиях, а также искусственном интеллекте - дофига, а результата толкового нет. Зато денег просят много на свое интеллектуальное чудо, под разговоры о тех. прорыве в области фантастических открытий…

 раскрыть ветвь  15
Дмитрий Толстиков
#

Сколько часов нужно на обучение работе в фотошопе человеку, который никогда его не открывал? А сколько часов нужно на обучение подбору тегов запроса для нейронной сети? Я работал как с фотошопом, так и с нейронкой (это была stable diffusion). При желании я могу получить красивый арт для своей книги за вечер при использовании нейронки. В фотошопе тоже самое я буду рисовать неделю, если не месяц. При том, что у меня есть графический планшет и много опыта. Так что я не сказал бы, что всё настолько плохо, как вы говорите. Современные нейронки довольно плохо работают на некоторых запросах и у них много недостатков, но в некоторых случаях они реально могут быть полезны.

 раскрыть ветвь  4
Леонид Демиров автор
#

Вы несправедливы. Нейросеть не просто "хранит в памяти кучу картинок и компилирует их". Нейросеть создает многомерное пространство, в форме которого закодированы все эти образы. Да, мы пока только изучаем эту технологию, но наш мозг работает по тем же самым принципам. Это и есть творчество, теперь машины способны создавать что-то новое, пусть и не обладают пока достаточной осознанностью, чтобы этим процессом управлять и мотивацией, чтобы вообще хотеть что-то делать ))) И да, какой-то мере, внутри этих нейронок закодировано наше коллективное художественное бессознательное. Так же как и в мозгу любого хорошего художника и дизайнера.

Нейросети - это серьезный технологический прорыв, который довольно сильно меняет мир и еще изменит в ближайшие годы. Деньги... Вы же в курсе, что все это запускается на дорогущих видеокартах которые потребляют немало электроэнергии? И да, разработка нейросетей - это работа. Говорю, как человек, имеющий реальный опыт в этом деле. Вам же платят за вашу работу, я надеюсь? Но я согласен, что могут иметь место попытки распилить бюджет, прикручивая ИИ в неподобающие места, как и проблемы с тем, что многие проекты просто нежизнеспособны, как это было с распознаванием снимков МРТ, например. Это банальная проблема отсутствия качественных данных, множественных дубликатов, из-за которых смешивается обучающая и проверочная выборки и т.д.

Но с тем же успехом можно предложить пользователям фотошопа не парить себе мозг кучей разных команд и открыть пэинт, где все просто и понятно ))) ну и так далее вплоть до настенных рисунков из каменного века ))

 раскрыть ветвь  5
ari
#

Нейросети не используют бд с "картинками", они строят базу весов-связей, именно поэтому нейросеть обученная на десятках петабайт изображений будет иметь небольшую по весу базу (относительно объемов обучения), из этой базы нельзя восстановить исходные картинки ибо это не способ компрессии (даже с потерями). Картинки тут приведены только для примера. И да, использованная - склеивает картинки, как и почему она это делает - известно только нейросети, так "сложились" веса. И нет, нейросети не заменят иллюстраторов

 раскрыть ветвь  3
Sergeylar
#

В интересное время живём....

 раскрыть ветвь  0
Елена Станиславова
#

neural.love иногда даёт хорошие результаты. Я на неё переключилась.
Она бесплатна и позволяет делать одновременно 20 квадратных картинок.

Да, куча шлака (у midjourney тоже), но если долго мучиться, что-нибудь годное точно получится. 😉 

 раскрыть ветвь  0
BITUNIURAN
#

Эм это конечно же хорошо. Но что делать людям сейчас, когда идëт такая... ситуация? Где нельзя перевести деньги с рублей на доллары. И если даже можно, то как подключить росийскую карту к американскому сайту? Который точно не будет принимать еë из за санкций или типо того. 

 раскрыть ветвь  2
Леонид Демиров автор
#
 раскрыть ветвь  1
zagurdoger
#

Нейросеть работает примерно как дешёвый художник-иллюстратор из какого-нибудь издательства АСТ: ищёт в интернете картинки по запросу, компилирует и обрабатывает.

 раскрыть ветвь  1
Леонид Демиров автор
#

Не совсем. Почитайте в интернете, что такое генеративно-состязательная нейросеть.

 раскрыть ветвь  0
S.Khar
#

Похвастаюсь:

Рейсфедер, тушь. Когда-то умел рисовать, доо 😏 Но это действительно очень долго делается.

Для некоторых своих текстов вытаскиваю иллюстрации из торрентовой "подшивки" "Техники - молодёжи" типа вот такой, например:

 раскрыть ветвь  3
Леонид Демиров автор
#

Подшивка "порнография-молодежи" )))

 раскрыть ветвь  2
volkodav0099
#

Годно и интересно 

 раскрыть ветвь  0
Spawner
#

Для Stable diffusion есть коллабы, где можно бесплатно гонять картинки.

Еще хорошая статья по нее на хабре, как можно из кусочков разных картинок собирать цельную композицию (постепенно): https://habr.com/ru/post/685848/


Вообще то, что делают эти нейросети поражает. Это наверное похоже на то время, когда зарождалась фотография, и художники были недовольны :)

 раскрыть ветвь  0
Vlad75
#

Паучок как родной, остальное... похуже, скажем так.

 раскрыть ветвь  0
Александр Вер
#

Спасибо. Ценно!

 раскрыть ветвь  0
waltage
#

а насколько ускоряет выдачу качественного продукта 3д болванка сделанная ручками?

 раскрыть ветвь  1
Леонид Демиров автор
#

Нейросеть будет пытаться повторить не только композицию и позы, но и стиль с цветовой гаммой. Так что болванка из блендера скорее всего испоганит результат. Лучше брать похожую по стилю картинку или фотошоп-коллаж, пусть даже топорный.

 раскрыть ветвь  0
Написать комментарий
33K 7 276 28
Последние комментарии
69 / 195
Громов Александр Николаевич
Вопрос по Стругацким
33 / 33
Vrednaya Lisa
Туц-туц! Мы возвращаемся)
10 / 10
Волынец Олег
Почему Дугин философ-идиот.
15 / 15
Sango
Доброе утро от Санго
6 / 6
Радислав Лучинский
Реактор сам себе интервьюер
7 / 7
Ярослав Кирилишен
Миниатюра: Голос камня
121 / 121
Николай Берг
Кто чаще становится жертвой мошенников
55 / 55
Владимир Лещенко
Наконец то начали разбираться с алкашом и дегенератом...
79 / 79
Серёжа Конформист
Разводов бояться - в рот не давать
49 / 489K
Мерлин Маркелл
Флудилка
121 / 121
Игорь Волков
Игра на троих. Почти без правил!
3 / 3
Ребекка Попова
ММКЯ на ВДНХ
10 / 10
Роман Афанасьев
49. Новая глава
5 / 5
Владимир Чекмарев
Рулька как закуска
489 / 493
Лев Вишня
Начинают с СССР и заканчивают всегда Россией
1 / 1
Алена Алексеенко
Рецензия на роман «Алтарь для Спящего бога» — Аня Кузнецова
4 / 4
Николай Юрчиков
Прыжковый двигатель Айзека Азимова
1 / 1
Дмитрий Виз
Квадроциклы . Что бы, не Замёрзла...
2 / 2
Александр Эйпур
Инопланетяне делятся знаниями с землянами. Ютуб
6 / 54
С. Г. Малиновски
А теперь Алушта
Наверх Вниз