А ваши Миджорни и Далл-и так могут?

Автор: Алексей Сысоев

Это изображение девушки в хорошем качестве с разрешением 4к получено через несколько генераций из маленького. Первоначальный вариант был, по-моему, 800 пикселей по ширине. И создал это Stable Diffusion.

Когда оно получилось, я окончательно понял масштаб мировой трагедии, что все сели плотно на далли и миджорни, которые имеют кучу ограничений, работать с изображением свободно не дают, и вообще много чего не умеют. Но понимаю, так случилось, потому что они на слуху, они были первыми, но ребята, они полностью коммерческий проект что сильно их портит. Про Stable Diffusion мало знают, он не на слуху, не понимают, как им пользоваться, а если знают, думают ну так он же бесплатный значит хуже. Каюсь, я сам поначалу так думал, но решил попробовать, потому что из-за чрезвычайно разумной и взвешенной политики наших крайне славных руководителей, у нас теперь не так много вариантов, и проще было установить что-то на комп, чем пытаться зарегистрироваться в openai.

В Далл-и, ограничения, можно сгенерировать 50 изображений в день. Причем по 4 маленькие картинки. И как с этим работать и как так жить, объясните мне? Миджорни лучше, но работает через дискорд, это странно, неудобно, сидишь там команды вводишь, как юный программист, чтобы хоть что-то получить. И каждая генерация даже в 4 маленькие картинки требует ожидания минуты 2. Платная версия тоже имеет ограничения и по времени генерации, и по количеству картинок. И я не понимаю зачем вы страдаете и как работать в таком аскетизме.

Так вот Stable Diffusion не имеет никаких ограничений. При работе я могу за пару часов нагенерить несколько сотен изображений, чтобы добиться нужного, а за день бывает больше тысячи и все это бесплатно. Генерация 4 картинок в разрешении 512х512 занимает буквально секунд 10. Кроме того, в основном интерфейсе от Automatic1111 много возможностей. Можно работать с масками, можно расширять границы изображения, менять стили, делать генерацию по нарисованному от руки эскизу или что-то дорисовывать мышкой на ходу, создавать картинки разных разрешений и пропорций. И в том числе делать продвинутый апскейл несколькими способами, это будет не просто увеличение изображения со сглаживанием шума, а именно генерация недостающих деталей и пикселей нейросетью. Миджорни умеет делать апскейл, но я сомневаюсь, что с генерацией деталей. Так же у SD много расширений и скриптов, которые увеличивают функционал в десятки раз. Например ControlNet, который позволяет поставить сгенерированного персонажа в любую позу, либо создать карту глубины, и всякие прочие карты, которые удобно использовать для специфических задач. Короче, тут будет очень много букав, если описывать все, что может Stable Diffusion со всеми этими примочками.

Качество генерации явно не хуже, чем могут два его конкурента и, по-моему, иногда даже лучше. Уже сам факт, что есть настройки, позволяющие очень точно имитировать миджорни, говорит о многом. И да, пальцы? Ха, в сд это все запросто решается если для генерации использовать анатомически правильные модели.

Стоит оговорится, что все вышеописанное относится только к SD, установленному на компьютер. Но в этом нет ничего сложного и для этого не нужен прямо супер мощный компьютер.

Если у вас не древний ноутбук, а ПК хоть с какой-то не сильно старой видеокартой, вы можете поставить Stable Diffusion себе на компьютер, не страдая от ограничений, эта нейросеть будет жить у вас на диске и генерить ядрами вашей видеокарты. И там важнее видеопамять, чем производительность. Достаточно 4 гигабайт видеопамяти (не оперативной, а именно памяти, установленной в видеокарту). Карте, конечно, желательно быть поновее, чем 10 лет, но если худо-бедно тянет игры, то и с SD должна справиться. 8 гигабайт уже достаточно чтобы почти ни в чем себе не отказывать. 10 секунд на генерацию выдает достаточно мощная видеокарта, ну какая-то совсем средняя будет справляться за 30 секунд или около минуты, и разве это проблема? Это всегда минуты, не часы.

Если же видеокарты нет, комп плохой и вообще не вариант. То существует всякие онлайн версии, там уже конечно есть определенные ограничения, но есть возможность работать через облако гугла, я про это мало что знаю, но видел на ютьюбе много роликов, как этим пользоваться. Поищите.

Так же важное замечание, что надо пользоваться не той моделью генерации, что стоит часто по-умолчанию версии 2.0. Лучше переключиться на 1.5. Она старее, но не цензурирована, лучше обучена. Хотя и 2.0 иногда можно использовать для специфических задач. И на ютьюбе вообще много уроков, как и что, как этим пользоваться, советов, посмотрите, если испытывайте затруднения и вопросы.

Вообще, конечно, не хотел тут ударяться в инструкцию, как и что, слишком много текста, хотел только сказать, что есть такая вот бесплатная нейросеть, которая может больше, чем все платные вместе взятые, и которая удобнее в использовании, имеет нормальный интерфейс, ее можно поставить себе на компьютер, что дает больше удобства.

Обычно Stable Diffusion устанавливается заморочно, но один программист не поленился и сделал удобно. Просто скачивайте установщик и он в один клик ставит все библиотеки, питоны и прочее. Займет чуть больше 20 гигабайт, устанавливается не быстро.

https://github.com/serpotapov/stable-diffusion-portable

stable diffusion, иллюстрация, нейросети, нейросеть, размышления

+32

631

0 комментариев, по времени, по убыванию времени, по возрастанию популярности

0 комментариев, по
времени, по убыванию

времени, по возрастанию

популярности