Вести с полей (2023-11-18)
Автор: Константин БояндинЗа прошедшее время Stable Diffusion успел приобрести следующую версию (2), а затем и ещё одну (XL). В самом Stability.AI тоже не тратят время зря, но об этом отдельный разговор.
Технически сложно составлять методичку по этой отрасли алгоритмов нейронных сетей — как минимум потому, что тогда нужно заниматься этим и только этим. Технические вопросы я частично освещу в следующем посте, а пока просто перечислю то, что интенсивно изучаю и осваиваю: Hypernetworks, LoRa, ControlNet, DeForum. Если вам эти названия что-нибудь да говорят, у вас вполне могут быть идеи, чем я занимаюсь, и о чём могут быть относительно отдалённые новости на эту тему.
Итак, о делах. Помимо прочего, я стараюсь следить за выпусками новых моделей для SD (в данный момент я буду говорить о последнем стабильном выпуске, SDXL). Помните, шёл разговор о том, что одна из типовых сложностей двигателей "создай картинку по описанию" — анатомия. Моделям крайне сложно справиться с тем, как выглядят живые существа (притча во языцех, все эти лишние пальцы, ноги, и неестественно размещённые суставы). Что ж, тут прогресс тоже не стоит на месте: помимо возможности корректировать такие вещи (Refiner, ADetailer) появляются и модели, где уроки анатомии изучены ощутимо лучше. Примеры работ одной такой модели ниже. Последняя картинка иллюстрирует, что в принципе модель умеет конструировать что-то человекоподобное по описанию, даже если у модели нет богатого материала на эту тему (когда посмотрите последнюю картинку в секции ниже, поймёте).
Новое поколение
Знахарка
Женщина в шали
Балерина
Девочка с мячиком
Поклонница аниме
Шахтёр
Из архивов Исторического общества Аркхема
Робот Виталий
Порой бывает так, что конструируешь обложку для одной книги (сейчас это "Реплика"), а натыкаешься на другую. Пример ниже — обложка для другой книги. Если вы примерно оценили, где такое могло быть, то догадываетесь теперь, куда подойдёт такая иллюстрация:
Армия тьмы
Говоря о тьме, во время экспериментирования получилось несколько жутковатых изображений. Серьёзно, если у вас хорошее и бойкое воображение, то часть картинок ниже лучше не смотреть. Вас предупредили.
Превращение в камень
Осталось семь дней
За пять секунд до пробуждения от кошмара
Восставшие из ада
Человек-груша
Иной раз получаются просто интересные виды. Некоторые такие я распечатываю в хорошем качестве — чтобы повесить на стену, в подобающей рамке.
Дорога к порталу
Песчаный замок
Три картинки ниже примечательны тем, что их выдали в ответ на очень общее и краткое описание ("whimsical masterwork by head of prompt engineering" — "причудливый шедевр руководителя разработчиков описаний"):
Вариант 1253
Вариант 1269
Вариант 1367
Такие дела. Едем дальше.