С большим трудом, но процесс идет
Автор: iskander-zombieВ общем, параллельно с доведением до ума самих текстов (черновые варианты все сделал, теперь отредактировать надо их), создаю иллюстрации. Если в работе с текстами претензий практически нет, то вот с картинками возникают "вопросики"... Gemini Pro в генерации изображений, как и младшая версия Gemini Flash - двоякое впечатление производит. Ну, там Imagen, строго говоря, генерацией занимается, но не суть - это одна система. Так вот, описания из текста он подцепляет фантастически круто, контекст держит, детали улавливает, в стили разные умеет, и даже по умолчанию подбирает почти всегда наиболее уместный стиль - всем бы хорош... Но главная проблема, по моим ощущениям - огромное количество цензурных рогаток и ловушек на пути. Особенно в том жанре, который мне интересен, и в котором я пишу истории. Хоррор, триллер, в т.ч. местами довольно-таки эротический триллер. Без обращения к сторонним инструментам - совсем тяжко было бы.
И я говорю отнюдь не про сцены графичного насилия с кровищей, или откровенной эротики с обнаженкой и сексом и всякого такого - тут-то понятно, что мейнстримные топовые генераторы в принципе таких изображений не делают. Я имею в виду даже вполне невинные (как мне казалось) сцены, которые нейронка наотрез отказывалась создавать. Из примеров: мне сетка отказалась генерировать реалистичного персонажа в камуфляже с автоматом или карабином, целящегося в пустой коридор (Цитата: "Глорификация насилия. Создание угроз или изображений, разжигающих ненависть. Генерация реалистичных изображений для дезинформации"). Отказалась создавать группу персонажей в балахонах с капюшонами на фоне зловещего света и жертвенного алтаря (цитирую: "изображения, связанные с ритуальными действиями, культовыми практиками или сценами, которые могут вызывать ассоциации с насилием и мистицизмом в негативном контексте"). Если убрать алтарь - тоже отказалась). Отказалась рисовать героиню, получающую экстатическое удовольствие от подписания смертных приговоров (там никакой эротики, если что, просто выражение наслаждения на лице - но сетка восприняла такое описание как "сексуализацию смерти и убийств"). И тому подобные примеры. Ограничения именно в визуальной генерации - тексты можно писать и анализировать почти какие угодно, в очень широких пределах. А в картинках очень "тупые" и широкие запреты, которые приходится изощряться, чтобы обойти. Это унизительно для пользователя и просто абсурдно. При вопросе "чозанах? 🤯", признает этот факт, кстати.
Надеюсь, в ближайшем будущем эта проблема будет решена в сторону более тонких методов ограничений - я прекрасно понимаю, из-за чего подобное анальное огораживание введено (долбоёбам и поехавшим нет числа), но столь тупую методику осуждаю категорически. Обойти иногда удается за счет корректировки запроса до более мягкого уровня (а это еще надо сообразить, ведь гадского робота еще и пытать надо, чтоб пояснил конкретные причины отказа) - а затем допиливанием картинки в других нейро-помощниках, более лояльных к пользователю. Агрегатор бесплатных нейрогенераторов LMarena неплох для этих целей, например - пока юзаю его. Это была минутка нытья. А теперь к делу. Некоторое количество картиночек к "Алому бархату", моему обожаемому и несчастному литературному проекту. :) Буду и дальше потихонечку выкладывать плоды трудов - иногда в хронологическом порядке, иногда вразнобой.
Эпизод 1, "Серебряный яд". 1913 год. Пожалуй, самая камерная и замкнутая из всех историй, с минимальным количеством персонажей (их всего двое - плюс статисты, которых я и рисовать не стал).
Наталья Шелехова.
Портрет в полный рост. Какой вариант с платьем выглядит удачнее? Первый кажется мне перекошенным на один бок, или я некорректно вижу перспективу...
Арсений Белогорский.
Шкатулка.
Романтическое свидание у камина. Референсом для нейронки, очевидно, выступили обложки любовных романов - поэтому лицо поэта-декадента неузнаваемо изменилось, и он стал стереотипным героем-любовником. Поправлять я не стал, поскольку даже и этот уровень эротизма удалось выжать из гуглосетки с некоторым трудом... ))
Домашний киносеанс и просмотр модной киноленты "Пражский студент", реальный кадр из которой и был использован. Взгляды героев обращены не на экран, как можно заметить. Будем считать это художественной условностью. Показать нормально и их лица, и экран одновременно в одной картинке мне не удалось.
Роковая погоня за призраком. Здесь был выбран совсем иной стиль изображения, но мне показался удачным.
Наталья потрясена шокирующей новостью, а зеркала начинают оживать.
Финальное решение.
В завершение - одна неудачная иллюстрация, которая показалась мне просто забавной. :) Будем считать это комедийным "неудачным дублем"...