Эксперимент с иллюстрациями 12 (нейросети)
Автор: Милослав КнязевПродолжаю эксперимент. Возможно, кому‑то это будет полезно: в основном это сравнение того, как разные сети рисуют по одному и тому же промту (с раскрытием некоторых хитростей). Некоторые выдают похожие результаты, а некоторые — совсем непредсказуемые.
Кстати, если у вас есть опыт работы с другими нейросетями, кроме перечисленных, — делитесь! Если перечисленные дают результат, отличный от моего, — тоже пишите, интересно узнать.
Предупреждение: немного спойлеров, поскольку шестая глава «Товарища Грозы» выйдет только вечером.
Сначала — то, что я хотел сделать изначально. Ещё при написании первых черновиков я задумывал эти иллюстрации. Предупреждение: заходить только тем, кто никогда не был в Одессе. Тем, кто там был, тоже можно — если хочется посмеяться.
Все эти картинки делались с помощью Грока. Я просто брал изображение, где персонажи стоят втроём, и просил поменять фон, добавить одно, убрать другое и так далее. И вот как, по мнению Грока, должна выглядеть Одесса в конце января 1942 года.
Первая картинка ещё более‑менее: обычное фотоателье, оно может быть каким угодно. Но для непонятливых лучше написать на стене, что это фотоателье именно того года.

Дальше начинается самое интересное. Это, если кто не понял, бюст Пушкина. Я не знаю, как он выглядит в Одессе и есть ли он там ещё, но подозреваю, что не совсем так.
Ещё одна особенность некоторых нейросетей: я велел одеть героинь в шубы, а товарища Грозу — в пальто. Но Грок зачем‑то нарядил его в шинель, а шубы на девушках сделал распахнутыми — чтобы точно было видно, что у них под ними.

Потом он переодел персонажей нормально, в гражданскую одежду, но с Пушкиным всё равно что‑то не то. Фон сзади Грок тоже иногда меняет, но я сильно подозреваю, что любой его вариант имеет мало общего с настоящей Одессой — даже в сорок втором году.

Следом идёт трофейная пушка с фрегата «Тигр». Я, конечно, не большой специалист по артиллерии, но тоже сильно сомневаюсь, что на кораблях тогда ставили такие пушки.

Попытался попросить переделать пушку поближе к историческому варианту. Мне особенно нравится вариант с чисто английской символикой. Последняя картинка уже ближе к теме, хотя, скорее всего, пушка стоит не там, где положено.

Если кто не знал, это памятник Дюку Ришелье — как раз на Потёмкинской лестнице или рядом с ней. Во всяком случае, Грок уверен, что именно так он и должен выглядеть.

А это уже сама Потёмкинская лестница и вид на замёрзший, разгромленный Одесский порт. На первой картинке Грок опять забыл переодеть персонажей в зимнюю одежду.

И только тут примерно то, что я хотел получить. Хотя сильно подозреваю, что настоящая лестница выглядит не совсем так.

Ну а дальше пойдёт эксперимент с иллюстрациями от разных нейросетей по одним и тем же промтам. На этот раз промты будут от трёх сетей: ChatGPT, Грока и Copilot.
И снова то же самое предупреждение: людям, которые никогда не были в Одессе, можно смело заходить, а тем, кто был, — лучше либо не стоит, либо, если очень хочется посмеяться. Потому что другие нейросети тоже представляют Одессу довольно своеобразно.
На первой картинке ChatGPT постарался и собрал всё в кучу: и современное название бульвара, и пушку с фрегата «Тигр» под ноги к Ришелье, и фотографа, который направляет объектив на зрителя, а не на объект съёмки. Ну и Савелий Петрович из прошлой главы тут тоже зачем‑то присутствует.
Во второй попытке ChatGPT исправился: бульвар назван так, как нужно для той эпохи, фотограф стоит там, где надо, и целится куда следует, герои вроде бы правильно расположены, и даже памятник похож на настоящий.

Зато герои на самих себя не похожи. От попытки сделать их по предложенным референсам ChatGPT отказался, но по описанию хотя бы приблизительно подогнал — и они действительно стали чуть больше соответствовать образу.

А это то же самое нарисовал Грок, прочитав главу. Он также предложил вариант с Потёмкинской лестницей и видом на разгромленный порт.

Это он же, но уже не в чате, а в режиме генерации по своим же промтам.


А вот он же — по промту от ChatGPT: сразу видно, что результат намного лучше. Хотя откуда у него взялся памятник-всадник — тоже вопрос.

Ещё раз Грок — снова Потёмкинская лестница, но теперь по промту от Copilot.
Copilot сначала сгенерировал вот такую картинку, а потом предложил варианты с памятником Дюку Ришельё и с видом на разгромленный порт с Потёмкинской лестницы. Как по мне, последний вариант у него получился лучше, чем у других.


BestPhoto работал по промтам от ChatGPT и Грока. Сразу видно, чей промт сработал лучше. К сожалению, BestPhoto выдаёт только квадратный формат.



А это DeepChat: он даже гроковский промт сумел довести до ума. К сожалению, тоже делает только квадратные картинки. По крайней мере, в бесплатной версии — две картинки в день. За другие форматы и большее количество придётся платить.


Тут я забыл записать, где чей промт, но по картинкам нетрудно догадаться. Особенно оригинально получился памятник Дюка Ришельё по промту от ChatGPT.



Gemini как‑то странно отреагировала на промт от ChatGPT: герой прикладывает ладонь либо к пустому постаменту, либо прямо к памятнику без постамента. Видимо, она что‑то знает — например, о планах героя украсть этот самый памятник.

По промтам от Грока результаты тоже вышли не очень: особенно странно она нарядила Маргариту Орлову.

А вот вариант по промту от Copilot получился более‑менее нормально.

Здесь — просто SeaArt по всем четырём имеющимся промтам по порядку: ChatGPT, Грок, Грок и Copilot.




Первые две картинки — от ChatGPT и Copilot, вторые две — от Грока. Leonardo и сам по себе непредсказуем, а с не менее непредсказуемыми промтами от Грока получилось ещё страннее.


Французская Mistral — просто все варианты по порядку: ChatGPT, Грок, Грок и Copilot.




Qwen 3.7 Plus: одна картинка от ChatGPT и две другие от Грока. О недостатках Qwen 3.7 Plus я уже не раз говорил: он рисует только в горизонтальном формате и никак иначе. Самое интересное, я находил, как переключить его на вертикальный, переключал — и вроде бы он начинал рисовать вертикально, но окончательный результат всё равно выходил горизонтальным. У других видел от этой же нейросети нормальные картинки в разных форматах. Почему у меня не получается переключить — не знаю.



Perchance сделал картинки только по промтам от ChatGPT и Copilot. Эта сеть абсолютно бесплатна, безлимитна и работает довольно быстро. Но и качество соответствующее: иногда получается забавно, но чаще всего — ничего хорошего.
Эта сеть иногда рисует довольно оригинально, а иногда — не очень. На этот раз я попробовал только промт от ChatGPT — у меня там закончился лимит.

В Шедевруме я делал только промт от ChatGPT во всех трёх доступных мне сейчас версиях: 1.0, 1.5 и 2.7. Правда, версия 2.5 у меня недоступна (зависает на 10 последних секундах), а версия 2.0 — только по подписке. Кстати, у кого она есть, попробуйте сделать по моему промту — хотя бы узнаю, как оно там выглядит.



У какой из сетей, по вашему мнению, получилось лучше? Какие используете лично вы? Если хотите, можете попробовать со своими сетями сделать то же самое — я вышлю тот же самый промт. За хорошие картинки — хорошие лайки!