Эксперимент с иллюстрациями 11 (нейросети)
Автор: Милослав КнязевПродолжаю эксперимент. Возможно, кому‑то это будет полезно: в основном это сравнение того, как разные сети рисуют по одному и тому же промту (с раскрытием некоторых хитростей). Некоторые выдают похожие результаты, а некоторые — совсем непредсказуемые.
Кстати, если у вас есть опыт работы с другими нейросетями, кроме перечисленных, — делитесь! Если перечисленные дают результат, отличный от моего, — тоже пишите, интересно узнать.
Предупреждение: немного спойлеров, поскольку пятая глава «Товарища Грозы» выйдет только вечером.
При написании черновиков к пятой главе я сразу иллюстрации не делал. Поэтому варианта «как, по‑моему, должно быть» не будет. Сразу перехожу к результатам работы разных нейросетей.
ChatGPT, прочитав всю главу целиком, предложил вариант со съёмной квартирой — и очень неплохо её нарисовал, если не считать абсолютной непохожести персонажей. На этот раз он категорически отказался менять их по референсам. Максимум, что удалось добиться, — изменения цвета волос. Но только цвета: длину он всё равно оставил не такой, как нужно.

А вот как Грок представляет себе помнящую лучшие времена, но всё ещё огромную и шикарную квартиру. На первой картинке — то, что он нарисовал, прочитав главу (кстати, предложил тот же вариант, что и ChatGPT). На второй — то, что он сделал не в чате, а в картинках по своему промту (без огромной разницы, как бывает обычно). Третий вариант — то, что он сгенерировал по промту от ChatGPT.



Это Copilot рисует по промту от ChatGPT. Откуда здесь шутовской колпак на персонаже? Он перетащил его из предыдущей главы. У Copilot есть такая особенность: добавлять в новый промт что‑то из старого.

Если кто‑то думает, что способностью «перетаскивать» детали из старого промта в новый грешит только Copilot, то вы ошибаетесь. У Gemini с этим огромные проблемы. Если промты хоть чем‑то похожи, есть шанс, что она будет рисовать по ним одинаковые или почти одинаковые картинки, игнорируя все отличия.
Вот первый промт — вроде бы от ChatGPT, а второй — вроде бы от Грока (или наоборот). Все остальные нейросети эту разницу уловили, а Gemini — нет.

У Fotor, как обычно, своё видение ситуации: например, Маргариту Орлову он сделал совсем маленькой девочкой. Но в остальном, как ни странно, более‑менее придерживается промтов.

Зато Леонардо на этот раз нарисовал совсем неплохо. А по промту от Грока он справился даже лучше, чем сам Грок.

У французской Mistral Маргарита, как ни странно, тоже получилась маленькой девочкой. К тому же картинка всегда получается только в горизонтальном формате. Не исключено, что есть и другой вариант, но я его не нашёл.


Qwen 3.7 Plus на этот раз тоже неплохо следует промтам — и от ChatGPT, и от Грока, — правда, со своими особенностями. И, как я уже не раз говорил, что бы вы ни писали в промте, он всегда делает горизонтальный вариант.


SeaArt на этот раз довольно неплохо придерживается того, что задано в промтах.


Perchance, как всегда, в своём неповторимом стиле. Но, как ни странно, тоже следует обоим промтам — особенно первому.
Bestphoto на этот раз работала только с промтом от Грока. Не сразу понял, почему она не принимает некоторые промты, — оказалось, из‑за размера: у ChatGPT они слишком длинные.

У какой из сетей, по вашему мнению, получилось лучше? Какие используете лично вы? Если хотите, можете попробовать со своими сетями сделать то же самое — я вышлю тот же самый промт. За хорошие картинки — хорошие лайки!