Галлюцинации чата гэпэтэ
Автор: Андрей ЛисКонечно, ChatGPT не самый лучший инструмент для генерации картинок, но, как говорится, дарёному коню… ну, вы поняли.
Обещал поделиться галлюцинациями, что ж, делюсь. Пытаюсь генерировать сцены по референсам. Пока получается примерно 50/50. К примеру, вот эксперименты с таким референсом.
Как оказалось, в 2026 году пальцы людей всё ещё вызывают у нейросетей проблемы. А вы говорите Искусственный интеллект. Ага.
Плюс очень заметно, что GPT не понимает композицию сцены. И если понимать, что такое эти ваши нейросети, то в этом нет ничего удивительного или нового. Конечно же, с уточнениями и моими ручными правками удалось немного приблизиться к задумке, но так как пост о галлюцинациях, итоговый результат будет в другом посте.
Переходим к новому референсу.

Здесь поза попроще, и поэтому получилось почти хорошо с первого раза. Но чат гэпэтэ, явно оправдывая моё коверканье его названия, решил переломать пальцы персонажу. Да за что?
Конечно, это правится ещё одной генерацией.
Один раз удалось, видимо, затронуть наименее вероятностные связи ChatGPT, что он решил выдать прямо такое:
А вот этот референс отнял много нервов

Извернул бедную эльфийку.
Пока что могу сказать только одно: более простые позы генерируются по референсу без проблем. Если же композиция сложная и положение рук или ног не совсем стандартное, тут уже начинаются сложности. Если вносить правки вручную на картинке + уточняющие промты = получается более-менее неплохой результат. И вот тут, кстати, приходит в голову одна интересная мысль. А ведь все эти референсы поз так или иначе нарисовал человек. Человек с пониманием механики и анатомии...