Пробую Grok в качестве генератора иллюстраций (с примерами)
Автор: SangoРешил продолжать пробовать разные сервисы и платформы по генерации изображений. Во всяком случае пока есть настроение и желание этим заниматься. Ну и интересно посмотреть кто во что горазд, особенно из крупных игроков рынка.
На прошлой неделе у меня был ChatGPT, а ныне я решил чутка пощупать Grok. Причем именно что чутка, взял учетку всего на неделю, чисто поиграться.
Обозначу ключевые моменты по поводу генерации картинок, которые сам для себя выделил:
- качество генераций. По сравнению с тем же ChatGPT оно заметно слабее и проще. Я не экспериментировал прямо уж очень шибко со стилями и промптами, но то что на один и тот же запрос выдает ГПТ и Грок… там где у ГПТ эстетика и качество, у Грока упрощение и скачки стилей. И с надписями (по крайней мере на русском) все грустно. И вообще Грок у меня вызвал прямо некоторую аналогию с сервисом perchance (о котором тоже ранее писал). Качество к слову получше (во всяком случае косяков меньше, хотя порой попадаются), но со стилями работает как мне кажется немного похуже.
- понимание русского языка, так как все запросы писал на нем. Заметил что иногда Грок автоматом переводит запрос на английский, а иногда нет. Может быть в языке и кроется проблема качества, но ГПТ прекрасно работает на русском, да и чат Грока тоже вполне сносно обрабатывает русскоязычные запросы, так что скорее всего дело не в этом.
- скорость генерации. Тут ситуация кардинально обратная. Пока ГПТ будет с потугами рожать вам один арт, Грок сделает их десятки. Может даже под пару сотен. Причем вам даже нажимать ничего не надо, только колесико мыши крутить (как понял как раз при проступке страницы с генерациями инициируются новые генерации). Судя по всему (и как мне подсказали) такая ситуация сделана целенаправленно. Уменьшено качество в угоду скорости и количеству.
- цензура. Знаете… с одной стороны по вседозволенности до того же perchance не дотягивает, но с другой стороны ГПТ однозначно превосходит. Дамы в бикини и чулках? Пфф, можно без чулков и даже без бикини. Хотя в целом Грок рисует достаточно просто, шаблонно и однотипно. Во всяком случае паки иллюстраций которые генерируются во многом однотипны и похожи один на другой, с небольшими различиями.
- видеогенерации. Вот это наверное самое интересное. Причем лично мне интереснее было даже не сгенерировать видео с нуля, а анимировать готовое изображение. Но тут тоже есть нюансы. Анимирование работает долго, несколько десятков секунд, при длине ролика в 6 или 10 секунд. На анимирование как раз работают достаточно жесткие цензы по недопустимому контенту в плане поз, действий, обнажений. Что забавно, если анимировать сгенерированную тем же Гроком иллюстрацию - там ограничений меньше, а вот если загрузить со стороны - много чего не сделаешь (подозреваю что это механизм защиты от производства дипфейков). По дефолту Грок анимирует так как ему взбредет в «голову», и для получения нужного результата нужно ручками писать что хочешь увидеть. Ну и качество опять же. Не отстойное, но и не сказал бы что самое крутое. Плюс хорошо анимирует ток близкое к реализму или у аниме. Если анимировать например скетч или акварельную картинку - поедет стилистика и будет явно видно что система в этаком роде просто пытается натянуть маску стиля на обычное видео. По крайней мере мне так показалось. Ну и на генерации видео существуют некоторые лимиты, совсем непрерывно клепать их не получится, надо будет делать паузы. На картинки кстати я такого лимита не ловил, хотя и не скажу что прямо таки много генерировал. Тут Грок явно дает фору ГПТ.
Впрочем чтобы не быть голословным. Попросил у самого Грока сделать 10 промптов для генерации в разных стилях. Само собой - с полуодетыми (то бишь полураздетыми) барышнями. На качество генераций смотрите сами:










И в принципе вышло даже очень недурно, особенно в реализме и в аниме. Хотя не все стили на мой взгляд выдержаны качественно. И композиции в целом простые, ГПТ проявлял больше творчества и фантазии что ли.
Что касается анимирования, то решил взять некоторое количество картинок которые ранее делал в GPT и анимировать их. Сперва думал конвертировать результаты в гифки, но качество пипец как терялось чтобы уместиться в максимально допустимые 5 мегабайт. Потому просто слепил все анимации в один видос и залил его в ВК. Результат ниже (со звуком, правда местами озвучка на мой взгляд странная и стилистически не подходящая):
https://vk.com/video867192699_456239100
Давайте кратко подытожу. Если в иллюстрациях вам нужны стилистика, качество, детали, надписи, если вы профессионально или полупрофессионально клепаете облоги-арты и все такое прочее - Грок вам очень вряд ли подойдет, смотрите лучше ГПТ. А вот если нужен быстрый простой контент без совсем уж сильных притязаний на качество и стилистику - можно посмотреть в эту сторону. Генерит много и реально быстро. Ну и если вы хотите оживлять картинки - тоже может помочь с этим делом. Как-то так.