Опять о нейронках
Автор: ДокторТрадиционное «если не надоел».
Продолжим разговор о нейронках. В частности, о такой сетке, как Grok. В настоящее время эту НС чаще воспринимают не как полноценный инструмент для создания изображения и видео на их основе, а как AI-ассистент. То есть чат. Либо генератор мемного и разговорного контента, а уж затем — как полноценную визуальную платформу.
У Grok, конечно, имеется функция генерации изображений и видео. Он активно подтягивается за лидерами и можно сказать, дышит им в спину, но… Если сравнивать именно как инструмент для книжных иллюстраций (уж извините, кто о чём, а я о своём, о писательском), то есть создания кинематографического изображения, либо AI-видео, то такие платформы как Midjourney, Runway, Kling, Leonardo, Flow/Veo намного сильнее и стабильнее как специализированные визуальные системы.
У Grok на данный момент слабее экосистема, меньше профессиональных инструментов, почти нет полноценного пайплайна под production, слабее функции запоминания референсов (control consistency) персонажей и пока уступает в плане создания полноценного видео.
Вместе с тем, махнуть рукой и, пренебрежительно сплюнув, заявить: «ну его, этот Grok, пусть подрастёт сначала», нам не позволят несомненные плюсы, имеющиеся у этой системы.
Во-первых, у этой НС намного более мягкие фильтры по сравнению с Flow, Midjourney, Firefly. И здесь вас не будут гонять тапком как зашуганного таракана из-за того, что цензурирующие фильтры вдруг углядели на жарком пляже тушку, снявшую скафандр высшей защиты и (о ужас!!!), выставившую напоказ голую коленку.
Grok неплохо «держит» юмор, сарказм, гротеск, «странные» сцены. По этой причине его любят авторы фантастики, люди, создающие мемный контент, комиксы и вообще те, кого на иных платформах цензурирующие фильтры гоняют мокрыми тряпками из-за безобидных сцен, тупо отвергая объяснения о том, что это, на минуточку, юмор. Ему литературные персонажи, фэнтезятина и научно-фантастический абсурд ближе, чем, например, стерильному Firefly.
Есть и ещё один плюс, хоть и неявный для нас. Grok интегрирован с X/Twitter, что позволяет быстро делать контент, постеры, мемы, иллюстрации. Правда сейчас это касается в основном западной аудитории, но не вечно же мы будем конфликтовать с Западом. Возможно, западные политики возьмутся за ум (сомневаюсь, конечно, что возьмутся, но чем чёрт не шутит) и тогда можно будет нормально общаться.
Если подвести краткий итог, что можно с уверенностью сказать, что Grok сейчас — крепкий и очень интересный универсал. При этом у иных известных платформ весьма заметна специализация:
— Midjourney — художник;
— Runway — видеомонтажёр;
— Kling — оператор;
— Flow/Veo — режиссёр;
— Leonardo — художник-постановщик (production artist).
У Grok, конечно, нет такой чётко выраженной специализации, но… Все перечисленные «специалисты» — с высокой степенью вероятности доведут до валидола любого писателя, который вдруг вознамерится изобразить с их помощью иллюстрацию к своему произведению, если эта иллюстрация по сложности восприятия художественных форм сложнее лежащего на дороге кирпича.
У большинства из них цензурирующие механизмы просто параноидальные шизофреники, и блочат там, где при пристальном рассмотрении нет ничего запретного даже для девочки-десятилетки из монашеского ордена.
Именно поэтому могу сказать, резюмируя сегодняшний разбор, что Grok может быть весьма полезен, а в некоторых случаях незаменим для авторов из-за менее истеричных фильтров, хорошего понимания юмора и нормального восприятия авторских «странностей», выплёскиваемых в промпт при создании артов и иллюстраций…
И не стоит нашего «середнячка» сбрасывать со счетов. Он обязательно найдёт отклик в сердцах многих создателей «нестандартного» контента (не запрещённого, а именно нестандартного, то есть фэнтези, sсi-fi, всяких там уся и дорам).