О НейроХолсте, о том, как модели понимают нас и что они умеют, если не дорабатывать.

Автор: Кира Верещагина

Сначала о ресурсе НейроХолст и о том, зачем он может понадобиться.

Это наш, российский агрегатор графических моделей. Начинался он с минимума, потом подтянул много всего интересного. Сейчас на нём доступны наиболее ходовые общепользовательские модели генерации графики и много профессиональных, но с ограниченным функционалом.

Большой плюс —

НейроХолст работает всегда. И когда мобильный интернет ограничен, тоже работает. АвторТудей недоступен, а НейроХолст — к Вашим услугам.
НейроХолст требует регистрации, но можно войти через vk или Yandex, и он Вас навсегда запомнит.
Подписка не требуется — три жирных плюса.
И ещё плюс — телеграм-канал, где по акциям изредка активистам перепадают плюшки.

А теперь ложки дёгтя в нашу бочку мёда.

Генерация платная. Для пробы Вам дадут бонусных 25 токенов, которые здесь называются «краски». На самом деле, они не покрывают стоимость генерации в мощных моделях, но ресурс закрывает на это глаза. Вы подсаживаетесь, и тут выясняется, что чем сложнее задача, тем больше красок она потребует. Тут уже всё честно: единственный способ сэкономить на токенах — купить сразу много. Они не пропадут, их у Вас никто не спишет. Но сам факт расставания со своими кровными...
Вы потратите много красок на пробы. Потому что модели разные, обучены далеко не одинаково, разному и умеют далеко не всё.

Что реально Вам предлагают за Ваши кровные?

API (программный интерфейс приложения — тупо, рабочее окно) для разработчиков: Крупные компании (Google, OpenAI) часто выпускают «облегченные» или тестовые модели (Flash, Preview) через API для разработчиков раньше, чем они появляются в основных подписках для обычных пользователей. Агрегаторы вроде «НейроХолста» подключаются к этим техническим каналам.

Оплата за «бесплатное». Хотя в США доступ к ряду Flash-моделей (как Gemini 1.5/3.1 Flash) может быть бесплатным через Google AI Studio (в рамках лимитов для разработчиков), для пользователя из России это недоступно из-за санкций. У Вас нет возможности скрыть местонахождение, знаний, где всё взять бесплатно, и карты, которой оплатить платное? Тогда Вам сюда.

Да, всё, чем Вы планируете в НейроХолсте генерить, - сырые версии на стадии тестирования. Не готовые релизы. Поэтому ошибок генерации будет много. Но Вы в своих промптах наделаете ещё больше.

Чтобы Вы немного сориентировались в этой толпе моделей, покажу, как один и тот же промпт обработали самые популярные из них.

Задача — сгенерить фотографию вот по такому промпту.

Portrait of a man in his 30s, sharp chiseled jawline, prominent cheekbones, intense piercing bright grey eyes, short military buzz cut, black hair. Clean-shaven face, no mustache, no beard. Clean forehead, no tattoos, no markings. Serious facial expression. Highly detailed skin texture, photorealistic, 8k, cinematic lighting.

Сразу говорю: даже одна модель безусловно будет перерисовывать моську персонажа в следующих генерациях: не прописан фон, зацепиться за черты лица в промпте ей трудно. Но у нас задача: человек должен быть похож на описание, и модель должна отразить характер — мы же не фоторобот составляем?

С чего начать?

Во-первых, ресурс предложит сразу две нано бананы:

Nano Banana 2 (Gemini 3.1 Flash Image) - по умолчанию используется в Gemini, Google Search и Lens. Эта версия быстрая, бесплатная и имеет лимит в 20 изображений в день.Бесплатная и быстрая она для «них». Мы в их число не входим. У нас всё за деньги, и готовьтесь к чеку примерно в 30 рублей, зато рисуйте, пока краски не закончатся — без ограничений, точно не 20 генераций. Так что, аккуратные и грамотные промпты — Ваше всё. Эта модель натренирована на ретушь и работает под стилистику запрещённой Инсты и разрешённых площадок интернет-торговли.

Nano Banana 3(Gemini 3 Pro Image) - более мощная модель, призванная удовлетворить любой каприз фотохудожника, в какой бы области он не работал - в фотостудии, на пленэре, на мероприятиях, на войне или в космосе. Ретуширует, контрастирует, блюрит, убирает, подменяет, переодевает, свет выставляет. В общем, кофе не варит. А жаль.

Вот два результата, сгенерированные этими моделями. Вверху - банана 2, внизу - банана 3

Если не прописать степень обработки, результат у профессиональной модели более пластиковый, чем у Nano Banana 2! Почему? А потому, что модель прилежно отвечает только на те вопросы, которые ей заданы. В промпте информации о настройках слишком мало. Она не знает, чего Вы хотите, поэтому останавливает обработку на средневзвешенных значениях. Отсюда вывод: если не ставится специальных задач, например, имитации съёмки в необычных условиях, со вторым бананом Вы без тренировки поладите лучше. Встроенная ретушь у него реалистичная, а эстетика фотохостингов и соцсетей аудиторией насмотрена и воспринимается дружелюбно.

Если же Вы решили создать нейрофотошедевр, тоBanana 3 альтернативы не имеет. Как выкрутиться? Отладить промпты на съёмку всякой экзотики в этой модели на lmarena, именно под продвинутую версию, разобраться, что и как там работает, и подставлять в свои новые промпты на НейроХолсте готовые старые формулы. Будете попадать, не целясь.

Да, ещё: во время генерации оба банана сбегают в сеть и проверят себя на предмет ерунды какой, поэтому фантастики в результатах меньше, чем ожидается.

Как было правильно сформулировать промпт? Нано банана строит кадр, а в кадре — застывшее действие. Не заставляйте её выдумывать контекст. Пишите сами!

«A close-up cinematic portrait of a 30-year-old soldier in civilian life. Black military buzz cut, clean-shaven, intense grey eyes staring directly into the soul. Serious and focused expression. Atmospheric studio lighting with a cold blue tint. The background is minimalist dark grey, slightly out of focus. Photorealistic texture, every detail of the skin is sharp.»

Это должно сработать!

Теперь — любимец богов и наших нейрохудожников Midjourney.

В Вашем случае — флэшка седьмого, с ещё более стервозным нравом, чем у официальных релизов шестого.

Он на НейроХолсте щедро выдаёт аж 4 варианта на одну генерацию. Низкий поклон ему за это. И отдельная благодарность за то, что его предустановки конфликтуют с каждым промптом и представляют для модели гораздо большую ценность, чем пожелания пользователя. И даже прямые запреты Вам не помогут. Если они противоречат статистике, на которую натренирован алгоритм, получите нежданчики. Мне не нужны были ни первые четыре уголовные рожи, ни последние четыре.

Я попробовала применить прямой запрет, потому что под него была строчка заведена. Те же уши, вид сбоку.

И ничего, что по условиям задания парню на картинке должно быть 30 лет? Получается такая бредятина из-за того, что у алгоритма конфликтуют установки на стрижку и брутальный взгляд и на выбритый подбородок. Ни на что другое при таком взрыве мозга модель не может обращать внимание и игнорирует начало промпта.

Бодаться сMidjourney смысла не вижу, хотя вылечить это безумие на самом деле можно в 3-4 перегенерациях, устранив конфликтную формулировку в промпте, с уточняющими и запрещающими условиями. При этом полного исполнения желаний Вы не добьётесь никаким каком, а модель будет продолжать куражиться.

Что у модели в плюсах: она не приукрашивает реальность. Если Вам нужны пигментные пятна, шероховатость, шрамики и сеть морщинок у глаз, рисунок радужки, такие вещиMidjourney не вспомнит, так придумает в лучшем виде. ИИ прекрасно знает, что в глазах людей отражается не только солнце, но и сам смотрящий и окружающий мир — так, как это получится в Midjourney, чем-то ещё это сгенерить будет непросто. Но под фотореализмом подразумевается в первую голову чернуха!

У модели и другие бесценные знания есть: она играла в Майнкрафт, зачитывалась вселенной Гарри Поттера, кельты у неё непременно с раскрашенными рожами, рыцари — в латах позднего средневековья. И проверять свои бредовые интерпретации данными из сети и корректировать во время генерации модель не станет. Для неё это эстетические стили, как и фильтры красоты. Так что, если Вы разделяете её предрассудки или говорите с ней на одном языке — нет проблем, она Ваша. Договоритесь легко. Мне много лет, нервничать нельзя, я от этого издохну — поэтому не моё.

А исходный промпт именно под эту модель должен выглядеть так, с усилением в конце:

Portrait of a man, chiseled features, piercing steel-grey eyes, black buzz cut. Clean-shaven, hyper-maximalist skin detail. Rembrandt lighting scheme, deep chiaroscuro, shot on 35mm film, grainy texture, vogue aesthetic, intense masculine energy, cinematic composition, 8k. --ar 4:5 --v 7 Freshly shaved skin, smooth skin texture.

Не пробовала и не планирую, но по уму должен работать.

Следующий интересный ресурс - Stable Diffusion 3.5

Это модель от Stability AI, которая по хорошему должна быть установлена на локальный компьютер. Тогда она проявит лучшие способности продвинутых нейросетей — сможет создать, запомнить и использовать в Вашем проекте несколько образов в виде подмоделей, запоминать лица персонажей по именам, через промпты, а не образцы-картинки. В общем, много умеет, а добиваться результатов предлагает через перегенерации. Для дектопа, то есть, «программы», установленной на компьютер пользователя, это логично и правильно. И запросы у неё не запредельные - (желательно от 16–24 ГБ видеопамяти для версии Large).

У Вас железо попроще? Ну так в дороге кормить не обещали! Так что, пользуемся сетевыми версиями через прокладки АPI. То есть НейроХолст. Обо всём, что я тут рассказывала о подмоделях, забываем, потому что НейроХолст о них не в курсах.

Результат будет такой, как на картинке. Вас разводят на цепочку уточнений промпта и новые генерации. На финише будет вполне достойно, зуб даю, только обойдётся это в «сикока-сикока»?

И последняя могучая животинка — Kling V3.

Китайцы — великие имитаторы. Они копируют всё. И Midjourney умеют тоже. Но! Китайская модель не может точно генерировать не стандартные для азиатов лица европейцев. По этому в игнор пойдут все Ваши прямые указания. No tatoos – ага, и две уголовные татуировки прямо на моське. Рисует модель достаточно реалистично, но специфику — слабую обученность на расовые особенности людей, не мешало бы помнить.

Здесь я, каюсь, грубанула: именно эта модель предназначена для генерации видео, а не изображений. Собственно, это стоп-кадр, и оценивать его правильно не в ряду нейрофотографий! На самом деле, очень достойный генератор видео. Он может превратить в видеосюжет картинки, которые Вы загрузите, так называемые начальные, промежуточные и конечные кадры. Так что, совсем от неё отказываться неправильно — просто для видео нужно готовить основу отдельно, в тех моделях, которые генерируют лучше и с которыми Вы подружились.

Теперь общепользовательские ресурсы.

Неожиданно порадовал GPT-5. На самом деле рисующая модель в нём — какая-то из Dalee, не знаю, какая конкретно в этом.

Что на выходе? Неплохое попадание в образ. Любительская фотография, сделанная средненькой оптикой. Сюжет и характер есть. Физиономия не отвратная. Только то, что заказали. Никакой отсебятины. Фон не предусмотрен, а изображение кадрировано так, чтобы едва воротник был виден.

Аналогично у Grok Imagine. Только он ретуширует и чудит со светом! Зато за пределы промпта вообще не выскакивает. Что, как говорится заказывали, то и ешьте...

Из этой пары через НейроХолст я бы вызывала GPT-5: генерации Grok склоняются по стилистике в сторону мемов, и на конкретном примере этот флёр есть!

Теперь две версии Flux. Эта модель оптимально сочетает цену и качество, только тараканы у неё ещё те!

Странненький результат? А потому, что именно эта модель требует подробнейшего определения стиля, вплоть до эпохи для рисунка и марки камеры для фотографии! По умолчанию это будет скетч! Но по условия батла, сначала смотрим попадание при полноценном универсальном промпте. Так вот, если не работать с текстом дальше, Вы не почувствуете разницу с Шедеврумом.

Если есть время и деньги, Вы получите результат намного лучший, чем в Kling и точно лучший, чем GPT и Grok. А для эскизов и бесплатных ресурсов хватает!

Как должен был выглядеть специализированный промпт под Flux?

Portrait of a man in his 30s, military buzz cut, black hair. Sharp jawline, piercing grey eyes. Shot on Fujifilm GFX 100II, 110mm lens, f/2.0. Raw photo style, hyper-detailed skin pores, visible hair follicles, micro-sweat on forehead. Natural side lighting, soft shadows. No filters, ISO 100, high-end fashion photography style, 8k.

Самый страшный результат дал Recraft v4 Pro

Это — не порок модели, а иллюстрация тому, как плохо и неправильно искать неожиданное применение обычным вещам. Эта модель обслуживает создателей баннеров, рекламок, логотипов и типографских обложек! Она в пределе даже векторную графику умеет. Но, Бога ради, не тулите в неё детализированные фотографии. Будет спотыкаться, рисовать нереалистичные пропорции и прочую ерунду. А вот если Вы хотите, чтобы обложка хорошо смотрелась при типографской печати, Вам сюда. Если у Вас феерический арт, будь то рисунок или фото, а модель его портит, значит, не судьба — типографская машина тоже покалечит Ваше художество. В эту сторону и уточняете промпт: нужно упростить рисунок для типографской печати в стиле... И тут поле для фантазии.

Надеюсь, возможности и особенности «рисования» портретов различными моделями я Вам показала, и знакомство с НейроХолстом состоялось. Я сегодня выкинула 250 рублей на свои эксперименты. Если край надо рисовать, а интернет мобильный - не абонент, то это — выход. Хотя и не дешёвый. И Вы видите на примерах, каких расходов и доработок может потребовать затея.

иллюстрации, нейроарт, творчество

+18

134

0 комментариев, по времени, по убыванию времени, по возрастанию популярности

0 комментариев, по
времени, по убыванию

времени, по возрастанию

популярности