На каком языке говорить с нейросетью? Что такое PROMPT

Автор: Алексей Снегирев

Русский, русский матерный, ломаный английский она не поймет. 

Пользователей нужно учить не меньше, чем нейросети. В конце декабря я в первый раз заинтересовался нейросетями, которые рисуют рисунки. Раньше знал, что есть такое чудо, но никогда не пробовал. А тут пришлось рисовать обложку для первой книги, ну и я был вынужден погрузиться в этот чудесный мир. 

Началось все с того, что мой знакомый художник на мою просьбу нарисовать обложку, весело рассказал, что «живые художники сейчас ничего на заказ не рисуют». Потому что получается хуже и гораздо дольше, чем генерирует искусственный интеллект. И если сначала я был с этим не согласен, то сейчас придерживаюсь такого же мнения.

Главная проблема, объяснить нейросети, что ты от неё хочешь. То есть важно постичь тайну языка, грамотно заполнить поле PROMPT. B запрос должен состоять из двух частей: описание того, что хочешь получить и модификаторы – в каком виде ты хочешь картинку получить. Нейросети, которые на мой взгляд не имеют достаточно настроек, чтобы получить именно то, что ты хочешь я отмел сразу. Осталась единственная нейросеть, у которой сотни настроек и дополнений, именно они позволяют контролировать конечный результат – Stable Diffusion. Но, дьявол в деталях, все как всегда. 

Лучший вариант, на мой взгляд, версия от «автоматик 1111». Много настроек, много контроля финального изображения. Для любителей программ, у которых одна кнопка «Пуск» она не подойдет. Два месяца я потратил на изучение и могу сказать, что не освоил и трети возможностей. Зато узнал множество специфических терминов и подходов в написании PROMPT. 

И так первое, важнейшее правило. Качественно переведите свой текст с русского на английский. Используйте слова, которые действительно употребляются в смысловом поле вашего запроса. Для этого подойдет переводчик DeepL, он позволяет выбирать синонимы слов, если просто ткнуть в слово. Напишите больше чем ваш запрос, переводчик должен понять ваш контекст. 

Некоторые слова нейросеть не понимает совсем, например, «цельнометаллическая броня», лучше написать «тяжелая броня». Потому что в контексте игр и персонажей, второе словосочетание употребляется в тысячи раз чаще. Наверное, можно перед написанием запроса еще и смотреть, какие слова используются в статьях на английском языке по данной теме. 

Другим важным моментом для получения нужного результата, стоит задача правильно объяснить, что вы хотите: существующее в реальности или придуманное, изображение того, чего нет. Я долго пытался объяснить нейросетке, что хочу «бронированный космический скафандр», но он два дня выдавал мне текстильные (иногда с небольшими металлическими элементами). Помогло получить желаемое одно слово – футуристичный. Вот тогда он выдал уйму годных картинок. 

Интересно работает и слово AND именно заглавными буквами, оно объединяет в нечто среднее два разных объекта. Главное, чтобы объекты были похожи, человека и танк не скрестить, а вот варвара и космонавта вполне, как и отлично получается корова-лошадь.

Для обложки в стиле фантастики – это очень важные моменты.  

Вторая часть любого PROMPT, это модификаторы результата: стиль, освещение, техника рисования и прочее. Я увидел у некоторых блогеров, что они пишут, например, Intricate details и получают хорошие результаты и мне захотелось узнать весь список команд, влияющих на итоговое изображение. Я искал в интернете пару недель эти «волшебные слова», но так и не нашел. И просто начал писать те, что мне были известны: High Quality, detailed, intricate details, artstation, Epic realistic… 

Но очень хотелось получить внятные ответы на вопрос: «огласите весь список пжлста!» 

Список из более сотни команд и хренову тучу стилей художников нашел в дополнении к SD, которая называется StylePile. Там есть несколько выпадающих меню, в котором можно выбрать необходимые модификаторы из нескольких меню: концепция, тип изображения, направление, эмоция, параметры цвета, влияние стилистики (не полный список), список множества художников, список стилей типа «арт 60-х» или «Киберпанк». 

Думаю, эти модификаторы будут работать не только с SD, но и другими нейросетями. 

Так за два месяца изучения темы, из первой картинки, получилась вторая.     


                

+7
1 355

0 комментариев, по

20K 341 31
Наверх Вниз