Как задавать промты для быстрой и успешной генерации картинок и коротких видео

Автор: Дмитрий Романофф

Несколько раз фиксировал просьбы подробнее расписать способы оптимизации взаимодействия с современными инструментами по генерации видео контента. Оки! Попробуем!

Проблема в том, что нейросеть не читает наши мысли. Или уже читает? Пока, имхо, всё же ещё нужны промты. Разница между «наброском» и «шедевром» часто заключается в умении задать правильный запрос.

Давайте попробуем составить структуру идеального промта.

Представим, что наш промт — это сценарий для кинематографиста. Мы кричим ему не: «Сделай красиво!», а даём чёткие указания что мы хотим увидеть!

Уровень первый. Скелет. Что мы видим?

Это база через объективное описание.

Хреновый промт: "рыцарь в лесу".

Уже лучше: "Заброшенный осенний лес, заросший папоротником. Посреди поляны стоит рыцарь в потрёпанных доспехах".

Уровень второй. Контекст. Какое качество и детали? 

Здесь мы добавляем конкретику и материальность.

  • Детализация: "доспехи покрыты ржавчиной и мхом, на плаще видны следы от когтей. Он опирается на меч, воткнутый в землю".
  • Качество изображения: "Добавляем слова like hyperdetailed, photorealistic, 8k, cinematic lighting, professional photography. Это технический словарь качества для нейросети".

Уровень три. Душа картинки. Какая атмосфера? 

Это самый важный для писателя уровень. Здесь мы вдыхаем в изображение жизнь, эмоцию и настроение.

  • Свет и цвет: "золотистые лучи заката, пробивающиеся сквозь туманхолодное голубое сияние лунного светатёплый свет из окон таверныконтрастный киношный свет".
  • Погода и время: "Осенний туман, лёгкая морось, густой снегопад, сумерки, глубокая ночь".
  • Эмоция и настроение: "одиночество, меланхолия, тревога, надежда, тайна, эпический размах".

Соберём воедино и получим итоговый промт:

инематографичный портрет одинокого старого рыцаря в потрёпанных доспехах, покрытых мхом и ржавчиной. Он стоит в заброшенном осеннем лесу, опираясь на меч. Золотистые лучи заката пробиваются сквозь густой туман, создавая длинные тени. Высоко детализированное, фотореалистичное изображение, атмосфера меланхолии и усталой победы. В стиле Greg Rutkowski".

Обратили внимание, что мы не просто перечислили объекты, а рассказали целую историю одним кадром.

Анализ удачных промптов.

Давай разберём несколько сильных промптов и выделим приёмы.

Промпт первый: «Городской нуар».

A raislicked neonlit alley in a cyberpunk city. A lone figure in a trench coat under a flickering sign. Cinematic, volumetric fog, reflections on wet asphalt, style of Blade Runner 2049. Moody, suspenseful.

  • Атмосферные триггеры: "rain-slicked (мокрый от дождя), neon-lit (неоновый свет), flickering (мигающий), volumetric fog (объёмный туман), reflections on wet asphalt (отражения на мокром асфальте)".
  • Почему это так работает? Промт создаёт полную сенсорную картину. Мы не только видим, но и почти слышим шипение неона и чувствуем влажность воздуха. Сравнение со стилем «Бегущего по лезвию» сразу задаёт визуальный шаблон.

Промпт второй: «Сказочное затишье». 

An ancient, massive library inside a giant, holloweout tree. Sunbeams pierce through the canopy, illuminating dust motes in the air. Cozy, warm lighting, stacks of old books, magical atmosphere. Fantasy art, style of Ghibli Studio.

  • Атмосферные триггеры: "sunbeams pierce through (солнечные лучи пронзают), dust motes in the air (пылинки в воздухе), cozy, warm lighting (уютный, тёплый свет), magical atmosphere".
  • Почему это так работает? Ключ здесь заключён в деталях, передающих ощущение. "Пылинки в воздухе" — это магия момента, намёк на тишину и неподвижность. "Уютный свет" сразу вызывает чувство безопасности и любопытства. Указание на стиль "Гибли" гарантирует мягкую, живописную и добрую эстетику.

Промпт три: «Эпическая пустошь».

Vast, deserted post apocalyptic cityscape overgrown with red vegetation. A colossal, decaying statue of a forgotten hero. Dramatic sunset with deep red and purple clouds. Epic scale, sense of awe and desolation.

  • Атмосферные триггеры: "vast, deserted (огромный, безлюдный), overgrown (заросший), decaying (разрушающийся), dramatic sunset (драматический закат), epic scale (эпический масштаб), awe and desolation (трепет и запустение)".
  • Почему так работает? Промт играет на контрасте масштабов (огромный город vs. отсутствие людей) и эмоций (трепет перед величием vs. тоска от забвения). Цвет (red vegetationpurple clouds) становится активным участником повествования.

Простые работающие приёмы для мгновенного результата.

  1. Правило трёх прилагательных. Не ограничиваемся одним. Вместо "dark forest" попробуем "dense, misty, ancient forest". Эффект будет в разы сильнее.
  2. Камера и объектив. Используем термины из фотографии и кино. Это сразу делает композицию осмысленной.
  3. Ракурс: "low angle shot (вид снизу), bird's-eye view (вид с высоты), dutch angle (голландский угол)». 
  4. Планы: "extreme close-up (экстремальное крупно), medium shot (средний план), wide shot (общий план), establishing shot (установочный план)". 
  5. Глубина резкости: "shallow depth of field (малая глубина резкости)", — чтобы размыть фон и сфокусироваться на герое. 
  6. Имена! Упоминание имени известного художника или директора. Стиль Greg Rutkowski, Alphonse Mucha, H.R. Giger, Hayao Miyazaki. Это самый быстрый способ задать целый комплекс стилистических ожиданий.
  7. Если нейросеть упорно добавляет ненужные элементы, запрещаем их. "No people, no bright colors, no modern buildings". Это наш редакторский карандаш.

Создание промптов — это не программирование, а продолжение писательства. Мы переводим язык литературных образов на язык визуальных подсказок. Каждый наш навык описания природы, передачи эмоций и построения сцены теперь находит новое применение.

Что если сразу не получается и ничего не понятно? Можно начать с малого. Берём одну ключевую сцену из своей книги. Описываем её так, как если бы описывали её иллюстратору — в деталях, настроении и свете. Затем, переводим это описание в структурированный промт и наблюдаем как это обретает зримые черты.

И ещё отмечу, что крупные сетки типа Гугловской, могут генерировать ооочень крутые картинки по простым промтам. Многое зависит от сетки и какие-то просто нет смысла мучать. Лучше они не сделают. Ну а если начало получаться, то используем все описанные приёмы. Это особенно хорошо работает для видосов. Успехов!

+143
179

0 комментариев, по

19K 0 1 035
Мероприятия

Список действующих конкурсов, марафонов и игр, организованных пользователями Author.Today.

Хотите добавить сюда ещё одну ссылку? Напишите об этом администрации.

Наверх Вниз