Об аватарках, "компьютерном зрении" и прочем интересном
Автор: Макс ДалинБыть может, он заменит мне Читателя, нарисованного Мэтьюзом
Ага-ага, мою любимую аватарку, которую я уже лет десять не менял. Потому что это создание мне кажется просто идеально подходящим: оно такое, понимаете, иномирное, чужое, но свойское - потому что ведь тот, кто книжку читает, наш человек же, верно? Вот! И оно зелёное, потому что не хищное - ну, те, кто зелёный, выглядят, с моей точки зрения, симпатично и мирно, и, как правило, не ядовитые. И сидит оно на грибе, а гриб мне сейчас, после знакомства с лицин, кажется куском своеобразной такой нервной системы мира, станцией связи - весь этот ассоциативный ряд.
Читатель, в общем. Любой из нас ведь сначала Читатель, а потом уже всё остальное, я думаю.
Читатель Родни Мэтьюза
Но когда появились нейросети, я начал пытаться себе аватар нарисовать. Потому что Мэтьюз - это очень хорошо и даже прекрасно, но всё время тянет на что-то в максимальной степени своё. Более своё, чем то приблизительно подходящее, что ты себе подобрал на необозримом пляже, куда периодически выносят разное волны океана мировой культуры.
Самое очевидное было - дракон.
Но дракон меня как-то не до конца устраивал, потому что - что уж такого иномирного в драконе? Дракон - он дракон и есть. Водится в таком количестве разных фэнтезийных миров, что уже и не скажешь, откуда он точно родом. Космополит такой: и в Европе у него полно родичей, и на Дальнем Востоке, и в современной культуре он торчит из каждого мультика и каждой хохмы на фэнтезийную тему. В общем - ну...
Мне хотелось эндемика какого-то совершенно нового мира. Быть может, ещё не открытого.
Я пытался изобразить это существо уже лет пять. С очень посредственными успехами.
Но сейчас у меня в руках появился впрямь мощный инструмент, с которым мы хорошо спелись и друг друга понимаем. Даже два, есличо. Проблембо и Дрим Вомбо.
Стиль Родни Мэтьюза, ясное дело. В виде благодарности и реверанса, а ещё намёка и отсылки - и всё такое.
Но - как его описать-то? Промт-то какой? А? Э...
"Марсианский сверчок" - я пробовал. Как-то не задалось. Вернее - ну, кое-какие сверчки у меня получались, но... сказать по чести, они были просто букашки. А просто букашка меня не устраивала.
И я решил пойти на хитрость: https://problembo.com/ru/services/interrogate-image - программа "Компьютерное зрение". Смысл такой: загружаешь картинку, по мотивам которой хочешь сотворить что-нить этакое - и Проблемба пишет тебе промт. Потом ей же предлагаешь промт - и профит.
Конечно, не надо воображать, что машина непременно всё поймёт правильно и сделает идеальный промт - и сама же его верно прочитает. Нейросеть - не человек. Всякие сложные штуки ей не особенно по зубам.
Вот, например, я показываю знаменитую картину Луиса Ройо "Серое на ещё более сером":
Человек бы сказал: металлический робот обнимает девушку - и оба закутаны в клочья картины "Герника" Пикассо. А на заднем плане какие-то руины. Постапокалипсис, в общем. Из соответствующего альбома.
Но машина определяет так: мужчина и женщина сидят рядом на скале на фоне порванного, порванного, порванного, стиль Брома, дарк-фэнтези.
Ну бог с тобой, думаю я. Попробуй. Вдруг мне кажется, что это не точно, а ты изобразишь точно?
Машина выдаёт это:
Нейросеть - не человек, в общем. Не распознаёт. Тут сложно: лохмотья "Герники", робот этот... Роботов "компьютерное зрение" видит как людей. И манекены - как людей.
Самые лучшие результаты я получал, когда на исходной картинке не было ни людей, ни кого-то человекообразного. Вот, скажем, сделать пейзаж в определённом стиле - да, "компьютерное зрение" поможет. Или вот такая была история ещё: товарищ Ханнах мне показала милую картинку, где кошки высаживаются на Землю из летающей тарелки:
По идее мне страшно понравилось. Ну да, да! Поработили Землю, мохнатая гопота! И теперь у каждого - личный человек, а у некоторых даже по два-три, и те люди всегда готовы пушистых владык угощать вкусным, подстилать мягкое и менять наполнитель в лотке. В общем, тема для забавного фантастического рассказа.
Но мне само исполнение не особо зашло. Я долго пытался переделать - но совершенно безуспешно. А вот пропустил через "компьютерное зрение" - и у меня появилась своего рода болванка для промта, которую можно слегка подтачивать так и сяк, чтобы получить картинки в разном стиле, с разной эмоциональной наполненностью.
Например, такую суровую психоделическую графику:
Или лихую фэнтезень с уклоном даже в боевик, в духе Бориса Вальехо:
Пушистый десант выгрузился :)
И та, и другая мне по-настоящему нравятся. То есть - ну вот это моё уже. Моё видение темы.
В общем, мы можем считать, что "компьютерное зрение" даёт не готовый промт, а намёк на промт. Эту самую болванку, которую всё равно придётся редактировать самому, уточняя и изменяя детали.
Но это мы уклонились от темы.
Так вот. Читатель как раз подходит по параметрам - и я пропустил его сквозь "компьютерное зрение". И получил; "насекомое-дракон сидит в зелёной листве, графика, фэнтези, бла-бла, стиль Фроуда". Ну чо, нейросеть - тоже художник, она так видит. Зелёная листва, н-да-с...
Фроуда я сразу заменил Мэтьюзом. А с остальным принялся экспериментировать. В конце концов, быть может, насекомое-дракон - это как раз то, что нужно?
И я обзавёлся пачкой драконов. Практически обычных драконов, не насекомых - ну, с аккуратными намёками только. Вроде таких:
По мне - все чудесные. Но всё-таки такие драконские драконы, больше фэнтезийные. А меня заусило, я решил, что они слишком обыкновенные.
Стал думать, как бы усилить иномирность. Переделал "насекомое-дракон" в "инопланетное насекомое, похожее на дракона". Результаты не замедлили сказаться:
Ничего себе, подумал я. А ну ещё!
А славный, подумал я. По-моему, он читает рукописи. И обстановка у него - типичная такая... ботанический сад. В общем-целом, он уже меньше дракон.
- А если так? - спросила нейросеть.
Я проржался и подумал: нет, книжку можно и отредактировать. В существе что-то есть, хотя эмоция тут какая-то не та. Но что же делать с ботаническим садом?
И я очередной раз переписал промт. В этот раз я почеркал "зелёные листья" и вписал "инопланетные грибы".
- О! Грибы! - обрадовалась нейросеть и, я подозреваю, чего-то электронного нюхнула.
Вообще-то, я имел в виду "сидит на грибе", а не "хищные грибы на мощных ногах ломятся на передний план, душа по дороге бабочек". Но всё равно впечатление произвело.
А нейросеть решила не останавливаться на достигнутом. Ей почему-то очень понравилась идея про грибы. Она даже решила, что на этом можно выстроить целый сюжет, где у героя будет милый домашний питомец, и читать герой будет ему вслух - и у питомца будет отличный слух. Как-то так, в общем:
- Это здорово, спору нет, - сказал я. - Но это как-то не годится для аватарки. Герой должен быть один.
Вот тут-то это чудо и появилось на свет:
Сильно мне понравился. Ну хиппи же, сразу видно. Типичный инопланетный хиппи. Хоботочек умилительный. Читает он, по-моему, не книгу, а свои заметки в блокноте. И не похож вообще ни на кого. Инопланетная раса как есть. И сидит он среди грибов, которые - как та самая нейросеть, и, быть может, даже он питается спорами... ну аккурат как большинство из нас на АТ. Пока споры не перерастают в срач - ими можно отлично питаться, чо!
Я его, конечно, дорисовал и почистил малость. Убрал глюки с небес. А главное - глазки перерисовал. Глазки - важно, хочется, чтобы герой хорошо глядел. Копирую поближе, чтобы было проще сравнить:
Условных крылышек у этого товарища нет - да и ни к чему притворяться, что ты летаешь на этих крылышках. Читатель тоже на своих летать явно не мог. И читающий, и пишущий люд всё равно использует другие системы для полётов.
В общем, если у Мэтьюза был Читатель, то у нас теперь будет Писатель :) Или Мыслитель :) И его хоботок символизирует, что существо он не хищное (или, по крайней мере, делает вид :)), и цвет его зелёный говорит о том же самом. И у него большие глаза и уши - потому что мир надо сначала воспринимать, а записывать уже потом.
И, пожалуй, я его поставлю на аватарку. Он - подходящий.
Так какой из всего этого следует вывод.
Во-первых, "компьютерное зрение", несмотря на всю условность и неточность - довольно полезная штука. В конце концов, никому из нас не надо ведь копировать шедевры старых мастеров. Нам надо от них отталкиваться - и развивать свои собственные мысли. А для этого - очень подходит.
Во-вторых, с помощью нейросети можно ухитриться, хотя это долго, сложно и непредсказуемо, создать по-настоящему необычный образ. И оригинальный. Можно.
Потому что в тандеме "человек-нейросеть" главное, всё-таки, человек, его взгляд и ход его мыслей. И я так подробно рассказывал эту историю для того, чтобы стало понятно: хоть рисуешь ты кисточкой, хоть генерируешь рисунок - всё равно двигаешься от замысла. Реализуешь замысел. Технология реализации замысла может быть абсолютно любая - но суть остаётся единой со времён наскальной росписи.
Человечество придумывает всё более сложные конструкции для извлечения звуков и создания упорядоченных цветовых пятен. Но картины и музыку по-прежнему создают художник и композитор - в соавторстве с нейросетью и её создателями, я бы сказал.