Об аватарках, "компьютерном зрении" и прочем интересном

Автор: Макс Далин

Быть может, он заменит мне Читателя, нарисованного Мэтьюзом

Ага-ага, мою любимую аватарку, которую я уже лет десять не менял. Потому что это создание мне кажется просто идеально подходящим: оно такое, понимаете, иномирное, чужое, но свойское - потому что ведь тот, кто книжку читает, наш человек же, верно? Вот! И оно зелёное, потому что не хищное - ну, те, кто зелёный, выглядят, с моей точки зрения, симпатично и мирно, и, как правило, не ядовитые. И сидит оно на грибе, а гриб мне сейчас, после знакомства с лицин, кажется куском своеобразной такой нервной системы мира, станцией связи - весь этот ассоциативный ряд.

Читатель, в общем. Любой из нас ведь сначала Читатель, а потом уже всё остальное, я думаю.

Читатель Родни Мэтьюза

Но когда появились нейросети, я начал пытаться себе аватар нарисовать. Потому что Мэтьюз - это очень хорошо и даже прекрасно, но всё время тянет на что-то в максимальной степени своё. Более своё, чем то приблизительно подходящее, что ты себе подобрал на необозримом пляже, куда периодически выносят разное волны океана мировой культуры.

Самое очевидное было - дракон.

Но дракон меня как-то не до конца устраивал, потому что - что уж такого иномирного в драконе? Дракон - он дракон и есть. Водится в таком количестве разных фэнтезийных миров, что уже и не скажешь, откуда он точно родом. Космополит такой: и в Европе у него полно родичей, и на Дальнем Востоке, и в современной культуре он торчит из каждого мультика и каждой хохмы на фэнтезийную тему. В общем - ну... 

Мне хотелось эндемика какого-то совершенно нового мира. Быть может, ещё не открытого.

Я пытался изобразить это существо уже лет пять. С очень посредственными успехами.

Но сейчас у меня в руках появился впрямь мощный инструмент, с которым мы хорошо спелись и друг друга понимаем. Даже два, есличо. Проблембо и Дрим Вомбо.

Стиль Родни Мэтьюза, ясное дело. В виде благодарности и реверанса, а ещё намёка и отсылки - и всё такое.

Но - как его описать-то? Промт-то какой? А? Э...

"Марсианский сверчок" - я пробовал. Как-то не задалось. Вернее - ну, кое-какие сверчки у меня получались, но... сказать по чести, они были просто букашки. А просто букашка меня не устраивала.

И я решил пойти на хитрость: https://problembo.com/ru/services/interrogate-image - программа "Компьютерное зрение". Смысл такой: загружаешь картинку, по мотивам которой хочешь сотворить что-нить этакое - и Проблемба пишет тебе промт. Потом ей же предлагаешь промт - и профит.

Конечно, не надо воображать, что машина непременно всё поймёт правильно и сделает идеальный промт - и сама же его верно прочитает. Нейросеть - не человек. Всякие сложные штуки ей не особенно по зубам.

Вот, например, я показываю знаменитую картину Луиса Ройо "Серое на ещё более сером":

Человек бы сказал: металлический робот обнимает девушку - и оба закутаны в клочья картины "Герника" Пикассо. А на заднем плане какие-то руины. Постапокалипсис, в общем. Из соответствующего альбома.

Но машина определяет так: мужчина и женщина сидят рядом на скале на фоне порванного, порванного, порванного, стиль Брома, дарк-фэнтези. 

Ну бог с тобой, думаю я. Попробуй. Вдруг мне кажется, что это не точно, а ты изобразишь точно?

Машина выдаёт это:

Нейросеть - не человек, в общем. Не распознаёт. Тут сложно: лохмотья "Герники", робот этот... Роботов "компьютерное зрение" видит как людей. И манекены - как людей. 

Самые лучшие результаты я получал, когда на исходной картинке не было ни людей, ни кого-то человекообразного. Вот, скажем, сделать пейзаж в определённом стиле - да, "компьютерное зрение" поможет. Или вот такая была история ещё: товарищ Ханнах мне показала милую картинку, где кошки высаживаются на Землю из летающей тарелки:

По идее мне страшно понравилось. Ну да, да! Поработили Землю, мохнатая гопота! И теперь у каждого - личный человек, а у некоторых даже по два-три, и те люди всегда готовы пушистых владык угощать вкусным, подстилать мягкое и менять наполнитель в лотке. В общем, тема для забавного фантастического рассказа.

Но мне само исполнение не особо зашло. Я долго пытался переделать - но совершенно безуспешно. А вот пропустил через "компьютерное зрение" - и у меня появилась своего рода болванка для промта, которую можно слегка подтачивать так и сяк, чтобы получить картинки в разном стиле, с разной эмоциональной наполненностью.

Например, такую суровую психоделическую графику:

Или лихую фэнтезень с уклоном даже в боевик, в духе Бориса Вальехо:

Пушистый десант выгрузился :)

И та, и другая мне по-настоящему нравятся. То есть - ну вот это моё уже. Моё видение темы.

В общем, мы можем считать, что "компьютерное зрение" даёт не готовый промт, а намёк на промт. Эту самую болванку, которую всё равно придётся редактировать самому, уточняя и изменяя детали.

Но это мы уклонились от темы.

Так вот. Читатель как раз подходит по параметрам - и я пропустил его сквозь "компьютерное зрение". И получил; "насекомое-дракон сидит в зелёной листве, графика, фэнтези, бла-бла, стиль Фроуда". Ну чо, нейросеть - тоже художник, она так видит. Зелёная листва, н-да-с... 

Фроуда я сразу заменил Мэтьюзом. А с остальным принялся экспериментировать. В конце концов, быть может, насекомое-дракон - это как раз то, что нужно?

И я обзавёлся пачкой драконов. Практически обычных драконов, не насекомых - ну, с аккуратными намёками только. Вроде таких:

По мне - все чудесные. Но всё-таки такие драконские драконы, больше фэнтезийные. А меня заусило, я решил, что они слишком обыкновенные. 

Стал думать, как бы усилить иномирность. Переделал "насекомое-дракон" в "инопланетное насекомое, похожее на дракона". Результаты не замедлили сказаться:

Ничего себе, подумал я. А ну ещё!

А славный, подумал я. По-моему, он читает рукописи. И обстановка у него - типичная такая... ботанический сад. В общем-целом, он уже меньше дракон. 

- А если так? - спросила нейросеть.

Я проржался и подумал: нет, книжку можно и отредактировать. В существе что-то есть, хотя эмоция тут какая-то не та. Но что же делать с ботаническим садом? 

И я очередной раз переписал промт. В этот раз я почеркал "зелёные листья" и вписал "инопланетные грибы". 

- О! Грибы! - обрадовалась нейросеть и, я подозреваю, чего-то электронного нюхнула.

Вообще-то, я имел в виду "сидит на грибе", а не "хищные грибы на мощных ногах ломятся на передний план, душа по дороге бабочек". Но всё равно впечатление произвело.

А нейросеть решила не останавливаться на достигнутом. Ей почему-то очень понравилась идея про грибы. Она даже решила, что на этом можно выстроить целый сюжет, где у героя будет милый домашний питомец, и читать герой будет ему вслух - и у питомца будет отличный слух. Как-то так, в общем:

- Это здорово, спору нет, - сказал я. - Но это как-то не годится для аватарки. Герой должен быть один.

Вот тут-то это чудо и появилось на свет:

Сильно мне понравился. Ну хиппи же, сразу видно. Типичный инопланетный хиппи. Хоботочек умилительный. Читает он, по-моему, не книгу, а свои заметки в блокноте. И не похож вообще ни на кого. Инопланетная раса как есть. И сидит он среди грибов, которые - как та самая нейросеть, и, быть может, даже он питается спорами... ну аккурат как большинство из нас на АТ. Пока споры не перерастают в срач - ими можно отлично питаться, чо!

Я его, конечно, дорисовал и почистил малость. Убрал глюки с небес. А главное - глазки перерисовал. Глазки - важно, хочется, чтобы герой хорошо глядел. Копирую поближе, чтобы было проще сравнить:

Условных крылышек у этого товарища нет - да и ни к чему притворяться, что ты летаешь на этих крылышках. Читатель тоже на своих летать явно не мог. И читающий, и пишущий люд всё равно использует другие системы для полётов.  

В общем, если у Мэтьюза был Читатель, то у нас теперь будет Писатель :) Или Мыслитель :) И его хоботок символизирует, что существо он не хищное (или, по крайней мере, делает вид :)), и цвет его зелёный говорит о том же самом. И у него большие глаза и уши - потому что мир надо сначала воспринимать, а записывать уже потом. 

И, пожалуй, я его поставлю на аватарку. Он - подходящий.

Так какой из всего этого следует вывод.

Во-первых, "компьютерное зрение", несмотря на всю условность и неточность - довольно полезная штука. В конце концов, никому из нас не надо ведь копировать шедевры старых мастеров. Нам надо от них отталкиваться - и развивать свои собственные мысли. А для этого - очень подходит.

Во-вторых, с помощью нейросети можно ухитриться, хотя это долго, сложно и непредсказуемо, создать по-настоящему необычный образ. И оригинальный. Можно.

Потому что в тандеме "человек-нейросеть" главное, всё-таки, человек, его взгляд и ход его мыслей. И я так подробно рассказывал эту историю для того, чтобы стало понятно: хоть рисуешь ты кисточкой, хоть генерируешь рисунок - всё равно двигаешься от замысла. Реализуешь замысел. Технология реализации замысла может быть абсолютно любая - но суть остаётся единой со времён наскальной росписи.

Человечество придумывает всё более сложные конструкции для извлечения звуков и создания упорядоченных цветовых пятен. Но картины и музыку по-прежнему создают художник и композитор - в соавторстве с нейросетью и её создателями, я бы сказал.


+204
900

0 комментариев, по

53K 2 331 896
Наверх Вниз