К вопросу о нейросетях - рисовалках и писалках
Автор: Евгения Лифантьева. Алексей ТокаревЯ, как всегда, к основному срачу не успеваю. Однако некоторые блоги заставили задуматься. До прошлого года нейросети обитателей АТ не интересовали, так как занимались вещами, далекими от литературы. В прошлом году появились в массовом пользовании нейросети-рисовалки, и многие авторы начали использовать сгенерированные ими картинки в качестве обложек. Причем получающиеся картинки очень "зашли", как сейчас принято говорить. Достаточно яркие, броские, с тщательной проработкой деталей... хотя детали те могут быть весьма и весьма далеки от того, как их представляет нормальный человек. В результате картинки используют, но все они требуют "доработки напильником", чтобы получилось хоть что-то вменяемое. Причем - чем менее стандартный запрос, тем с меньшей вероятностью что-то получится.
Из нейросети просто "выбить" гламурно-красивых девиц и мужчин. Красивых порой до уродства, но все же... А вот не людей нейросети пока представляют себе с большим трудом.
Я поиграла с "Малевичем" и "Кандинским", задав им вроде бы простую задачу: нарисовать "Кошки танцуют вальс в волшебном лесу".
"Малевич" выдал вообще что-то ни с чем не ассоциируемое
Разве что нечто розовое в левой части картинки и форма розового в нижней правой слегка напоминают пачку и ногу балерины. То есть "Малевич" не знает слова "кошка"! Да и "волшебный лес" весьма условен.
"Кандинский" попродвинутее. Кошки слегка похожи на кошек. Правда, о том, что "у кошки четыре ноги" нейросеть не слышала. А лишние хвосты вообще вызывают ассоциацию с кицунэ. (Кстати, я теперь знаю, откуда они появились у японцев - у древних обитателей Страны Восходящего Солнца были нейросети!)
Мало того. Она, видимо, вообще не понимает слова "вальс". Кошки танцуют - да. Но, если не учитывать лишние лапы и хвосты, то танцуют они что-то типа казачка или ирландерки. Потому что вальс - парный танец, в нем кружатся, держась за руки и за талию!
Попробовала в разных стилях... везде одно то же...
Тут левый кот получился с практически нормальной анатомией. Зато правый компенсирует многолапостью...
Здесь более или менее нормальный правый, хотя все лапы, похоже, были когда-то сломаны и потом неправильно срослись. Наверное, поэтому котики танцуют с такими выражениями на мордах... не в кайф им...
Самое вменяемое получилось в стиле "мультфильм". Тут у одного кота лап оказался, наоборот, дефицит. Морды у котиков наперекосяк, глаз как таковых нет, но это можно списать на то, что котики перебрали валерьянки, а художник - чего покрепче... И все же правый кот хорош. Я рисую примерно на таком же уровне. Правда, я не художник, хотя и вроде бы как человек...
В общем, перед немассовым запросом нейросети пасуют.
Есть у нейросетей еще один минус. Они генерируют плоскостные изображения на основании множества имеющихся у них изображений, но не понимают, как выглядит предмет в других ракурсах. Например, по запросу "дубовый лист" "Кандинский" выдал мне вот это. Прекрасно передана текстура, прожилки, но о том, что у листьев бывают черенки, нейросеть не в курсе. Как и о том, чем дуб отличается от клена. Ей пока еще не нужно было этим заморачиваться...
Сравните с тем, что получилось у меня в "Кандинском" по запросу "Красивая брюнетка на фоне роскошного тропического пейзажа". Кроме странных полосок на шее - никаких претензий. Конечно, представления о красоте у людей разные, меня девицы с таким губами не восхищают, но я допускаю, что это - распространенный вариант красоты... Глаза разного цвета можно считать за "изюминку". С тропиками на фоне тоже все в порядке.
Почему так? Потому что на один запрос про кошек наверняка несколько сотен на брюнеток. Котиков, причем бесхозных и не охраняемых авторским правом, можно найти в сети миллион. Вот и не генерируют котиков с помощью нейросети...
К чему это я?
Да к тому, о чем говорят все.
Нейросети легко решают стандартные задачи и тупят на нестандартных. Стандартные задачи - те, на которые много запросов. Нейросети развиваются на основании запросов - чем тех больше, тем лучше работает нейросеть с этим блоком запросов.
А теперь - к нейросетям в текстах. Нас пугают тем, что нейросеть заменит журналистов. Нет. Нейросеть заменит рерайтеров - то есть тех, кого до последнего времени за журналистов-то и не считали. "Переписывать чужие новости", "переписывать из интернета" в олдскульных изданиях считалось просто отстоем. Новость должна быть эксклюзивом. Новость нужно брать не из пресс-релизов тех или иных организаций, а непосредственно с места события. А кто уж потом перепишет или отрерайтит, нейросеть или бедолага-поденщик, не твои проблемы. Ты - журналист. Ты добываешь первичную информацию. А они - вторичны. Так что, если исчезнет профессия рерайтера, журналисты особо не напрягутся.
То же самое и в как бы художественных текстах. Есть массовый запрос на те произведения, которые способны погружать читателя в стандартные приятные состояния: состояние "я любима" (любовный роман), состояние "я всех побеждаю" (любые "нагибаторские" жанры), состояние "я немножко попугаюсь выдумке, чтобы порадоваться, что в реальности страхов нет" (всякий хоррор)... Запрос этот настолько массовый, что позволяет неплохо кормиться авторам, обслуживающим эту потребность читателей, причем даже не самым ТОП-топам. И именно в эти жанры в первую очередь зайдут нейросети. Тут есть огромный массив исходной информации для анализа, массив настолько большой, что количество позволяет вычислить закономерности восприятия и те приемы, которые делают текст привлекательным для читателя. Так что вангую: первым романом, который напишет нейросеть, будет любовный роман. Просто он - самый частый в запросах.
Ну, и возвращаясь к картинкам. Уже сейчас стали появляться люди, которых можно назвать условно "операторами нейросетей". Те, кто умеет правильно задавать нейросетям задания, знает, что те могут, а что не могут, как им объяснить, что нужно... слоты, которые приходят только с опытом. Ну, и умеют в фотошопе убрать лишние пальцы и лапы, а также придать мордам и лицам нужные выражения. Для них нейросеть - всего лишь инструмент.