Машина — дура
Автор: Владимир УгловскийОчень много опять стало разговоров про нейросети, в особенности — про ChatGPT. Ну, примерно так же, как недавно были разговоры про Midjourney, Stable Diffusion и Wombo. Были ли подобные разговоры про Порфирьича — не помню, так как не вчитывался сильно. Кажется, не было, народ больше с него прикалывался, но это не точно. А суть этих разговоров тоже по категории «опять» проходит: мол, ну всё, братья и сестры, заменят нас всех, как пить дать заменят.
В общем, крепился я, крепился, да недокрепился и решил всё-таки вставить свои пять копеек.
Конкретно по нейросеткам я, конечно, не специалист, но, сакр дье, всё же кибернетик, и с автоматизацией всего подряд уже лет десять с лишним непрерывно работаю. Потому ответственно и с полным на то правом могу воспроизвести банальную истину, которую вколачивают в голову любого студиозуса по околокомпьютерной специальности на первом же курсе: машина — дура. Она выдаст вам не то, что вы хотели, а то, что вы ей сказали выдать. Сформулировать же второе так, чтобы оно было максимально приближено к первому — задача настолько нетривиальная, что она даже породила целую кучу профессий, включая и мою.
Разумеется, для конечного пользователя, уже после того как наш брат изрядно потрудился, оно всё не настолько хардкорно. Как минимум потому, что отдаваемые машине команды на этом этапе уже скомпонованы в готовые блоки под конкретные задачи, запускаемые, грубо говоря, одной кнопкой. Но сам принцип машинной дурости всё равно никуда не девается. В особенности, если запрос на вход подаётся нечёткий. Не «сделай мне строго здесь строго вот так», а «сгенерь-ка мне что-нибудь, удовлетворяющее вот этим критериям». И можно сколько угодно говорить, что, дескать, нейросетки копируют устройство мозга, не путай со своим ноутбуком, всё такое. Даже такая машина всё равно остаётся тем ещё буквалистом. Мы-то от этого с детства годами через социалку избавляемся, а машина, очевидно, в несколько иных обстоятельствах находится. Я только одну сетку знаю, которая этому не подвержена: LFANN. Но это так, шутка для тех, кто в теме.
А если серьёзно, то будет с текстовыми нейросетями ровно то же, что уже происходит с графическими.
Смотрите сами. Вот добирается абсолютный дилетант до сетки и вводит запрос обычным человеческим языком. Что он получает, кучу обалденных артов? Да ни разу. Он получает четыре фрейма отборнейшего трешака, из которого один образец, может, будет не безнадëжен, и то не с первой генерации.
Допустим, этот дилетант почитал где-то про то, как составлять запросы и немного поэкспериментировал. Что он получит в этом случае? Вероятнее всего — несложный арт с одним-двумя персонажами сравнительно не позорного качества. Для чего ему, конечно, понадобятся удача, терпение и, очень вероятно, наложить фильтр, да обрезать картинку, чтобы пресловутые странные пальцы в кадр не попадали. И, самое главное — умело сделать вид, что на изображении действительно то, что планировалось. Рабочий вариант, на самом деле, я так себе обложку сделал (очень вероятно, что временную, но всë-таки). Для бытовых задач, или микроскопических коммерческих (баннер там запилить) с пивом покатит. Но, давайте честно, не более.
Ну, и усложним задачу до совсем серьëзной. Допустим, надо сделать крупный сюжетный арт с множеством деталей, заданной, а не абы какой, обстановкой, более-менее композицией, короче говоря, со всем фаршем, чтобы прямо на уровне. Что для этого потребуется? Выверенный до последней запятой запрос очень нехилой длины, сотни генераций в поисках того самого варианта, дорисовывание врукопашную тех деталей, которые сетка всë-таки забыла, правка врукопашную тех деталей, которые нейросетка радостно запорола. Ну, и важный момент, который уж не знаю насколько актуален сейчас, но в дальнейшем будет точно. Это внимательно посмотреть и аккуратными мелкими штрихами стилизовать картинку, сделать так, чтобы из неё не сочился характерный почерк, по которому уже сейчас многие распознают конкретную нейросетку, и который, вангую, скоро станет печатью нуба, кою в приличном обществе будет принято замазывать. В общем, я-то сам в рисовании сам не эксперт, палка-палка-огуречик — мой потолок. Но рискну предположить, что найдутся художники, которые, глядя на этот алгоритм, сочтут, что да ну его, проще с нуля руками нарисовать.
А по мере прокачки сообразительности сетки, думаю, она займëт место просто ещё одного инструмента, берущего на себя часть черновой работы. Как, внезапно, любому инструменту автоматизации и положено. И поиграться в ней на любительском уровне, конечно, будет можно, только дороговато. Да, думаю, вся халява нынешнего периода, когда сетки ещё, по факту, обкатываются и учатся, благополучно закончится, когда применение сеток выйдет на промышленный уровень. Примерно как Movie Maker испарился из стандартной комплектации Windows, когда ютуберы с тиктокерами стали действительно зарабатывать. Но это так, о возможном будущем.
А возвращаясь в наше время — ну, не вижу я причин, по которым ChatGPT и ему подобные могли бы отклониться от этого алгоритма. Народ наиграется, возможно, изготовление текстов его уровня удешевится — и комильфо станет доработка напильником. Там подправить, где оно сюжет потащило в какие-то дебри, там исправить, где робот накосячит, там стилизовать и вшить шутку недоступной для машины тонкости, какой-то особый очень личный образ, и так далее. Тоже изрядная работа, вычитать и выправить готовое — это, извините, зачастую проще с нуля написать. Не считая того, что сначала машине надо ещё доступно объяснить, а что от неё надо.
Короче, будет ещё один инструмент, наряду со Скривенером, Сценаристом и тому подобным.
Если обобщить, то машина, вопреки стереотипам, никогда не заменяет человека. Заставляет выработать новые навыки — это да, это она может, и порой в радикальном порядке. Но не заменить. Она для этого отроду и не предназначена. Любая автоматизированная система предназначена для того, чтобы работать в связке с человеком. Брать на себя рутину и оставлять кожаному мешку неформализуемые творческие части, в которых железяка так и так разбирается, аки хрюндель в цитрусовых.
Если же вдруг вопреки всему сказанному машина способна заменить вас в полной мере, то у меня плохие новости насчёт вашей квалификации.