О нейросетях и будущем
Автор: Роман ПрокофьевВсем привет.
Сегодня статья о нейросетях (LLM) и создаваемых с их помощью книгах. В частности, на АТ, но не только. Тема давно назрела, для многих она болезненная, поэтому сразу выкачу два дисклеймера.
Все, что написано в этой статье — исключительно мое мнение, которое я никому не навязываю. Спорить и отвечать в комментариях не буду.
Начнем-с.
Совсем недавно я участвовал в круглом столе на Росконе, где мы сошлись во мнении, что точная детекция нейросетевого текста невозможна. И как насмешка, в этот же день на АТ выкатили в бета-тест детектор «Горыныч», а затем Яндекс презентовал свой инструмент.
Мне довелось поговорить с людьми, которые имеют отношение к его созданию. По их утверждению, более 50% динамического топа АТ, то есть половина того, что в последние полгода постоянно мелькает в виджетах — более чем на 50% сгенерировано с помощью нейросети.
Я не слежу за топами и виджетами уже давно (в этом нет никакого смысла) и не могу проверить, насколько правдиво это утверждение, но мои собственные тесты (хотя изначально я был настроен весьма скептически), показали, что детекторы — в целом работают. С погрешностью, но указанный процент, в целом, вполне может быть правильным. Другое дело, что детекция не может быть доказательством, потому что это не сертифицированный механизм с непрозрачными алгоритмами.
В общем, как ни крути, таких текстов — уже полным-полно. Причем АТ в этом отношении аутсайдер, на других порталах, по некоторым оценкам, 4/5 заливаемых новинок — нейронка. Я специально не буду использовать уничижительный термин «нейрослоп», потому что изготовленные с помощью нейронки тексты могут быть очень разного качества, от откровенного мусора до неплохо отредактированных профессиональных работ.
О чем это говорит?
Мы стоим на пороге большого, системного кризиса, связанного с технологическим переходом. Собственно, уже одной ногой в него вляпались. В очередной раз очень серьезно меняются правила игры, эти изменения очень масштабны и затронут всех без исключения — авторов, читателей, порталы.
Почему я так считаю?
Потому что изменился способ производства текстов.
Из ручного он стал машинным. Нейросети уже научились писать формульную литературу (ту, что воспроизводится по шаблону), на уровне среднего автора и в следующих итерациях научатся на уровне хороших и отличных. Это время уже не за горами — год, может два-три.
Что такое нейросеть в нынешнем раскладе? По сути, это умноженный на 100 литературный негр. Позволяющий с огромной скоростью и мизерными затратами создавать коммерческие тексты по заданной сюжетной формуле, уже сейчас с уровнем качества, который устраивает массовую аудиторию. Причем для работы с таким негром оператор может не обладать писательскими навыками, талантом и опытом — достаточно продаваемой формулы и грамотного маркетинга. Хорошо, конечно, если он обладает, тексты будут уровнем выше, но в целом — это совсем не обязательный скилл. В общем, товарищ маузер (нейронка) мгновенно уравнял всех, понизив порог входа до суперминимального -)
Никакой, даже суперплодовитый автор никогда не сравнится с сеткой по скорости-качеству. Глава в день, две главы в день — забудьте. Даже уникумы с работоспособностью 24/7 и подвалом настоящих негров захлебнутся. Алгоритмы большинства порталов устроены так, что наверх всплывает крупный объем текста, аккумулирующий внимание за счет частых выкладок, и конкурировать с нейронкой здесь практически бесполезно.
Вариантов тут (реальных) для живых авторов два.
Либо уйти на второй план и смириться, либо самому стать оператором нейросети. Ибо либо ты хреначишь с помощью нейронки и конкурентоспособен, либо тебя раз — и съели те, кто ей хреначат.
Выбор немного очевиден, не правда ли?
Ребята, даже те, которые сейчас ухмыляются, это касается всех. И вас тоже, которые сейчас на коне и думают, что так будет всегда. Дочитайте статью до конца, ниже я все объясню.
Почему это кризис? Почему это плохо? Разве это не прогресс и развитие?
В краткосрочной перспективе — возможно, так кажется. Особенно тем, кто финансово заинтересован. Но в средне-и-долгосрочной это прямой путь к потере репутации. Причем как авторов, так и порталов. Если сайт набит нейронными текстами, кто будет искать здесь живые? Устойчивая репутация площадки с нейронным топом, который выживает все остальное — такая себе история. Многие порталы прекрасно понимают, что засилье нейронных текстов понижает рейтинг площадки, в глазах как читателей, так и авторов, усложняет маркетинг и обесценивает рекомендательные механизмы. Будем честны, у селфпаблишинг порталов и так репутация сайтов «бульварного чтива», но нейронка — это еще на ступень ниже.
Еще потому что это медленная смерть платежеспособного комьюнити. Портал — это экосистема, где очень важную роль играет личность автора. Удобство — да, реклама — да, но поймите простую вещь — любую книгу сейчас можно прочитать бесплатно. Покупки и награды — по сути это добровольная поддержка автора, чтобы он мог писать дальше (сейчас кто-то из самородков заржал в голос, но до понимания процессов еще нужно дорасти, пять-семь лет опыта и пара миллионов проданных копий помогут). Качество, конечно, играет роль, но читатель прекрасно понимает, что объем вложенного в нейронные тексты человеческого труда и личности автора — как правило, минимальный. Так зачем их поддерживать? Именно поэтому, кстати, операторы нейросетей как огня боятся всяких маркировок и разделения с живыми авторами. Они жизнеспособны лишь пока мимикрируют под настоящее творчество. Конечно, какая-то (возможно, большая) прослойка аудитории готова это потреблять вне зависимости от авторства, а какая-то часть наиболее быстро перестроившихся авторов будет удовлетворять их запрос, но конечная станция этого шапито просматривается весьма ясно.
Она описана в учебнике экономики, в параграфе об укрупнении производств и появлении монополий. Законы рынка, увы, безжалостны. Кустарей сменят мануфактуры — коллективы из людей, писателей и редакторов с кучей нейронок, способные генерировать популярные тексты под сотней псевдонимов во всех сегментах. С рекламным бюджетом, о котором инди-авторы могут только мечтать. Такие объединения в зачаточной стадии существуют уже сегодня, а завтра они будут бороться за рынок. В итоге вообще не очень ясно, зачем порталу с аудиторией, потребляющей такие тексты, нужны авторы. Они становятся лишним звеном, потому что точно такое же производство продающихся текстов можно организовать самостоятельно.
Еще очень вероятна девальвация в ценовом сегменте. Когда себестоимость вложенного труда околонулевая, а конкуренция бешеная, продукт обречен дешеветь. Нейронные тексты, скорее всего, тоже пройдут эту стадию, когда поток генерируемого контента начнет перехлестывать через платежеспособный спрос.
А есть он вообще, этот спрос?
Постоянно слышу, что раз это востребовано читателем, раз он голосует за нейронку вниманием и рублем, то получается, что все нормально, и читателю такие тексты и нужны-с. А порталу их продажа, получается, очень выгодна.
Мне видится, что это совершенно не так. Дело в том, что у каждого покупателя есть фиксированный бюджет, определенный лимит, которую он тратит в месяц на что-либо. В нашем случае — на книги. Если будет больше контента, читатель не купит больше. Он купит ровно столько же, поэтому продажа нейронных текстов на общую выручку вообще не влияет, просто деньги перераспределяются и их недополучает кто-то другой.
Думаю, что порталу в первую очередь интересно увеличение платежеспособной аудитории, но тут такое дело — нейронные тексты ведь не привлекают ее самостоятельно, они паразитируют на заданных «живыми» авторами трендах и собранной ими аудитории. Будем честны — подавляющая часть нейронных текстов — в той или иной степени рерайт популярных «живых» книг. Возможно, мы доживем до времени, когда с помощью нейросети будут задавать новые направления, но пока стеклянный потолок не пробит, увы.
А что касается готовности платить, как я уже сказал, читатель готов платить лишь пока не знает, что это нейронка. А потом — хрен его знает, поэтому создатели таких текстов яростно, до последнего будут притворяться настоящими живыми авторами, просто очень талантливыми и плодовитыми. Ну а что такого, взял и написал 10 книг за полгода и еще пять в соавторстве? Завидуйте молча моей работоспособности и таланту!
На самом деле это называется гораздо проще и грубее, и все мы знаем, как.
Стоит упомянуть еще три момента.
Первый. У каждой площадки есть 5-10% якорных авторов, которые генерируют 70-80% продаж. Это не просто производители контента — это бренды с большой лояльной аудиторией, с которыми ассоциируется портал. Этим авторам обычно есть куда уйти и они уйдут первыми, потому что они больше всего теряют от размытия продаж. Живые авторы готовы стоять с нейронкой на одной полке, лишь пока не появится конкурентоспособная площадка с УТП, гарантирующим чистоту контента, потом стратификация произойдет сама собой. А это обязательно случится, по тем же самым законам экономики, где востребованная рыночная ниша неизбежно заполняется.
Второй. Вопрос авторских прав на нейросетевой контент находится в серой зоне. Он не решен окончательно ни в одной юрисдикции. Портал с тысячами нейротекстов сидит на юридической мине — если завтра суд решит, что нейронка не подлежит копирайт-защите, то весь этот массив становится бесплатным для любого агрегатора. А если выяснится, что некий автор (или группа авторов) обучал нейронку на чужих текстах — это уже потенциальный коллективный иск от живых правообладателей.
Третий момент для многих совсем смешной. Это деградация авторов и читателей в профессиональном и творческом плане. Да, я прекрасно понимаю, что сейчас большинство работает с девизом «Бабки, сука, бабки!», и плевать хотело на такие вещи, как самореализация через творчество, но тем не менее. Тому, кто пишет с помощью нейронки, не нужно изучать ремесло, пополнять свой вокабуляр и иметь интересный жизненный опыт. Талант, творческая искра и чувство слова — тоже не обязательны. Скилл оператора нейросети и живого писателя — как ни крути разный. И очень грустно, что многие таланты будут закопаны, а многие звездочки никогда не взойдут. Я верю, что настоящий талант всегда пробьется, но будем честны — не все им обладают, и многих авторов калибром поменьше нейронка просто лишит каких-либо шансов пробиться к читателю.
Это были ответы на «почему это плохо». Но так или иначе, нейросетевые тексты уже здесь, от них никуда не уйти, прогресс неминуем. Бороться с ним — все равно что скакать с копьем на ветряные мельницы. Нейросеть — теперь такой же инструмент автора, как ноутбук, ворд, гугл или скривенер, и это навсегда. Другое дело, хорошо ли это, и для кого хорошо? Можно долго сотрясать воздух, но хорошего будущего тут нет, ни для авторов, ни для читателей, ни для площадок. Как мне кажется, есть четыре варианта развития событий.
- Полный запрет нейронных текстов. «Чистая» площадка с тщательной модерацией. Самый невероятный вариант, потому что нынешние площадки — это супермаркет, основанный на принципе «публиковать и продавать может любой». Тем не менее возможен в виде агрегатора авторских площадок типа Патреона, Бусти, и тому подобных сайтов, куда читатель приходит к конкретному человеку, а не за контентом. Либо как новая издательская модель, но в цифре.
- Стратификация контента путем маркировок, отдельных виджетов, механизмов рекомендаций и так далее. Принцип простой — разделение живого и нейронного, и он наиболее жизнеспособен, но упирается в невозможность прямой детекции и постоянную борьбу щита и снаряда. Потому что, мы помним, нейронные тексты все равно будут маскироваться под живые и лезть во все щели — там, где деньги, нет никаких правил.
- Ни да, ни нет. Самый вероятный и временный. Пока у площадок нет ясного экономического стимула бороться с нейронными текстами (а он появится только когда репутационные потери, всеобщее недовольство или отток платежеспособной аудитории не станет заметен), все будет идти по-прежнему и постепенно маргинализоваться, пока 9/10 релизов не станут нейросетевыми.
- Портал с нейросетевой литературой. Генерируемой массово под читательский запрос, и неважно кем — инди-автором, коллективами нейронщиков, самим порталом или самим читателем (да, вполне реально и такое). Живым авторам в такой среде выжить почти нереально, да и незачем.
Кстати, решение администрации АТ с маркировкой текстов — это именно третий сценарий, так как оставляет огромную лазейку. Совершенно ясно, что все будут косить под нейросетевую редактуру, чтобы избежать маркировки и это просто немного отсрочит неизбежный конфликт.
Живые авторы, ИМХО, тоже разделятся на категории.
Авторы-бренды — те, кто успел построить прямой канал с читателями и продает не текст, а себя, свою интонацию, свой мир, свои отношения с читателями. Эта группа, возможно, будет зарабатывать даже больше, чем сейчас, потому что конкуренция отсечет слабейших, а платежеспособная аудитория сконцентрируется вокруг тех, кому доверяет.
Гибридные авторы — те, кто использует нейронку как инструмент. Те, кто пишут с «усилителем» и пытаются сохранить свой авторский голос. Это серая зона, и сообщество будет долго спорить, честно ли это. Я думаю, это рабочая модель, если автор честен с аудиторией. Сколько она проживет — бог весть.
Операторы нейросетей — те, кто генерирует и склеивает тексты с помощью промт-инжиниринга, используя это как основной инструмент. Тут возможно много градаций качества, но важен главный способ производства.
Все остальные — вытеснены. Автор без бренда, без прямого канала, без скорости нейрогенерации — обречен на вымирание, потому что просто никому не виден. Это реальность любого затоваренного рынка.
Читатель тоже стратифицируется.
Аудитория формульных жанровых книг и палп-фикшена не отличает нейронный текст от живого, и не хочет отличать — ей нужен дофамин, сюжет, поток. Даже сейчас они часто не знают имя автора, чью книгу читают. А зачем, если они все плюс-минус одинаковые? Эту аудиторию заберут операторы нейросетей. Более требовательный читатель пойдет за конкретными авторами, за курируемыми подборками, за рекомендациями от людей, чьему мнению доверяет. Насколько пропорциональны и обширны эти рынки, покажет время и практика. Но, как мне кажется, переход от экономики продажи текста к экономике доверия — просто неминуем.
Критикуя — предлагай.
Что можно сделать в этой ситуации?
Ну, в целом, можно не изобретать велосипед, а взглянуть туда, где этот процесс идет быстрее. Например, на Амазон или в Китай. Как мы видим, Амазон ограничил количество релизов и ввел обязательную нейросетевую маркировку, Royal Road — трехуровневую систему маркировки (без AI / AI-assisted / AI-generated). В Китае все еще строже — там обязательна двухуровневая маркировка сгенерированного контента (видимые метки для пользователей и метаданные в файлах), а площадки обязаны проверять контент перед публикацией, и при обнаружении этих меток добавлять предупреждения.
Ни одна из этих систем не решила проблему, и большой вопрос, готовы ли наши площадки к такому уровню контроля.
На мой взгляд, маркировка и стратификация контента просто необходимы. Также необходим пересмотр алгоритмов рекомендательных механизмов, выталкивающих наверх все, что быстро выкладывается и ограничение релизов от одного автора, в том числе и соавторских. Во всех иных случаях — нейросеть сожрет все живое (что будет дальше, вопрос для меня очень интересный, учитывая, что паразитировать будет не на ком).
Есть во всем этом апокалипсисе и одно светлое пятно. У нейросетей имеется несколько фундаментальных ограничений. Я не буду говорить об оригинальности, потому что пересобирать кубики нейронка умеет лучше человека, но у больших языковых моделей нет и никогда не будет эмоционального интеллекта, личного жизненного опыта и авторской интонации. Да, все это можно удачно имитировать, но на выходе все равно будет фальшивка. Так как вы — никто не скажет. Поэтому эмоциональный контекст, призма вашего опыта и авторский голос — наверное, самое важное сейчас.
Берегите и развивайте их.
Другие мои статьи вы можете найти по тегу #дневник_автора в моих соцсетях: