Уникальность текста и риски использования ИИ.
Автор: Радомир СтаршСуществует прекрасное заблуждение среди авторов, пишущих совместно с ИИ, что их текст обладает уникальностью, а исходя из неё — ценностью. На самом деле, чем больше вы используете нейросети, тем больше ваши тексты становятся неотличимыми не только от генеративного текста, но и от других таких же авторов. Вы, возможно так и не обретя, теряете свой голос.
На таких книгах можно смело затирать имя автора и писать поверх универсальное "Иван Пу́льпин". От слова пу́льпа — смесь рудной пыли с водой. Это серая масса, вязкая, как трясина.
Если вы имеете хоть какие-то амбиции на уникальность, считаете, что у вас есть авторский голос или желаете его обрести, то пишите сами. И редактируйте сами. Если работаете с наёмным редактором, то убедитесь, что тот тоже не использует ИИ в своей работе.
Причин на это две.
1. Всё, что "скармливается" нейросети, тут же становится "общим достоянием".
Она сможет использовать ваш текст как основу для генерации предложений, абзацев, отдельных эпизодов, выполняя запросы других пользователей. Когда я впервые услышал об этом в видео зарубежного блоггера, я не поверил. Но теперь, увидев наглядные примеры, реальные ситуации, я убедился, что это правда. Вы можете просто скинуть текст любимой ИИ-шечке, чтобы поправить запятые, а уже через месяц прочитать в чужом рассказе аналогичную сцену у другого автора, второго, третьего…
И это не тот случай, когда какой-то человек прочитал вашу книгу, ему понравилась сценка или эпизод, он дай, да и переиначил для себя. Это будет один случай из скольки? Из ста? Тысячи? Десяти тысяч?
А в случае с ИИ он сразу станет массовым. И не только в русскоязычном сегменте, но и на других языках. В текстах появятся такие же эпизоды. Не точная калька, но узнаваемая копия.
Уникальность вашего произведения резко падает.
2. Всё, что советует или генерирует нейросеть, уже ею было использовано, используется и будет использоваться в подобных ситуациях.
И ваша история незаметно обретёт красивые, атмосферные детали, которые будут дружно перекликаться с аналогичными моментами или даже целыми эпизодами в чужих текстах.
Вы хотите, чтобы ваш читатель в какой-то момент остановился с мыслью: «Я уже это где-то читал...» Или даже вспомнил конкретную книгу и эпизод, точно как у вас в тексте?
Когда я говорю, да и не только я, что у ИИ есть узнаваемый «голос», это не фигура речи. Это набор узнаваемых паттернов.
Покажу наглядный пример. Читая множество рассказов в рамках проекта СтаршРадар, я вдруг обратил внимание на почти точно повторившееся в двух рассказах разных авторов предложение, в котором упоминался «дешёвый синтетический кофе». Да, не любое упоминание дешёвого синтетического кофе — это признак генеративного текста. Но давайте посмотрим на конкретные примеры, вы поймёте, что это повторяющийся паттерн.
У меня нет цели обвинить авторов в использовании ИИ. Они пишут, как хотят, и это их дело. Моя цель — показать, что использование ИИ, даже для редактуры, прямо или косвенно снижает уникальность ваших текстов.
а) Рассказ Новикова Михаила «Звёзды вместо правил»:


Для меня очевидно, что в тексте есть генеративные части. Для сомневающихся я добавил скрин проверки в детекторе Яндекса.
Этот отрывок показателен тем уже, что описание повторяется в соседних абзацах. Обратите внимание на предложения полностью, в которых пишется о "синтетическом кофе".
б) Гизум Герко "Звезданутый технарь".
Нужно отдать должное, этот автор поставил метку, что использовал ИИ для создания книги. Потому сомнений быть не может. Смотрим:

Обратите внимание, предложение не идентично первому примеру. Конструкция была отредактирована и "размыта" по всему абзацу.
Но мы всё так же читаем и о воздухе, ударившем в ноздри, и о горелом пластике, и дешёвый синтетический кофе. Куда же без него, ведь именно его я и искал. Ещё обратите внимание на свежий воздух. Это понадобится в следующем примере.
Приводить результат проверки нейродетектора Яндекса не буду, всё и так очевидно.
Идём дальше.
в) Пример не с АТ, с фикбука. Фанфик на Bangtan Boys.


Если есть сомнения, что в написании текста принимала участие нейросеть, вот результат проверки в Яндекс детекторе.
Что мы видим? Опять жжёный запах, но не пластика, а металла, воздух уже не свежий, а густой и спёртый, и знакомый дешёвый синтетический кофе.
Идём дальше.
г) Андрей Александров, "Герой нашего времени | Валюта восприятия"

Что мы видим? Опять дешёвое синтетическое кофе, пластик, горечь (горелый/гарь/жжение/жжёный). Замечаете уже паттерн?
Это не всё, есть ещё примеры.
д) Рецензия Сергея Паровозова на книгу Александра Гончарова "Последний видеосалон на окраине галактики":

Думаю, к этому моменту паттерн стал чётко заметен, не так ли? Снова дешёвый синтетический кофе, снова перегоревшее или горькое что-то.
д) Дмитрий Мотнев "Протокол раскол":

Небольшая вариация. Уже без горечи, но зато с озоном, с запахом какого-то чувства. В этом случае — страха.
е) Этот пример вообще забавный. С озона, описание товара:

Опять дешёвый синтетический кофе, запах озона.
е) Фанфик по "Ориджиналы":

Почему нейросеть так любит дешёвый синтетический кофе?
ё) Асет Советтурсын, "Архитектор Памяти"

Пускай вас не смущает "низкий" процент — чем больший кусок текста этой книги копируешь в детектор, тем больший процент показывает. На всю главу выдаёт 99%
ж) Анатолий Шигапов, "Светлый Майк или не будите спящую бабушку".

Опять дешёвый синтетический кофе, кислый запах, упоминается пот. Уже это было где-то, вам не кажется?
з) Пост из ВК

Опять дешёвый синтетический кофе, опять проводка, но не горелая, а перегревшаяся, озон уже знакомый.
и) Фанфик на Dead Space

Опять запах пота, страха, дешёвого синтетического кофе.
Думаю, хватит примеров. У меня есть ещё, поиск в гугле выдал три страницы результатов. Означает ли это, что всякое упоминание дешёвого синтетического кофе является признаком генеративного текста? Нет, конечно. Я нашёл целых три случая (!) где текст не давал подозрений в том, что его сгенерировала ИИ. Вероятность такая есть, но очень похоже, что эти три автора написали его сами, по незнанию использовав "клише" нейронки.
Бояться ли этого или нет — решать вам.
Похоже, я случайно добавил работы тем, кто пишет нейронкой, но заботится о том, чтобы об этом никто не узнал. Я не специально.
Вывод: если вам важна уникальность вашего текста, если вы работаете над созданием собственного узнаваемого стиля, ищите свой голос, не используйте генерацию текста и не скармливайте свои черновики нейронке — ни для редактуры, ни для проверки знаков препинания, поиска опечаток. Это приведёт к тому, что её отдельные, небольшие части появятся в текстах авторов, которые используют нейросети для генерации текста.
Как-нибудь я напишу пост о том, как "экологично" пользоваться нейросетью в качестве помощника для писателя.