Как определить, что книгу написала нейросеть
Автор: Дмитрий ПономарёвКороткий ответ — никак. На сегодняшний с высокой вероятностью детектировать, сгенерирован ли текст машиной или написан живым человеком, почти невозможно. Хотя такое утверждение не совсем верно. Ключевое слово тут вот это «почти». Таким образом, мы переходим к длинному ответу.
Думаю, уже ни для кого не секрет, что с помощью нейронки можно написать, вернее сгенерировать, практически любой текст. В том числе текст художественный, жанровый, беллетристический (и даже поэтический). Иначе говоря, искусственный интеллект уже сейчас вполне может написать книгу, правда процесс её создания потребует от пользователя некоторых усилий и временных затрат.
Кнопки «Сделай мне интересную книгу по моему промпту» пока не существует. Но можно применить пошаговый метод генерации, начиная с мозгового штурма для создания идеи, темы, сюжета, подбора вариантов концовки и заканчивая точечной работой над стилем. Да, нейронки уже умеют в разные стилистические приёмчики, например писать красивые (или не очень) метафоры, сравнения, выдавать сочные эпитеты и так далее. Им под силу и достаточно живые диалоги, и повествование от первого лица, и описание ярких эмоций. Но, как говорится, есть нюанс.
Минус в том, что созданный нейронной художественный текст гарантированно будет иметь множество характерных «артефактов» и ошибок, которые сложно устранить с помощью обычной редактуры и корректуры. И вот тут как раз появляется возможность вывести искусственный интеллект (и того, кто им пользуется), так сказать, на чистую воду.
Нужно всего лишь проверить находящийся под подозрением текст на наличие таких «артефактов» или багов. Для рядового пользователя этот метод, увы, не подойдёт. Чтобы его применить, необходим опыт использования нейросетей, «насмотренность» и начитанность. Но основные проблемы, характерные для текстовых нейро, я перечислю ниже.
Один из главных «артефактов» или багов нейронки — она грешит бесконечными самоповторами. То есть одна и та же информация выдаётся по кругу, но каждый раз другими словами. Есть также специфика повторов — часто используются одинаковые слова, но в разных сочетаниях. Конечно, людям тоже свойственна подобная ошибка, однако машинная тавтология отличается от тавтологии «человеческой» — машинная имеет более системный характер.
Ещё одна проблема — наличие бессмысленных фраз, что, как правило, сопровождается ошибками в словоупотреблении и потерей логики высказывания. Да, люди, бывает, тоже пишут бессмыслицу. Но нейронная белиберда точно так же имеет системный характер, проявляется часто и весьма регулярно, что позволяет отличить её от «человеческой».
Важный нюанс — упомянутые проблемы обычно встречаются в гладко написанных текстах. Во всяком случае, так кажется на первый взгляд. То есть текст вроде бы неплох, нет явных опечаток и грамматических ошибок, запятые расставлены более-менее корректно. Но если вчитаться, то сразу подмечаешь, что местами текст теряет связность, грешит странными повторами, а слова в некоторых предложениях зачастую использованы в недопустимом значении.
Вот эта поверхностная, мнимая гладкопись — тоже очень хороший маркер текста, созданного нейронкой. Таким образом искусственный интеллект как бы пытается отвлечь внимание читателя — кажущийся красивым, вылизанным текст скрывает под собой множество нестыковок, смысловых, логических и речевых ошибок.
Главный недостаток искусственного интеллекта в том, что для него не существует понятия «смысл». Он попросту не догадывается, что грамматически верно построенная фраза может быть полностью бессмысленной. В этом и кроется одна из причин появления всевозможных «артефактов».
Безусловно, перечисленные выше проблемы свойственны многим пишущим людям. Подчеркну, что предложенный метод детектирования текстов, сгенерированных нейросетями, не даст стопроцентной уверенности в том, что конкретную книгу создал не человек. Различные онлайн-сервисы также не будут эффективны в этом плане. И вообще никакой метод на сегодняшний день не даст такой уверенности. Почему? Смотрите короткий ответ.