Да все равно никто не узнает!

Автор: Саморский

Здравствуйте уважаемые читатели, коллеги-писатели, редакторы, корректоры, бета-ридеры, и просто случайно проходившие мимо. В последнее время в блогосфере АТ просто невероятное количество споров о том, "спалят" или не "спалят" модераторы, если книгу вместо вас напишет нейросеть. 

Честное слово читать все эти обсуждения уже просто смешно. 

Еще смешнее выглядят пользователи не разбирающиеся в НС, но уже до усрачки испугавшиеся за свои "кровью и потом" выстраданные тексты. А ну как их неправедно забанят? И что тогда делать? Как доказать что все написано человеком, если специально для этих целей созданные сервисы ошибаются, чуть больше, чем всегда?

Вот что, друзья мои. Заканчивайте этот бессмысленный флешмоб. Можно обмануть модераторов, читателей (ненадолго), и даже меня. Но нельзя обмануть Ее Величество Статистику. И специально для таких спорных случаев существует масса сервисов глубокого семантического анализа текстов. Иногда его называют SEO-анализом, но это, по сути, одно и тоже.

Не знаю, оставят ли ссылки модераторы, в любом случае рисковать не буду, гуглите самостоятельно. Заходите на самые известные сайты, такие как advego.com, text.ru и т.п. и в поле для проверки текста вставляйте ваше творение.  

Что вы получите в результате анализа? 

А в результате  вы получите статистику, очень и очень много непонятной статистики. 

Что теперь с ней делать? Анализировать!

  • Частотность, (отношение количества экземпляров данного объекта полному количеству экземпляров всех объектов в данном множестве), или в переводе на русский (гуманитарный) - наиболее часто встречающиеся слова в тексте. Для каждого писателя данный параметр уникальный.
  • Словарный запас (для каждого автора уникальный параметр, и с возрастом почти не меняется).
  • Уникальность текста (относительно других текстов в интернете, может быть полезно для поиска "похищенных" пиратами и плагиаторами текстов, сменивших обложку и автора)
  • "Тошнота" (слишком часто встречающие слова). Некоторые сервисы выдают облако, что очень наглядно для таких слов, как "был", "была", "было" и т.п. Сами понимаете, для нейросети набор "слов-паразитов" будет слегка иным. но он тоже есть)
  • "Водность" (вода, и в Африке - вода).
  • Грамматические ошибки и многое другое.

Как вы уже наверное догадались, для каждого писателя соотношения всех вышеперечисленных параметров будет уникальным. Особенно словарный запас и частотность обмануть сложно. У текстов написанных ИИ эти характеристики отличаются значительно. Даже сильно переработанные тексты от нейросети не совпадут по параметрам с вашими предыдущими текстами. Кому любопытно, - разбирайтесь сами.

Какие же выводы? 

А помните скандал с рукописью Шолохова "Тихий Дон", которую якобы написал какой-то неизвестный старый дед, а Михаил Александрович ее присвоил, переделал и опубликовал. Не помните? Погуглите! 

Чем закончился скандал? Экспертизами! В том числе - стилометрическим исследованием.

Стилометрия — это количественное исследование стилистики, обычно включающее частотный анализ письменного текста.

Ну вот, собственно, и все. Гештальт закрыт.

Но вы можете и дальше тешить себя надеждами на каторжный труд литературных рабов и гениальные нейросети, которые станут клепать за вас бестселлер за бестселлером. А вам останется только считать полученные бабки и предаваться наслаждениям. Ну а модераторы? Да как они узнают? Ничего они не узнают...

Но учтите, жевать и глотать за вас будут тоже нейросети.

+70
336

0 комментариев, по

12K 531 846
Наверх Вниз