Куча текстов ИИ в топе
Автор: Mr.NobodyВ связи с дискуссией о маркировке текстов, созданных с помощью ИИ, решил проверить свои. Пользовался вот этой программой. https://yandex.ru/lab/neurodetector Позакидывал туда рандомные главы и отрывки, посмотрел и выдохнул.
В целом, и мои старые тексты на этом аккаунте, и новые, с коммерческого, нейродетектор определяет, как созданные человеком, там либо 0% вероятность, что создано нейросетью, либо менее 1%. В общем можно расслабиться, репрессии мне не грозят.
Что забавно, к одному проценту проценту приближаются именно старые тексты, которые я писал, когда, можно сказать, только учился, набивал руку. Хотя, возможно, просто так совпало.
А потом я решил взять рандомные книги из популярного и ГН и проверить. И охренел. У многих популярных книг детектор показывает почти 100% вероятность того, что книга создана нейросетью. Причём разницу я так и не смог постичь. Подумал, что он записывает в ИИ тексты с короткими, рубленными предложениями. Переделал кусок своего текста, попилив предложения и наставив там точек вместо запятых. Но с 0% выросло всего до 0,3%. Т.е. основной критерий не этот.
В общем, непонятно. Возможно, действительно куча авторов генерят тексты в ИИ, а возможно, у них такой стиль, который программа распознаёт, как ИИ. Причём разницу понять не могу. Какого-то кринжа, бессвязности, откровенных нестыковок внутри самих отрывков не видно.
Т.е. я не склонен обвинять автора в использовании нейросетей, если какая-то программка записала его в ИИ. Как это всё работает, понятия не имею. Но ведь на основе каких-то критерий детектор определяет, сгенерирован текст машиной или написан разумным существом?
Но вот создаётся у меня впечатление, что людям как будто больше нравится читать тексты в "ИИ-стайл", а человеческие в основном менее популярны. Хотя "человек-стайл" в популярном тоже есть. В общем, тут надо собирать статистику, а это уже большая работа, и мне лень. Так что ничего не утверждаю.
P.S. Текст данного блога сгенерирован нейросетью с вероятностью 0,96%