И опять о нейросетях
Автор: Анна АлмазнаяТут завелась в вк одна интересная дискуссия, о использовании нейросетей. Мол, существуют специальные маркеры, которые пользователь не видит, но автор комментария видит... это, конечно, полная фигня, но я задумалась.
Что нейросеть будет каким-то образом маркировать пропущенные через нее тексты, это понятно. Однажды будет. Но в последнее время к авторам в сети появилась новая претензия "ты не мог свой текст нейросетью поправить? откуда столько фигни?" И я задумалась. И поговорила с Gemini. Алисы у меня нет, разговариваю с кем могу, простите. Выводы делайте сами.
как можно узнать, что текст написан нейросетью?
Узнать, написан ли текст нейросетью, становится все сложнее, поскольку языковые модели постоянно совершенствуются. Не существует универсального способа или детектора, который всегда работает. Однако можно обратить внимание на несколько характерных признаков.
Общие признаки, которые могут указывать на текст от ИИ
- Идеальная грамматика и синтаксис. Тексты, созданные ИИ, редко содержат опечатки, грамматические или пунктуационные ошибки. Они обычно очень "чистые" с точки зрения языка.
- Нейтральный и безличный тон. Искусственный интеллект, как правило, не имеет личного опыта или эмоций. Поэтому в тексте может отсутствовать авторская интонация, личные истории, уникальные наблюдения или юмор. Текст часто кажется "стерильным" или слишком отстраненным.
- Использование общих фраз и клише. Чтобы звучать авторитетно, ИИ может использовать стандартные вводные и заключительные фразы, а также распространенные обороты речи. Например, "В заключение...", "Более того...", "Следует отметить, что...".
- Отсутствие мелких ошибок. Человеческие тексты часто содержат небольшие несовершенства: повторение слов, неуклюжие фразы или незначительные логические пробелы. ИИ, напротив, создает очень гладкий и упорядоченный текст, который может казаться неестественно идеальным.
Контраст между ИИ и человеческим текстом
Признаки текста от ИИ | Признаки человеческого текста |
Идеально выверенная структура и последовательность. | Может быть более спонтанным, иногда менее логичным. |
Общий, энциклопедический стиль изложения. | Содержит личные мнения, опыт, а также культурные или региональные отсылки. |
Отсутствие опечаток и мелких ошибок. | Часто содержит мелкие ошибки, которые выдают живой язык. |
Звучит убедительно, но может содержать "галлюцинации" (ложную информацию). | Основан на личном опыте или знаниях автора. |
В конечном итоге, нет однозначного метода, который позволяет на 100% определить, написан ли текст нейросетью. Лучший способ — смотреть на текст в целом и искать совокупность перечисленных признаков, а не полагаться на один из них.
есть ли скрытые символы, которые нейросети вставляют в свой текст?
Нет, нейросети не вставляют в текст скрытые символы в привычном понимании (например, неотображаемые знаки или специальные коды), которые можно было бы просто найти.
Однако, исследователи и разработчики активно работают над методами, которые можно назвать цифровыми водяными знаками для текста.
Как работают текстовые водяные знаки
Вместо того чтобы вставлять видимый или невидимый символ, нейросеть может обучиться создавать скрытый статистический паттерн. Этот паттерн практически невозможно заметить человеку, но его может обнаружить специальная программа-детектор.
Например, нейросеть может слегка смещать выбор слов в тексте. Вместо того чтобы выбирать наиболее вероятное слово из своего словарного запаса, она будет отдавать небольшое предпочтение словам, которые соответствуют заранее определенному "секретному" алгоритму. Такой паттерн делает текст уникальным для конкретной модели, не влияя на его читаемость.
Цель такого подхода — обеспечить прозрачность и помочь в борьбе с дезинформацией, плагиатом и ложной информацией, созданной ИИ. На данный момент это направление активно развивается, но пока не является общепринятым стандартом.
если текст просто проверен на ошибки в нейросети он тоже будет содержать подобное?
Нет, текст, который был только проверен на ошибки нейросетью, не будет содержать таких водяных знаков.
Это важный момент, так как существует большая разница между генерацией текста и его редактированием:
- Генерация: Когда нейросеть создает текст с нуля, она делает тысячи выборов слов. Именно на этом этапе в текст может быть внедрен статистический "водяной знак" в виде особого паттерна.
- Редактирование: Когда нейросеть используется для проверки текста на ошибки (например, для исправления опечаток или грамматики), она не создает новый текст, а лишь вносит небольшие корректировки в уже существующий. Её цель — не встраивать собственный "отпечаток", а улучшить читаемость.
Можно провести аналогию с художником: художник (нейросеть-генератор) подписывает свою картину, встраивая в неё свой уникальный стиль. В то же время, реставратор (нейросеть-редактор) лишь исправляет дефекты на картине, не добавляя на неё свою подпись.
так же и с правкой стилистики, например?
Да, это очень хороший вопрос. В таком случае ответ может быть положительным.
Корректировка стиля — это более сложный процесс, чем просто исправление ошибок. Когда нейросеть меняет стиль текста, она не просто исправляет опечатки; она активно переписывает целые фразы и предложения, чтобы улучшить их структуру и звучание. По сути, это форма мини-генерации.
Поскольку нейросеть в процессе стилистической правки делает свои собственные выборы слов и формулировок, у неё есть возможность встроить тот же самый статистический паттерн ("водяной знак"), который она использует при создании текста с нуля.
Сила этого водяного знака будет зависеть от того, насколько сильно нейросеть изменила ваш текст. Чем больше она его переписала, тем выше вероятность, что в нём появятся такие скрытые признаки.
т.е. если текст был отредактирован нейросетью он может содержать такие знаки?
Да, это вполне возможно.
Как мы обсуждали ранее, если нейросеть используется для редактирования стиля текста, она, по сути, активно переписывает его. В ходе этой "переработки" она делает свои собственные выборы слов и фраз.
Эти выборы могут содержать тот же статистический паттерн (или "водяной знак"), который нейросеть встраивает при генерации текста с нуля. Чем больше изменений было внесено в текст, тем выше вероятность, что в нём появятся такие скрытые признаки, которые могут быть обнаружены специальными детекторами.
Для тех, кто не любит читать многабукав... чем больше вы правите (не пишите!!!!) собственный текст через нейросеть, тем более нейросеть считает этот текст своим. И позднее, когда появятся программы для распознавания нейронки, а они появятся, не балдейте, ваш правленный через нейронку текст нейронка может признать своим.
Может, я и ошибаюсь. Тогда поправьте.