Срачи на АТ - это не только ценный мех...

Автор: Сергей Трупанов

но и несколько десятков полезных легкоусвояемых (или легкоусваиваемых?) минусов. Радует, что за столь короткий период пребывания в творческом коллективе уже познал обе крайности системы репутации. 

Мне показалось, что получил я это всё заслуженно. По крайней мере, потому что не очень ясно донёс свою мысль. Рука тянулась нажать кнопку "Ответить" в комментариях, но поскольку отвечать было тупо некому, более подробный вариант моего измышления я решил изложить у себя. Итак, я твёрдо убеждён, что в нынешнем виде система маркировки текстов несовершенна. И несовершенность эта лишь усугубляет причину, по которой она появилась. 

Сегодня книга может официально пребывать лишь в одном из двух состояний: иметь отметку "Создано с помощью нейросети", либо не иметь таковой. Наличие отметки несёт (пока что) два негативных последствия: запрет на участие в официальных конкурсах, исключение из выдачи с использованием фильтра. Отсутствие отметки - ничего не несёт. Это уже 2:0 в пользу отсутствия отметки. Но то поверхностное. Поглубже: попытка вместе с водой выплеснуть и ребёнка. Причём, как мне лично кажется, намеренная. За лозунгами "борьбы за справедливость" торчат уши обыкновенной ксенофобии. Прежде, чем продолжить, вопрос: "Почему я должен тратить своё драгоценное время на чтение ИИ-шлака, попадающегося мне в подборке?" Ответ: "Потому что это ТВОЯ подборка, которую ТЫ сформировал своими действиями на сайте. Требование принудительной маркировки - это перекладывание с больной головы на здоровую"

Теперь к делу. О серой зоне.

Как упомянул выше - сегодня у книги может быть ровно два состояния. Одновременно с этим способов использования больших языковых моделей в процессе написания значительно больше. Методом научного тыка обитатели АТ уже определили три основных кластера. Вот они:

Тип 1. ИИ как продвинутая печатная машинка. Помогает подобрать синоним, проверить грамматику.

Тип 2. ИИ как инструмент воспроизведения стиля. Генерирует существенные объемы текста (абзац, страницу) по четкому промпту. Автор не использовал последовательность токенов напрямую, но он задал эстетические ограничения и принял решение, достойна ли эта версия текста быть опубликованной.

Тип 3. ИИ как "философская чернильница". Генерирует весь текст по односложному запросу уровня «напиши детектив в стиле Агаты Кристи». Автор не занимается доработкой текста.

Между ними, вероятно, болтаются ещё какие-то более точные градации. Но кто ж мы такие, чтоб "в сортах г**на разбираться", верно? Для начала хватит и такой шкалы. Ибо в официальной риторике неприемлемы опции 2 и 3. В "народной" риторике - вообще весь список расстрельный. И эта самая "народная" риторика исходит из ложного утверждения "любой текст, написанный с использованием ИИ - не авторский", добавляя при этом, что авторство определяется исключительно набором инструментов для написания.

АВТОРСТВО - по-разному понимаемый термин в различных областях, но чаще используется философское определение. С этой точки зрения АВТОРСТВО - это проявление человеческой воли и сознания в процессе творчества. Таким образом, даже произведения третьего типа, следуя формальной логике, являются авторскими, т.к. изначальную интенцию воспроизвёл человек, обратившись к ИИ с явным запросом.

Вывод №1: ЛЮБОЙ текст на АТ является авторским произведением, безотносительно качества такого произведения.

Чисто по-человечески, желание отказать в авторстве, формализованное в том самом требовании прицепить отметку "Создано с помощью нейросети", мне понятно. Ведь оно исходит из нестерпимого желания решить проблему (если это вообще проблема) самым простым способом без попыток разобраться. Например, вижу "вкус дешёвого синтетического кофе, запах озона и чего-то ещё — не просто уникального, нового, непознанного, а чего-то таинственного, до побеления костяшек" - НУ ТУТ СРАЗУ ВСЁ ЯСНО!!! К сожалению, нет. Это может гарантированно говорить лишь о литературном опыте автора, но гарантии использования большой языковой модели здесь нет. 

Усугубляется ситуация появлением санкционированного оружия в виде Яндекс.Детектора (далее - ЯД), который теперь прикладывают буквально к любому тексту на АТ, пусть это даже и просто непонравившийся комментарий. Почему это не панацея, кажется, разжёвывали уже много раз, например, тут. Лично меня зацепил некий "ликбез", выстроенный вокруг критически опасного допущения, которое я считаю необходимым опровергнуть.

Искомое утверждение:


Отсюда, важный вывод: если мы отбросили вариативную составляющую, то один промт ВСЕГДА дает одну и ту же генерацию. Запомним: всегда.


Шаг 1. Имея текст, мы получаем обратным вычислением промт (вариативную составляющую отбрасываем)

Шаг 2. Имея промт, вычисляем генерацию.

Шаг 3. Сравниваем нашу генерацию, с тем текстом, что был на входе.

Получаем процент совпадения. Этот процент и есть результат работы детектора. Как вы видите, детектору не нужны примеры ВООБЩЕ.


Что здесь не так?

Описанный метод "обратного вычисления" промпта не используется и не может использоваться на практике для детекции. Вариативность - это базовое свойство ИИ (точнее, LLM) в целом. Управление "температурой", к которой, скорее всего, апеллирует автор, это команда нейросети "выбрать наиболее вероятный", а не "точно определить" следующий токен. Преобразование промпта в ответ — это ВСЕГДА операция с потерей информации. Один и тот же ответ может быть получен из множества разных промптов. Так, фраза "Сегодня хорошая погода" может быть ответом на запросы "Какая сегодня погода?", "Как за окном?", "Опиши сегодняшний день кратко" и так далее.

То есть, ЯД, как и другие детекторы, работают всё по тому же известному принципу:

- нарезать на чанки
- проверить Perplexity
- проверить Burstiness
- шлифануть лингвистическим анализом
- вычислить среднее


И никакой магии реверс-инжиниринга промптов. Лучшие умы планеты Земля не придумали гарантированного способа детекции текстов, созданных нейросетью, и вряд ли придумают. Чем там под капотом занимается конкретно ЯД - одному только Яндексу и известно.

Вывод №2: Способов достоверно подтвердить/опровергнуть использование больших языковых моделей для создания текста НЕ СУЩЕСТВУЕТ, кроме добровольного признания самого автора.

Таким образом, моё утверждение, собравшее за сутки под полтинник минусов, считаю аргументированно доказанным. Можете считать это моим манифестом перед началом марафона "Алгоритм творчества". За сим откланиваюсь и снимаю панамку. Напихивайте, коль хочется. Только будьте добры, с обоснуями. Поболтаем хоть. 

+7
102

0 комментариев, по

842 9 19
Мероприятия

Список действующих конкурсов, марафонов и игр, организованных пользователями Author.Today.

Хотите добавить сюда ещё одну ссылку? Напишите об этом администрации.

Наверх Вниз