Что делать писателю с нейросетью? Ну например проверять текст

Автор: Алексей Сысоев

Я долго и трудно проверял последнюю книгу и даже написал чатомгпт и гроком две программы проверки текста. Сейчас расскажу, как это было.

Люди думают, что нейросети пришли писать тексты за нас. Ну или хотя бы придумывать сюжет. Мне вас жаль, если вы позволяете нейросети писать в вашей книге целые страницы, и жаль ваших читателей. Ну а если всю книгу, то это вообще не обсуждается, таким людям что-то писать. Настоящие писатели сразу увидели, что компьютер не может ничего писать, это полная ернуда, очень шаблонно, текст изобилует излишними красивостями, строится по одинаковым лекалам. И такие тексты, кстати, сразу видно на глаз по разным признакам.

Придумывать сюжет... ну это тоже так себе. Это опять же будет очень типично, шаблонно. Можно использовать для мозгового штурма, когда оно облаком выдает кучи каких-то вариантов, и читая их, могут в голову прийти какие-то идеи… Но мне обычно быстрее и проще придумать самому, чем читать многостраничные фантазии компьютера в попытке вычленить что-то ценное.

Максимум, что она может, перефразировать какое-то предложение, когда не можешь сообразить сам, как избежать корявости или повторения. Предложить варианты.

А еще нейросеть классно проверяет. Вообще все. Ошибки, правописание, запятые, стиль. И вот это незаменимый инструмент. И кроме этого, она может написать тебе программу для проверки текста!

Когда пишешь, не замечаешь кучу вещей, при проверке глаз замыливается. И нейросеть, это тот инструмент, который поможет тебе в твоем тексте быстро найти то, что ты просто не заметил. Ошибки-опечатки — это понятно, с этим и ворд худо-бедно справляется. Но ведь он не найдет некоторые ошибки и опечатки, когда слово звучит совершенно верно. Но нейросеть способна анализировать контекст предложения, семантику, сложно понимает текст. Она тебе скажет, когда у слова не верное окончание, неверный род, падеж. Да что там, нейросеть может даже сказать тебе, чувак, у тебя персонаж девушка, а ты ее там вон в мужской род поставил случайно. Или даже когда употребил неверное имя. Нейросеть помнит, что твоего персонажа зовут вот так, у него такая профессия, и если ты по запарке написал не то имя, случайно как-то не так назвал род занятий, она ткнет носом.

А у меня много ошибок, я очень невнимательный, я просто не вижу и не замечаю. А бывает иногда просто не знаю, как пишется правильно. И какой-то компьютер, стоящий в Теннесси, мне объясняет, чувак, по-русски так не пишут и не говорят! Как ни удивительно, американские нейросети научились не только круто говорить по-русски, но понимать правила литературного текста и построений. Компьютер в Теннесси реально знает. Он учился на тысячах русских книг, и в основном на классиках, так что в определенной степени ему можно довериться.

Насколько в этом хорош яндекс гпт с Алисой я не в курсе. Потому что… Что такое яндексгпт? Это старая первая модель чатагпт версии 3.5 добученная и улучшенная. Я в первые годы пробовал ее щупать, и был крайне разочарован. Она говорила и писала хуже, чем всё на этой планете. Наверное, сейчас она лучше, но сомневаюсь, что на уровне даже ушедшего в прошлое чатагпт 4о, или дипсика.


В чем проблема проверки нейросетью

Нейросети имеют контекстное окно. Оно очень маленькое. Я не знаю, почему везде пишут про сотни тысяч знаков. И спроси любую, скажет, да я запросто могу запомнить и пересказать большую книгу. На самом деле это не так. Оно не может держать в памяти целую книгу. Может пересказывать вроде бы, но бывает теряет целые главы.

Я так и не понял, как люди это делают, чтобы было удобно. Грузить целый файл книги... нейросети теряют контекст, не могут удерживать в памяти сразу все, и проверяют очень поверхностно. Приходиться грузить главами. Но и тут есть сложности. Нейросеть пытается экономить токены на ответ, поэтому тоже довольно поверхностно просматривает текст и выявляет ну некий список. И потом в диалоге привыкает строить ответ определенным образом, с определенной длинной списка игнорируя кучу прочих ошибок.

Обычно лучше заставить нейросеть переписать текст и исправить. Тогда оно думает над каждый предложением, анализирует семантику, учитывает соседние предложения. И может качественно исправить неудачные фразы, выявить неверные слова. Но естественно тебе же не надо ее исправленный текст в своей книге, тебе нужны только общие рекомендации по исправлению и выявленные ошибки. И как это внести в свой текст?


Тут три варианта.

1.Открыть ее текст в окне справа, свой в окне слева, и сидеть построчно сравнивать. Внося в свой текст удачные находки. Это очень долго и запарно.

2.Использовать сравнение текстов в ворде. Там есть такая функция. И оно подчеркнет все введённые нейросетью исправления. Но это тоже очень долго и запарно потом сидеть искать глазами, думать над каждым словом.

3.Заставить выдать в сообщении список, что оно исправило. И вот с таким списком уже можно как-то работать, это быстрее и проще.


Но нейросеть может часть текста потерять, не хватит контекста, или рассказать не обо всех найденных ошибках. Но хотя бы что-то найдет и ладно.


Как я возился с проверкой

Проверяя свою новую книгу "Люмен. Целый мир в ее глазах" я прошел все круги ада с чатомгпт и гроком. Они меня просто достали. Я пытался повсякому научить их работать и научиться самому работать с их ответами так, чтобы не сидеть полдня.

Чатгпт в этом плане вообще посыпался. Постоянно терял контекст, обрезал главы и быстро исчерпывался лимит на загрузку текстовых файлов, там всего 5 штук… в сутки. А главу лучше грузить отдельным текстовым файлом, чтобы не забивать ему контекстное окно в диалоге. Грок в этом плане показал себя лучше. Файлы грузить можно бесконечно, отвечает бесконечно. И у него были «проекты», а в чате не было в тот момент. Там можно было создать проект, прописать четкие инструкции. Что проверяй в несколько этапов, отдельно стилистику, отдельно запятые, выдавай ответ таким-то списком в таком-то формате.

Однако, я и чат использовал для проверки некоторых сомнительных предложений грока. Русский язык это просто класс… Там в одном и том же слове могут стоять разные буквы, и оба варианта правильны, и никто не знает какой лучше. Ну кроме может быть дипломированного профессора русского языка. Так же с запятыми, тире и чем угодно. Обе нейросети могли выдавать совершенно разные ответы и заверять, что это именно так пишется. И даже в одном диалоге нейросеть могла сказать, это пишется так, по-другому не бывает, это совершенно точно, мамой клянусь. В следующем сообщении говорить ровно наоборот. Но эти случаи были редки с очень специфическими вещами.

Определившись в гороком, я делал им проверку каждой главы в четыре отдельных этапа.

1.Общие впечатления и злая критика (о, грок это умеет, нервным лучше не применять).

2.Благозвучие и стиль.

3.Запятые

4.Расставить букву ё (зачем? Ну блин, надо, орфограмка приучила ставить)

5.Ошибки, опечатки, неверное употребление слов.


Потом я сократил это до двух пунктов «благозвучие» и «запятые с ошибками»


Как я написал программу и зачем

В итоге я выработал некий пайплайн работы над каждой главой. Грок проводил два этапа проверки и писал списки в сообщении, что нашел и что предлагает исправить с пояснением зачем и почему. Но все равно это было все долго и запарно. Он все вываливает, где было, где стало  —сложно разглядеть. Потом надо найти это место в собственном тексте, посмотреть, что там, заменить слово… Глаза устают, мозг устает, здоровье у меня подорванное, а впереди еще 30-40 глав, а проверил за день половину главы..

И я подумал, так дело не пойдет, вот если бы как-то настроить, программа может есть какая-то. Но стойте, этот чатгпт-5 типа вроде очень хорош в том, чтобы писать программы? Может заставить его написать?

Я при этом не программист, ничего в этом не понимаю, не знаю ни один язык программирования. Когда-то знал немного HTML мог совсем простые странички сайтов делать. Но это было давно, и я уже все забыл. У меня стоит на компе питон, но только затем, что он нужен для работы стейбл диффьюжен. И я как-то раз просил чат написать мне калькулятор специфический на питоне, и чуть не лопнул от радости, когда он написал без всякого моего участия в этом процессе и я смог запускать по кнопке с рабочего стола.

На видеороликах показывали, что чатгпт крайне умен теперь, можно ему картинку показать, объяснить, он все сделает. И я сначала посидел подумал, какая программа мне нужна, какие там должны быть кнопки и окошки, и нарисовал ему такой эскиз.



Спросил, как и в чем он это может сделать, надо ли какие-то библиотеки скачивать, сказал ему, что есть вот питон. Он ответил, что питон сойдет, скачивать ничего не надо, там есть библиотека. Кнопки будут страшненькими и программа будет выглядеть как на виндоус ХР, но если мол не важно… Я сказал вообще не важно, сделай. Он написал код, я просил внести множество правок. Потом видел, что мне надо бы еще кнопки добавить. Снова просил исправить. То есть это все вообще без знаний кода с вашей стороны. Я ему просто в фотошопе рисую, что хочу вот сюда вот такую кнопку. Он берет и добавляет. Может не сразу получится, не того размера, но можно все претензии ему рассказать, и он исправит.

Потом кончился лимит на сообщения. Но я допилил в гроке. Грок тоже может такие вещи делать, но ему надо чуть подробнее объяснять и не ставить слишком глобальных задач. И признаться это было не быстро, я для три возился, потому что выявлял то и дело недочеты, добавлял некоторые функции. Программа ошибалась иногда, если в ответе грока было троеточеие, и долго не мог и чату и гроку объяснить. Потом настраивал отображение цвета выделения текста, потянуло на дизайн. Хотя мне оставалось проверить уже глав 20, но раз занялся, хотелось сделать классную прогу.

И вот она



И о боже, как же она была прекрасна. Решила все проблемы. Она позволяла быстро находить у себя в тексте ошибки, и тут же вносить исправления. Быстро видеть пояснениние. И в общем, это было прекрасно.

Почему в прошедшем числе? Ну, програмку пришлось настроить на конкретный стиль ответа грока, именно по этой книге. Если грок буквально по-другому составляет список, выделяет не так, нумерацию не так ставит, все, программа не работает. Поэтому она пригодилась мне только вот сейчас, только с этим текстом, для этих четко сформулированных задач.

Еще я сделал другую программу, с ней справился один только грок. Эта программа просто искала в тексте все слова «лагерь» и «Люмен», выделяла их цветом. И я мог распределить их более разнообразно, избавиться от повторений.




Кроме этого, я заставлял нейросети писать мне всякие макросы для ворда. Например, чтобы по нажатию кнопки выделял мне все слова, где есть окончание ться-тся. Чтобы я мог проверить и исправить сразу на месте.

В общем, нейросетью лучше текст проверять и исправлять, а не писать. Создавать ими инструменты, использовать нейросети как дополнительный инструмент. Для этого они нам и даны, а не чтобы заменить творческие профессии.


+23
107

0 комментариев, по

1 057 30 590
Наверх Вниз