Бесплатный нейросетевой инструмент для корректуры/редактуры. Значительно качественнее аналогов.

Автор: Абвгде123

Кратко:

Сделал программу, которая использует нейросети для вычитки книг, результат гораздо качественнее, удобнее и дешевле аналогов. Нейросеть от Google даёт 1500 бесплатных запросов в день, при стандартных настройках это примерно 300 АЛ, в моём профиле ссылка на гитхаб(VaniusK/llm-book-rewriter), там и .exe, и инструкция по установке/настройке


Вступление:

Думаю, ни для кого не секрет, что ошибки и опечатки - боль многих авторов и читателей. Корректура стоит денег, а самостоятельная вычитка отнимает много времени и не всегда спасает от замыленности взгляда. Читатель, столкнувшись с текстом, изобилующим ошибками, часто лишь разочарованно откладывает книгу, ведь повлиять на качество он никак не может.

Последний пункт особенно для меня актуален, поэтому я написал программу, которая, используя нейросети, вычитывает текст, и оформил её в удобный инструмент для авторов и читателей, которым также пользуюсь сам


Описание:

Если не затрагивать технические детали, то всё просто: книга(любой файл форматом .fb2, .txt или .docx) делится на куски, каждый кусок вместе с запросом отправляется в нейросеть для обработки, а потом они все собираются обратно, результат проверяется на соответствие изначальной структуре и форматированию. Запрос можно настраивать: по умолчанию там он очень консервативный, чтобы нейросеть не меняла авторский стиль. Нейросеть также можно выбрать любую. Результат проверки .docx-файлов также поддерживает функцию просмотра изменений: можно открыть сравнение с оригиналом и принять/отклонить каждую правку


Сравнение с аналогами:

Я взял реальный текст, прогнал его через каждый инструмент и сравнил их результат с эталоном - оригинальным текстом, который я вручную вычитал, сохраняя авторский стиль, но правя все ошибки. Используя полученные данные, я составил таблицу и график. Оригинальные результаты у меня также сохранены, лежат на гитхабе

Способ вычитки
Цена(рублей за 1 АЛ = 40000 символов)
Качество(процент от исправленных ошибок, учитывая изменения стиля и добавленные ошибки)Скорость работы(АЛ/день)Удобство использования
Человек-корректор~700 99(предположительно)1-2Высокое
Орфограммка6052.22
Нет данныхНизкое
Текстовод13258.52
Нет данныхНизкое
LLM Book Rewriter - моя программа(используя модель gemini-2.0-flash)0.6/бесплатно(1500 запросов ~ 300 АЛ в день)84.077200(1 в 12 секунд)Очень высокое

Пояснение к колонке "Удобство использования": Человеку-корректору нужно отослать книгу, оплатить, а потом получить исправленную версию. Для орфограммки/текстовода нужно по кускам вставлять оригинальный текст, ждать проверки, а потом копировать его к себе. А для моей программы - положить книгу в одну с ней папку, запустить .exe-файл и получить результат, можно за раз обработать несколько книг.

Поразительная скорость работы программы объясняется тем, что я добавил к ней асинхронность: одновременно она способна обрабатывать десятки/сотни/тысячи фрагментов текста.

Сравнение на простом примере:

Оригинал: Девчёнка - войн, с мечем в руке прыгнула аки, кошка и ваткнула развивающийся флаг, на стену крепости. Их Виличество взривел аки медведь и, павел войнов в атаку. - Убить пряма сдесь - Орали войны держа мячи на перевес.

Орфограммка: Девчонка — войн, смечем в руке прыгнула аки, кошка и воткнула развивающийся флаг, на стену крепости. Их Величество взревел аки медведь и, навёл Войнов в атаку. - Убить прямо здесь — Орали войны, держа мячи наперевес.

Текстовод: Де́вчонка — воин, с мечом в руке, прыгнула, аки кошка, и ваткнула развивающийся флаг на стену крепости. Их Величество взревел, аки медведь, и повел воинов в атаку. — Убить прямо здесь! — орали воины, держа мячи на перевес.(Нет, я не добавлял это ударение)

Моя программа(используя gemini-2.0-flash): Девчонка-воин с мечом в руке прыгнула, аки кошка, и воткнула развевающийся флаг на стену крепости. Их Величество взревел, аки медведь, и повёл воинов в атаку. - Убить прямо здесь! - орали воины, держа мечи наперевес.

Как видите, LLM не только превосходят стандартные инструменты в качестве, но и способны к пониманию контекста: "мячи" и "развивающийся" это наглядно демонстрируют. 

В стандартной инструкции для нейросети я написал не менять оформление прямой речи, и оно не изменилось, что ещё раз подчёркивает настраиваемость инструмента.


Вывод:

Конечно, это не замена профессиональному редактору - сразу в издательство результат нести не стоит. Но отличный инструмент для авторов/читателей, позволяющий быстро и легко исправить львиную долю ошибок, приведя книгу в читаемый вид. Можно использовать перед отправкой книги корректору/бета-ридеру, чтобы сэкономить его время. Также подходит для произведений "В процессе" - финальную редактуру можно произвести после завершения книги.

Проект открытый: весь исходный код, настройки, документация и результаты тестов лежат на гитхабе, распространяется под лицензией MIT.


Перспективы?

Эта программа - интерфейс для LLM, качество её работы напрямую зависит от них, а они постоянно развиваются: 1.5-pro-002 вышла в сентябре 2024, а 2.0-flash - в феврале 2025. За 5 месяцев мы получили модель, которая выдаёт лучший результат и при этом стоит в 12 раз дешевле. С появлением новых моделей качество будет расти, а цена(за аналогичное качество) - падать. 20 мая состоится Google I/O, где будут представлены новые модели, включая(возможно) интересную нам стабильную версию 2.5-flash, примерно в это же время должен выйти Deepseek R2.


P.S:

Собираюсь отправить программу на конкурс проектов, фидбек здорово поднимет мои шансы на призовое место. Пишите в комментарии или в личку - помогу с установкой, настройкой, могу даже сам(вам не придётся устанавливать и настраивать) вычитать вашу книгу(за отзыв :) ).

+6
37

0 комментариев, по

0 0 1
Наверх Вниз