Чужие деньги не считаем, но давайте посчитаем свои. Математика плашек и почему это бьёт не по автору

Автор: Арон Родович

Привет всем.

Вчера блога не было — работаю на работе, денежку зарабатывать всё ещё приходится. Книги несут, но не настолько, чтобы можно было заниматься только ими. Сегодня вот выкроил время.

Пост получится длинный. Кому надоели мои простыни — заранее извиняюсь, сегодняшний материал короче не сделать.

Сначала закроем тему техники

Я планировал в этом посте разобрать, как работает Яндекс-нейродетектор и почему он плохо справляется со своей задачей. Чанковая архитектура, embedding-модель, усреднение результатов, тривиальный обход через комбинацию мелких правок.

Но меня по сути опередил мой коллега. Гизум Герко в своём посте от 28 апреля (https://author.today/post/837644) разобрал техническую и аналитическую часть всего этого вопроса лучше, чем сделал бы я. Цифры по точности детекторов, отказ университетов от Turnitin, признание самой OpenAI о том, что их собственный инструмент работал на 26%, прогноз индустрии — всё это там. Если хочется глубже — почитайте его материал.

Я с этого момента дальше тему обхода детектора закрываю. Если коротко на пальцах: Яндекс режет текст на чанки по тысяче знаков, в каждом ищет общий стилистический вектор, обходится комбинацией нескольких разнотипных правок — убрать пару союзов «а» в контрастах, добавить пару местоимений, допустить грамматическую неровность. Текст со 100% уезжает в 28%. Я сам это проверял на тестах. Любая нейросеть сделает это за минуту по простому промпту, спросите свою.

В этом посте я пойду в другую сторону. К экономике.

А теперь главное — математика

Я не буду спорить с решением администрации о введении плашек. Это их сайт, их правила, их платформа. Пока АТ действует в рамках законодательства Российской Федерации, на территории которой зарегистрирована, администрация формально вправе устанавливать любые внутренние правила, которые не нарушают закон.

Хотя именно «не нарушают закон» — отдельный сложный вопрос. Я в подробности не лез и сам с этим работать не буду. Но думаю, что среди топовых авторов, которые от этих правил пострадают сильнее всего, разговор уже идёт на уровне «давайте подключим юристов и посмотрим». Сама природа ИИ-контента и авторских прав на него юридически пока ещё толком не оформлена. Все компании, предоставляющие доступ к моделям, в своих условиях указывают, что права на сгенерированный текст принадлежат тому, кто ввёл промпт. Это база. Дальше начинаются нюансы по странам, по объёму человеческого вмешательства, по типу контента — и эти нюансы я разбирать не буду, не моя компетенция. Если кому интересно — копайте, материалов в сети много.

Я лично готов принять условия игры и работать по ним. Никого ни к чему не призываю. Может быть, кто-то из топов сейчас этим уже занимается на юридическом уровне — я об этом не знаю и не лезу.

На моей странице сейчас 41 произведение — это с учётом аудиокниг и коротких рассказов. Что-то будет помечено плашкой, что-то нет. По соавторкам — циклам, которые пишутся в паре с другим автором — вопрос обсуждается с соавторами. Там работа была разделена: часть писалась руками соавтора, часть — моими наговорами, часть — корректурой нейросети. Решение принимаем вместе, потому что я не могу отвечать за чужую часть работы. Где-то книги останутся без плашки — там, где основная работа делалась руками. Где-то плашка будет.

Свои книги, где я единственный автор, маркирую полностью. Это не про то, что я сдался или со всем согласился. Это про то, что я понимаю масштаб ситуации: со 2 мая на администрацию обрушится огромный поток жалоб через кнопку «Пожаловаться». В некоторых закрытых чатиках авторов уже открыто обсуждают организацию рейдов — кого пометить первым, кому устроить волну жалоб. Названий чатов и имён я не назову, информация всё равно гуляет по ВКонтакте и другим площадкам, кто хочет — найдёт. Я просто понимаю, что лишний раз нагружать модерацию своими случаями смысла нет. Проще проставить самому, по своим книгам, и работать дальше.

Если кто-то найдёт у меня где-то непомеченную книгу — сообщите, поставлю плашку. Можно не докучать жалобами в поддержку.

Вчера также было направлено в администрацию письмо по отношению к одному автору, который публично заявлял о нулевом проценте по Яндексу. Имени не называю. По моим прогонам у него высокие структурные показатели, и мне как минимум интересно, как этот вопрос разрешит модерация. Если решат в пользу плашки — может быть, мы все увидим одного из охотников на нейросеть с этой меткой на собственных книгах.

Но сейчас не об этом.

Я хочу поговорить про математику.

Личный пример как масштаб

Я как автор молодой. За восемь месяцев на платформе попал в топ-500. Кто-то скажет — чем гордиться, не топ-10 же. Я не горжусь. Я просто объясняю, как это работает на самом деле.

За эти восемь месяцев я потратил на Яндекс Директ около полумиллиона рублей. Это привело в общей сложности 445 тысяч переходов на сайт Author.Today. Может быть, это были одни и те же люди по нескольку раз. Может быть, это разные люди. Статистику до уровня уникальных посетителей я не снимал — мне это не нужно для понимания общей картины. Грубо говоря, четверть миллиона людей, кликнувших по моей рекламе и пришедших на АТ.

Кто-то скажет: большой бюджет. Я скажу: маленький. Среднестатистический топ-10 АТ тратит такую сумму в месяц. Кто-то — за неделю. Зависит от количества циклов и темпа выкладки.

Темп выкладки топового автора в общих чертах считается так. Стандартная книга на АТ — 410 тысяч знаков. Стандартная глава — 18 тысяч знаков, одна в день. То есть закрытие книги при регулярной выкладке занимает примерно 23 дня. При старте новой книги выкладывается сразу 4-6 глав, чтобы дать читателю объём для зацепа. Промежуток между книгами одного цикла — неделя-полторы. Получается две книги в месяц на цикл при нормальном темпе.

У серьёзного автора 4-5 циклов параллельно. Это выходит 4-5 книг в месяц. Около 2 миллионов знаков в месяц. Около 120 глав. Это не теоретическая возможность — это реальная производительность реальных людей на сайте. Без этой производительности они бы не были в топе.

Вот эту производительность сейчас собираются ограничивать.

Что вводят и что вероятно введут

В посте от 28 апреля Шапин обозначил введение системы плашек со 2 мая. Часть инструментов уже работает: книги с галочкой «создано с помощью нейросети» можно скрывать из общей выдачи через фильтр в каталоге, появилась кнопка «Пожаловаться» с порогами Яндекс-детектора (0-30%, 30-50%, 50%+), и так далее.

Дальше — то, что пока не подтверждено окончательно, но обозначено в комментариях самим Шапином под его же постом:

— Будут вводиться ограничения на количество знаков или на количество публикуемых книг в месяц. Точная формулировка ещё не озвучена.

— Появились разговоры о том, что книги с маркировкой ИИ могут не получать коммерческий статус. Это пока на уровне предположений, официально не объявлено. Но обсуждение в сообществе идёт активное, и претенденты на такое решение есть.

— Анонсированы вторые аккаунты для разных жанров — работа над функционалом ведётся. Изначально многие предположили, что это сделано, чтобы разбавить большой объём одного жанра другими, особенно с упором на женские жанры. Многие авторы (включая меня — не буду скрывать) уже думают о написании в женских жанрах, изучают тропы, подбивают жён в помощи. Но если на таких вторых аккаунтах ИИ-книги не получат КС — вся идея вторых аккаунтов превращается в фикцию для тех, кто использует нейросети.

И вот это всё надо уметь читать в комплексе. По отдельности каждое решение выглядит безобидно. Вместе — это система, которая ставит топовых ИИ-авторов в положение, при котором продолжать работать на АТ становится невыгодно.

Куда смотрит остальной мир

Чтобы понять, куда мы идём, посмотрим, откуда мы поворачиваем обратно.

Берём китайский Qidian — крупнейшая платформа азиатского веб-самиздата. Топ-1 этой платформы — Тан Цзя Сань Шао. Один человек, реальный, документально подтверждённый.

Рекорд Гиннесса: 86 месяцев непрерывной ежедневной выкладки. Без выходных. Без больничных. Каждый. Чёртов. День. Семь с лишним лет.

24 книги за карьеру с 2004 года.

Несколько параллельных циклов одновременно: основная серия Douluo Dalu из 9 книг, ещё четыре крупных продолжения той же вселенной, плюс параллельная серия Heavenly Jewel Change на 15 книг, плюс Child of Light на 10 книг, плюс Skyfire Avenue, плюс Magic Chef of Ice and Fire, плюс несколько других.

70 миллионов знаков общим объёмом за карьеру.

15-18 миллионов долларов в год дохода. Чужие деньги не считаем — забейте имя в Google, увидите цифры.

Стандартная книга на Qidian — 1-3 миллиона знаков. До пяти бывает. Самая длинная новелла платформы — 41 миллион знаков, ежедневное обновление с 2017 года, до сих пор продолжается. Для сравнения: «Война и мир» Толстого в китайском переводе — 1.25 миллиона знаков. То есть одна обычная книга Qidian = 5-8 «Войн и Мира».

Никто там этому автору не ставит ограничений. Платформа отлично понимает, какую прибыль он несёт сайту. Никто не маркирует его плашкой «использует команду писателей» или «использует нейросеть». Хотя я с уверенностью на 90% утверждаю: у любого автора с такой производительностью открыты ещё 5-7 аккаунтов под другими псевдонимами, на которых работают команды с использованием нейросетей. Это открытый секрет индустрии. В Китае это называется xieshou — «пишущая рука». Под одним известным именем часто скрывается студия из 3-7 человек. Платформы это знают, не запрещают, не ограничивают. Потому что им важен поток контента.

Главная техническая разница нашего рынка и азиатского — модель монетизации. У них оплата идёт за главу или подписка на книгу до определённой главы. У нас — продажа книги целиком одному читателю одной транзакцией. Из-за этой разницы у них автор может вести один цикл бесконечно — каждая глава продаётся отдельно, читатель платит за прогресс. У нас — финальная продажа одной книги, и всё, перерыв. Автору нужно выпускать новые книги, чтобы зарабатывать. Это и объясняет наши 410 тысяч знаков на книгу против их трёх миллионов.

Я не говорю, что нам надо переходить на азиатскую модель. Я говорю — это работающая модель, которая выросла в индустрию на 2.5 миллиарда долларов. И она построена ровно на том, против чего сейчас идёт АТ.

Кстати, по одной из российских платформ у меня было интервью буквально недавно. Они стремятся именно в азиатскую модель — система продажи отдельных глав, подписки на циклы, без плашек, без ограничений, со всеми инструментами для активной выкладки. Имени не называю, чтобы пост не удалили за рекламу. Но такие платформы есть, они уже работают, и они в активном развитии.

Это не литература. Это медиа

Главная ошибка позиционирования, которая сейчас происходит на АТ — мы говорим про самиздат-площадку как про литературу. С большой Л.

Но это не Союз Писателей. Это не университетская кафедра современной русской прозы. Это не премия «Большая книга» и не «Букер».

Это самиздат. Развлекательный медиа-контент. Словесные комиксы, по сути. Жанровая литература никогда не несла особо глубокого смысла. Иногда это треш. Иногда это вторичный треш. Иногда это треш на трэше с приколом про попаданца в тело императора в восемь утра по пятницам. Это не плохо — это и есть жанр.

Параллель с видеохостингами очевидна: там никто не маркирует ИИ-видео. Никто не ограничивает количество роликов от одного автора в месяц. Никто не скрывает «нейросетевые» каналы из общей выдачи. Хотя нагрузка на серверы хостинга при стриминге 4K-видео в десятки раз больше, чем нагрузка от текстовой книги с парой картинок. Разница настолько огромная, что текст по нагрузке вообще не считается.

Никто не отрицает необходимость каких-то ограничений вообще. Конечно нужны — где-то порог должен быть. Но наша платформа сейчас вводит ограничения, которые работают против развлекательного медиа, при том что мы и есть развлекательное медиа. Мы не научно-литературный журнал.

Что произойдёт практически

Топовый автор, у которого сейчас выкладка 60 тысяч знаков в день и пять параллельных циклов, начинает считать.

— Платформа ограничивает выкладку. Значит, его пять циклов уезжают в три. Читатели двух оставшихся циклов остаются без проды.

— Платформа маркирует его книги плашкой ИИ. Значит, его выкидывают из общей выдачи через фильтр читателей. Органический трафик, который он годами строил, исчезает.

— Платформа возможно лишает его коммерческого статуса на новых аккаунтах в женских жанрах. Значит, попытка диверсификации через вторые аккаунты не работает.

И автор задумается. А может уйти на платформу, где этих ограничений нет?

Будет он прав или нет — отдельный вопрос. Скорее прав.

И теперь представьте десять таких авторов. Шесть-семь топовых, которые вместе тратят на Яндекс Директ миллионы рублей в месяц, приводят миллионы кликов и держат значительную часть трафика площадки. У них есть выбор. У них есть деньги. У них есть аудитория, которая ходит за ними, не за платформой.

Что мешает любому из этих авторов уйти на другую платформу и подключить туда же таргет? Ничего. У этих платформ нет плашек. У них нет ограничений объёма. Некоторые работают по азиатской модели, что даёт авторам ещё и больше денег с каждого читателя.


Контраргумент инквизиторам

Я знаю, что мне сейчас скажут. «Уйдут — и хорошо. Туда им и дорога».

Окей. Допустим.

Сорок прод в день вы дадите читателю?

Те самые сорок прод хороших, добротных, жанровых, сериальных, после которых человек засыпает с ощущением «хороший день», а на следующий день идёт на работу и думает «скорее бы вечер, читать пойду». Не высокую литературу. Не Достоевского. Не Толстого. Не размышления о смысле бытия. Прода. Глава. Текст в любимом жанре. Сорок штук в день. Хороших, разных, сериальных.

Дадите? Нет. Не дадите. Потому что вы и не пишете в таком темпе. И никогда не писали. И не сможете писать.

Вы не Макдональдс. И тут вспомните недавнюю историю: когда Макдональдс ушёл из России, многие кричали «ну и хорошо, пусть валит, нашим мелким сетям больше места». Многие мелкие сети тогда попытались занять освободившуюся нишу. Часть из них даже стартовала бодро. Но в итоге что? В итоге пришёл «Вкусно и точка» — тот же Макдональдс под новым флагом — и забрал обратно тот же поток клиентов. А мелкие сети, которые попробовали войти в эту дверь, проиграли конкуренции крупному бренду.

Ваши топовые авторы — это и есть крупный бренд. Если 20-30 топовых авторов из топ-100 уйдут с АТ и переведут свой таргет на другую платформу — поверьте, это сильный удар. Не в первый месяц, в первом месяце вы ещё не заметите по инерции. Но через два-три месяца, когда читатель не увидит свежей проды любимого автора, поищет в каталоге, найдёт, что у автора последняя книга помечена как ознакомительный фрагмент со ссылкой «продолжение читайте на другом сайте» — что произойдёт? Читатель уйдёт за автором.

И не пытайтесь думать, что технически переход сложный. Сейчас уже есть рынок услуг по миграции книг между платформами. Загрузишь библиотеку, отдашь нейросети — она спарсит обложки, аннотации, названия, авторские проекты, и принесёт всё на новую платформу. Автору останется только зайти в каждую книжку и подгрузить .docx. За условные 10-15 тысяч рублей топовый автор переносит весь свой каталог на новую платформу за день. И если какая-нибудь сейчас тихая, малоизвестная платформа даст нормальный импорт из АТ-формата — даже просто обложек и FB2 — то через два месяца мы можем увидеть, как она становится новой топовой по жанровым произведениям.

Есть и второй вариант. Большой шанс, что появятся личные сайты авторов. 70-80% — это самозанятые. 20-30% — ИП с полноценным эквайрингом. Это не дёшево и не быстро, но для топового автора — посильное вложение. Я как не самый сильный автор могу в принципе при должном желании сам поднять платформу. Это будет криво и косо, но кто сказал, что АТ изначально была идеальной? Платформа выросла за годы.

Я никого не призываю создавать новые платформы и переходить на новые платформы. Это просто размышления вслух про то, что может произойти из-за всего этого. Никаких ярких заявлений. Прогноз на месяцы вперёд.

Читатель ходит за Васей Пупкиным. Не за «великим Игорем». Уйдёт Вася — уйдут читатели. Они не пересядут на «великого Игоря». Они пойдут искать Васю там, куда он переехал. Потому что им нужен Вася, а не Игорь, и не платформа.

А самое страшное — это даже не уход. Самое страшное — это отношение к читателю. Я уже несколько раз это слышал в комментариях, и это до сих пор меня поражает.

«Это пожиратели слопа», «они не читают нормальную литературу», «их не жалко».

Если вы считаете читателя, который читает нейронный текст, тупым или пожирателем говна — поверьте, никто так не считает, кроме вас. Этот читатель приходит за развлечением. Он его получает. Он рекомендует автора друзьям. Он покупает следующие книги цикла. Он живой адекватный человек со своим вкусом, который вы не уважаете. Это ваша проблема, не его.

Тенденция инквизиции читателей

В последние дни я стал замечать новый формат. Появляются посты-агитки, призывающие читателей отключать ИИ-книги через фильтр в каталоге. С аргументами «не поощряйте плохой контент», «не давайте им зарабатывать», «отказывайтесь от слопа».

Никто из этих авторов не объясняет читателю разницу между типами работы с нейросетью. Между Сергеем Твардовским, который строит мир годами с моделью-консультантом и переписывает каждую главу с нуля. Между мной, который надиктовывает текст голосом и просит модель расставить запятые. Между чистым нейрослопом «нажми кнопку — получи главу». Все это в одной категории, под одной плашкой, и читателю говорят — отключи.

Топовый автор, который годами вкладывал свои деньги в рекламу и приводил трафик на сайт, теперь рискует потерять этот трафик. Его начнут заваливать жалобами через кнопку «Пожаловаться». Книги уйдут под плашку. Плашка вызовет волну фильтрации со стороны читателей. Читатели не увидят книги в виджетах рекомендаций. Органический трафик, построенный годами, обнулится.

Я создаю этот пост в том числе для читателей, которые заходят и видят все эти разговоры. Чтобы каждый, кто думает, ставить ли галочку «исключить ИИ-книги», мог хотя бы понять, что прячется под этой галочкой. Чтобы каждый, кто отключает книги через фильтр, понимал, что отключает не только нейрослоп, но и Сергея с его двумя томами канона мира, и меня с моими надиктовками, и десятки других авторов с разными методами.

Пускай каждый решит сам. Не призываю никого ни к чему. Прошу только — подумайте.

Финал

Я в топ-500. Не самый сильный голос на сайте. Я понимаю, что мои слова мало что значат для большой картины. Но я и не боюсь.

Этот пост — не попытка разжечь конфликт с администрацией или с кем-то ещё на платформе. Никого не оскорбляю, никого не призываю ни к каким действиям. Это просто прогноз вслух того, что может произойти. Решение администрации не осуждаю. Их сайт, их правила. Я их соблюдаю и буду соблюдать. Плашки проставлены, спорить буду в блогах, в рамках сайта — никаких саботажей.

И главный вопрос всего этого — а оно того стоит?

Окей, вы ограничите авторов пятью книгами. Семью. Пусть будет десять — хотя для нормального сериального автора, который ведёт регулярную выкладку, и десять не проблема. Никто бы даже не возмутился. Но даже если ввести разумные ограничения по объёму — вы поставили плашки, при этом не дали этим плашкам разнообразия. Не дали градации между «нейрослоп с кнопки дальше» и «автор надиктовывает голосом и просит модель расставить запятые». Не дали выбора читателю.

То есть фильтр в каталоге не симметричный. Читатель может отключить «созданное с помощью ИИ». Но не может отключить «написанное руками с грамматическими ошибками и шероховатостями». Хотя если читателю не нравится грязный текст с опечатками — это его право, как право не нравится ИИ-текст. Но почему-то одно — это «защита читателя», а второе — нет.

И вы как платформа сами не даёте читателю выбрать, что он хочет читать. Если человек хочет именно жанровый сериальный текст, написанный с использованием нейросети, потому что ему нравится конкретный автор и темп, — почему вы лишаете его этого выбора? Использование нейросетей — это тренд 25-26 года, тренд глобальный, и мы зачем-то этот тренд игнорируем. Мы даём отключить ИИ. Мы не даём отключить рукопись. Это асимметрия не в пользу платформы.

Просто не удивляйтесь, когда через полгода на сайте всё меньше и меньше останется активных авторов и читателей. Когда виджеты обновлений начнут пустеть. Когда топ-100 начнёт меняться, и окажется, что половина из них тихо переехала туда, где можно работать. Это не угроза. Это математика. Чужие деньги не считаем, но свои-то можно.

На этом тема нейросетей и плашек у меня в блогах закрывается. 

Спасибо тем, кто дочитал. Тех, кто пришёл с моральным приговором, тоже жду — без вас разговор не получится. Ругайтесь, обзывайтесь, ставьте дизлайки. Я обязательно отвечу. Может быть, даже вежливо.

+88
629

0 комментариев, по

151K 732 132
Мероприятия

Список действующих конкурсов, марафонов и игр, организованных пользователями Author.Today.

Хотите добавить сюда ещё одну ссылку? Напишите об этом администрации.

Наверх Вниз