Фильтры на АТ и поиск жемчужин в горах ЛитРПГ. Часть 1.
Автор: Ярослав КожедубЕсть у меня одно пристрастие, которого я слегка стыжусь. Люблю я на досуге почитать далеко не только умные или хотя бы качественные книги, но и довольно-таки проходные и большой литературной ценности не имеющие, а зачастую и балансирующие на грани откровенного шлака. Увы, почти вся ЛитРПГ и РеалРПГ относится как раз-таки к последнему классу — и нет, это совсем не плохо. Тем более что в жанре встречается множество исключений, отличающихся живым языком и вполне себе качественным, захватывающим и, зачастую, нелинейным сюжетом. Но даже без учета этих исключений, по моему личному мнению, жанр полезен — и в первую очередь для авторов. Как начинающих, так и не очень. Для начинающих, вроде меня — тем фактом, что РПГ очень легко писать. По сути, это идеальный тренажер для наработки каких-никаких навыков писательства, с которыми потом можно идти в более «серьезные» жанры (да простят меня поклонники РПГ). Не менее полезным для любых авторов является и чтение такой литературы — проще всего заметить и задуматься «как не надо» именно когда ты читаешь книгу, где это «как не надо» встречается чуть ли не на каждой странице. Но, конечно, для этого надо балансировать свой вкус и периодически читать что-то более качественное. Впрочем, я отвлекся.
Вопрос, о котором я пойдет речь в посте, не давал мне покоя последние полгода, не меньше — но руки до него дошли только недавно. И, подумав, я решил поделиться изысканиями на эту тему с народом — вдруг пригодится кому-то еще. Собственно, вопрос простейший — к примеру, читаешь ты какой-то жанр на АТ достаточно долгое время, и хочешь найти новые действительнохорошие книги из этого жанра (в данном случае речь пойдет о РПГ, но, разумеется, рассуждение применимо к любым жанрам). Как это делать? В большинстве случаев — шариться по горячим новинкам, популярному и различным топам. Увы, в первых двух категориях висят обычно впроцессники, а топы... Обычно, если ты жанр уже знаешь, то верхние позиции топов ты читал, а то, что висит дальше — чистая лотерея. Вроде и выглядит хорошо, а потом оп — тратишь добрые минут двадцать на ознакомление — и с отвращением закрываешь. Или наоборот, обложка выглядит плохо, аннотация тоже, и ты попросту проматываешь, не задержав взгляда. Фильтры немного помогают... но именно что немного.
В связи с этим у меня и вертелась мысль о банальных собственных фильтрах на основе общедоступной информации по книгам. Первое, что приходит на ум, разумеется — отношение просмотров к лайкам. Довольно простенький параметр, но в фильтрах его не имеется, увы. И двойное увы в том, что сколько я ни искал — никто к вопросу с этой стороны пока не подходил. А самому лениво. Было, до какого-то момента. Но вот недавно все же сподобился засесть за это дело. Что ж, подумал я. API у АТ имеется, общедоступное. Программист из меня аховый, но кое-что все же умею — уж поди к апишке как-нибудь да подрублюсь, парсер накатаю, быстренько сортировку по нужным параметрам настрою, да в эксельку выгружу. План-капкан обломался на чтении документации — я не нашел в апишке ни единого метода, который возвращал бы среди параметров количество лайков и просмотров у книги. Создатели не раз писали, что дока там кривая, но стоит ли начинать со всем этим заморачиваться, чтобы впоследствии обнаружить, что документация была вполне корректной? Может, и стоило заморочиться, но я пошел по другому пути. Окей, раз не могу сделать это через апишку — попробую через скраппер. Опущу количество матов, которые я озвучил в попытках это осуществить. Опущу количество времени, понадобившееся на то, чтобы наполовину через эту хреновину, наполовину вручную получить хоть какие-то удобоваримые данные. Но худо-бедно что-то получилось.
И вот я смотрю на результат — и понимаю, что не зря АТ не стали заморачиваться с этим параметром. Ох, не зря. На самом-то деле он такой кривой и малоинформативный, что выстраивать по нему полноценный рейтинг практически бессмысленно. Потому что:
1. Он будет зависеть от того, платная книга или бесплатная: на бесплатной показатель будет заметно смещен в большую сторону по понятным причинам (кто-то зашел, дочитал до первой платной главы, и решил, что дальше ему неинтересно, либо и вовсе пошел и спиратил, лайк, ясное дело, не поставив)
2. Он будет зависеть от того, поставлен ли на книге 18+ и будут ли капать просмотры извне, или только от зарегистрированных пользователей
3. Он будет зависеть от того, занимается ли автор таргетной рекламой своей книги (и насколько хорошо он этим занимается). В любом случае, куча лишних просмотров, но, если книга не 18+, то от незарегистрированных пользователей, которые лайки не ставят.
4. Он СИЛЬНО будет зависеть от того, напоминает ли автор своим читателям о том, чтоб они пошли и лайкнули книгу, если им несложно.
Et cetera, et cetera...
И это только то, что пришло ко мне в голову, на основе довольно куцых данных: все же существенная часть подноготной сайта продолжает держаться в относительном секрете. Но. Все же определенную пользу проделанные мной труды принесли: они показали статистические выбросы.
Это те книги, которые, даже с учетом 1,2,3 и дальнейших пунктов, все равно имеют аномально малое отношение просмотры/лайки. То есть, как бы в их пользу не играли благоприятные факторы — все-таки что-то в этих книгах есть эдакое. Что-то, что цепляет в среднем большее количество людей. Этими «выбросами» я бы и хотел поделиться.
Для начала — я взял только романы из разделов «ЛитРПГ» и «РеалРПГ» (эти множества частично пересекаются, так что и рассматривать их стоит вместе), выбросил впроцессники и ограничил снизу по количеству лайков — взял только книги, превысившие условный порог в 2500 единиц. Зачем нужен последний пункт? Дело в человеческой психологии. Сугубо по моему собственному ощущению и опросам знакомых — чем на книге меньше лайков, тем больше ценность каждой отдельной оценки от случайного читателя — и тем больше вероятность, что он сам, без напоминаний, не забудет этот самый лайк поставить. Да и планка читательских «требований» заметно вырастает по мере роста популярности книги. Собственно, поэтому я решил не мешать между собой и рассматривать отдельно книги топ-тира (2500 и выше), новичков (1000 и меньше) и условный «средний класс» — тех, что между этими двумя значениями. И для начала я решил рассмотреть как раз книги топ-тира — их банально меньше и это хороший пробный шар, чтобы проверить, работает ли вообще эта схема. Собственно, поэтому сразу отметаю возможные обвинения в рекламе. Топам эти крохи внимания не нужны, а до «среднего класса» и новичков я еще неизвестно когда доберусь.
Так вот. Переходим к делу. Берем просмотры, делим на лайки, сортируем по возрастанию. Топ-10 книг:
Название | Количество лайков | Количество просмотров | Просмотры/лайки |
Звезда в руке и шило в ... | 5348 | 143871 | 26,90 |
Маго-ядерный едренбатон! | 5191 | 163138 | 31,43 |
Бегающий сейф | 6636 | 299444 | 45,12 |
Последний попаданец 3 | 4600 | 209111 | 45,46 |
Смертник из рода Валевских. Книга 6. | 3975 | 188987 | 47,54 |
Последний попаданец 4 | 4359 | 212970 | 48,86 |
Смертник из рода Валевских. Книга 4. | 4105 | 202014 | 49,21 |
Лесовик-7. Истоки | 4325 | 213015 | 49,25 |
Смертник из рода Валевских. Книга 5. | 4184 | 208623 | 49,86 |
Гоблинам вход воспрещён. Том 2 | 3155 | 159129 | 50,44 |
И первое, что бросается в глаза — абсолютно все, кроме «Бегающего сейфа» — это не первые книги серий (первые две — это как раз таки вторая и третья части «сейфа»). В целом не удивительно, учитывая, что первые книги часто рекламируют, да и случайных посетителей на их страницах в разы больше. Ну а главное — с каждой новой книгой цикла отваливается какая-то часть читателей — а среди оставшихся возрастает концентрация яростных фанатов. Что, конечно, показателю лишь на пользу. Да и других факторов хватает. Того же «Последнего попаданца» я читал, и, несмотря на то, что цикл в целом сносный, но автор чуть ли не через главу напоминает — ставьте лайки, да побольше! А если много поставите — то я вам еще и лишнюю главу вне графика выложу! Неудивительно, что почти весь упомянутый цикл по исследуемому параметру висит в относительных топах. В таком случае — давайте посмотрим, что будет, если оставить только первые части серий (или и вовсе одиночные книги) и взять условный топ-10 уже от них:
Название | Количество лайков | Количество просмотров | Просмотры/лайки |
Бегающий сейф | 6636 | 299444 | 45,12 |
Кроликам вход воспрещён. Том 1 | 4763 | 345530 | 72,54 |
Системный практик | 4228 | 321118 | 75,95 |
Тактика малых групп | 3527 | 277607 | 78,71 |
Одиночка l. Дорога мечей | 4450 | 420061 | 94,40 |
Системный дед | 6551 | 641315 | 97,90 |
Отмороженный | 2920 | 289885 | 99,28 |
Паладин | 6698 | 680368 | 101,58 |
Амальгама #1: Жатва | 3025 | 331150 | 109,47 |
Звездная Кровь | 7746 | 879680 | 113,57 |
И вот тут уже расклад гораздо интереснее. По крайней мере, часть из этого я читал — и могу точно сказать, что из прочитанного все (почти) более чем заслуживает здесь находиться. А та же «Тактика малых групп» — и вовсе однозначный шедевр, выделяющийся среди большинства РПГ. «Системный практик» и «Одиночка» — хоть и более классические, но не менее качественные книги. Хотя все же есть в топе более сомнительные номинанты, опять же, мной прочитанные — «Системный дед» и «Кроликам вход воспрещен». Первая книга — откровенно шероховатая, что более чем логично, у автора она первая. «Кролики» же и вовсе — крайне лайтовое чтиво с относительно интересным концептом, но без особых претензий. Видимо, более-менее оригинальные концепты в обоих случаях нивелировали все минусы книг. И, судя по относительно малому количеству просмотров, рекламы (по крайней мере, долгой и упорной) не было ни на одной из этого десятка — все выбивались в топы самостоятельно, без мам, пап и кредитов. Уважаемо.
На этом первую часть неожиданного оффтопа заканчиваю. Если кому-то интересны аналогичные расклады по новичкам и «среднему классу» (думаю, там куда больше неожиданных открытий) — напишите, стоит ли продолжать.
P.S. Второй, а тем более первый топ трогайте на свой страх и риск. Я читал там далеко не все, и с уверенностью сказать, что там не попалось что-то совсем ужасное — не могу)