Исследование #1. "Что в имени тебе моём?"

Автор: Вадим Скумбриев

ВНИМАНИЕ! В нижеследующем тексте присутствует большое количество выводов, которые покажутся очевидными после того, как вы о них узнали. Всё нижеследующее есть просто попытка не на словах, а на деле изучить одну из сторон литературной деятельности - а именно названия произведений.

Натолкнул меня на это случай – пролётовский рассказ «Финальное стаккато», название которого лично я определил как оригинальное и интересное (и прочитал, разумеется), оказался последним, получившим 6 комментариев, да и то потому, что на конкурсе есть счётчик, побуждающий комментаторов читать рассказы с минимумом отзывов. Это вызвало подозрения. Собственно, почему бы их не проверить, тем более что есть на чём, а я очень люблю математику?

Вот я и проверил.

Выборка – 237 рассказов нынешнего раунда Пролёта Фантазии. Выборка максимально репрезентативная из всех, которые я мог бы получить: рассказов много, все они условно жанра фентези, все они анонимны, критериев выбора по поджанрам нет, но при этом сами рассказы очень разнообразны – есть и хоррор, и сказка, и городское фентези, и эпическое мочилово. То есть в основном рассказы выбирают именно по названию, а темы обсуждения позволяют легко отследить время появления комментариев и составить базу данных для анализа.

Следующий шаг – определить степень привлекательности названия, чтобы было что с чем сравнивать. Сначала я решил оценивать её по пятибалльной шкале, но быстро пришёл к выводу, что это бессмысленно – более-менее уверенно я выставлял только единицы и пятёрки, а остальное почти наугад. Ну в самом деле, как понять, ставить названию четвёрку или тройку? Критериев-то чётких нет, да и нечётких тоже. Троичная система гораздо более точна. Так что в итоге я ставил «2» тем рассказам, которые пошёл бы читать в первую очередь, «1» тем, названия которых не зацепили, и «0» тем, которые на мой взгляд были безликими, серыми и скучными, т. е. я обратил бы внимание на что-то более интересное.

Далее я прошёлся по друзьям и знакомым, раздав им список названий и попросив оценить по той же самой шкале. Добрых самаритян набралось аж семнадцать человек (плюс я сам), причём я старался подбирать как читателей, так и писателей. Конечно, это всё равно не так много, как хотелось бы, но уже достаточно, чтобы уменьшить влияние случайности и делать какие-то выводы.

Если верить темам обсуждения Пролёта, где после публикации списка главный вид спорта - как раз обсуждение рассказов, то привлекательными выглядят красивые удачные сочетания: «Под взором электрических икон», «Кладбище снов» (не могу я без саморекламы, ну вы понимаете), «Лезвия листьев»; оригинальные сложные названия, обращающие на себя внимание: «Восьмые врата распятого факира», «По вопросам сердечным обращайтесь к врачам»; ну а неудачными – простые сочетания с затасканными до дыр словами типа «Проклятие некроманта». В общем-то логично.

Какие факторы нарушают типологию выборки?

- пользователи, которые читают рассказы по алфавиту. Их комментарии я не учитывал.

- комментарии от друзяшек – их мало, но они всё же есть и также не учитываются (пустой хвалебный комментарий от пользователя с 1 сообщением – очевидный друзяшка).

- рассказы, в темах которых разгорелась дискуссия по какому-нибудь вопросу. Такие рассказы привлекают дополнительное внимание и потому не учитываются.

- присутствие рассказа в теме «Посоветуйте, что почитать». Однако лишь некоторые из оказавшихся там вышли за пределы отклонения.

- рассказы, названия которых предполагают очередную Жестокую Голактеку. Так как на Пролёте есть немало охотников за голактеками, и я в том числе, такие рассказы тоже удалены из выборки. Их, впрочем, почти не оказалось.

- упоминавшийся выше счётчик рассказов без комментариев (с одним, с двумя, с тремя и тд)

- в моём распоряжении есть только комментарии, но не статистика просмотров. С другой стороны, комментарии пишут, как правило, одни и те же люди, а в случае с просмотрами я не могу учесть все перечисленные факторы

- размер рассказа – некоторые выбирают рассказ исходя из размера, предпочитая короткие или наоборот, длинные. Однако беглый осмотр показал, что высокой корреляции между размером рассказа и привлекательностью названия не наблюдается, так что вряд ли это окажет серьёзное влияние на результат.

- изменение общего интереса к чтению со временем. Очевидно, что поначалу читают гораздо активнее. Кроме того, предполагается, согласно проверяемому тезису, что в первую очередь обращают внимание именно на удачные названия, то есть важны первые дни.

- субъективность моего собственного мышления (личный вкус) и когнитивные искажения (например, некоторые рассказы из списка я уже прочитал, и это меняет восприятие их названий). Тут всё понятно, первое можно исправить только с помощью добрых самаритян, о вторых я представление имею и делаю поправку.

Исходя из всего вышесказанного, я ограничился анализом первых трёх дней после выкладки, а по факту вообще самым первым, когда пирожки ещё горячие и все только пробуют воду. Это минимизирует количество рассказов, попавших в «посоветуйте», рассказов с дискуссиями и так далее, а кроме того, позволяет максимально точно увидеть, какие рассказы выбирают в первую очередь. 

В общем, вот табличка с полученными данными: https://drive.google.com/open?id=13O0y6Rg5Od1UyVjJl9CkDJfmQs8Safx3

Теперь я объясню, что значат все эти цифры.

Из полученных от добрых самаритян данных я вычислил среднее арифметическое для оценок к каждому рассказу. Затем на основе этого я рассчитал среднеквадратичное отклонение - то есть показатель рассеивания значений случайной величины относительно её математического ожидания. Это позволяет приблизительно оценить разброс мнений относительно названий рассказов.

И тут попёрли результаты.

1. Максимальное значение среднего оказалось равным всего 1,39 (даже не 1,5!), то есть ни один рассказ не понравился даже 75% опрошенных. В общем-то, неудивительно: из восемнадцати человек только двое поставили больше 50 двоек-"плюсов" (т. е. оценили как "хорошие" больше 20% названий), а отдельные личности поставили меньше 10. Зато минимальное - 0,22, то есть распределение смещено в сторону минимума.

2. Может показаться, что "минусов" намного больше, чем "плюсов", но это не так. Если назвать "хорошими" названия со средним баллом больше 1,2, а "плохими" - со средним меньше 0,4 (то есть отступить от крайних значений примерно по 0,2), то и тех и других получится по 12 штук. Деление размыто: некоторые "нейтралы" в нижней границе имеют больше минусов, чем "плохие", но эти минусы уравновешиваются плюсами. Очевидно, что искать тенденции в нейтральной зоне бессмысленно, поэтому меня интересуют только крайние значения.

3. На весь пул "плохих" рассказов поставлен всего один плюс. Замечу, что даже добрый во всех смыслах самаритянин, поставивший аж 108 плюсов (45% от общего количества рассказов), сумел пройти по этому минному полю, оступившись лишь один раз (а его коллега с 61 плюсом - ни разу). Это говорит о том, что в общем-то можно выделить названия, которые большинству людей, как ни крути, покажутся "плохими" (все "плохие" рассказы получили больше 60% минусов - эту цифру стоит запомнить). 

Кстати, забавно, но многие названия тут отдают сильным таким лыром (хотя клянусь Осирисом, женщин среди опрошенных было даже больше, чем мужчин). Комментариями они, как можно увидеть, тоже не блещут.

4. С "хорошими" названиями всё веселее:

Здесь всё гораздо менее однозначно. Во-первых, им щедро отсыпали "минусов" (к слову, не нашлось ни одного рассказа, который не получил бы ни одного минуса) - у "Межкомнатного окуня" их аж 4. Во-вторых, с комментариями у них картина тоже менее цельная - у некоторых вообще за три дня всего один комментарий, хотя в целом ситуация и лучше - по шесть комментариев за первый день собирают не только лишь все. В-третьих, если присмотреться, среднеквадратичное отклонение для "хороших" рассказов значительно выше, чем для "плохих", то есть разброс мнений по ним больше. Единственный общий критерий, который я здесь увидел, это нешаблонность. Можно ещё добавить оригинальность, но это палка о двух концах - оригинальные сочетания типа "Межкомнатного окуня" увеличивают разброс. Хотя в любом случае это лучше, чем "Любовная история".

Бордовым выделены названия рассказов, на количество комментариев к которым можно не смотреть из-за выявленного нарушения типологии выборки.

5. Давным-давно, в далёкой-далёкой галактике я сделал небольшой частотный анализ в отношении тех же названий с целью выявить наиболее часто употребляемые слова. Выборкой послужили рассказы с нескольких раундов всё того же Пролёта. Вот он:

14 - дракон, история

12 - один, сказка

9 - бог, последний, сердце

7 - ночь

6 - земля, мёртвый, небо, 

5 - король, крыло, рыцарь, света, сон, туман, чёрный, ведьма, легенда

В принципе, эти названия вполне пересекаются с аналогичным списком названий изданных книг от РосКона (с поправкой на жанровость и наличие там большого количества лыра, академок и т.д.). Так что я вооружился поиском и пошёл проводить новый анализ. Основной критерий - учитывались простые названия, содержащие затасканные слова, например, "Статуя Ночи", "Болотная ведьма", "В лунном свете" и так далее. "Башни всегда ближе к небу", несмотря на наличие слова из списка, в выборку не попадают, т. к. слово использовано нетипичным образом. Это не касается самой верхушки списка - там учитывалось всё.

Вот результат:

Высокой корреляции не обнаружено, однако можно заметить, что подавляющее большинство названий в списке имеют рейтинг ниже единицы. 

Выводы

Во-первых, если рецепта однозначно "хорошего" названия нет, то есть общие критерии "плохого" - оно, как правило, явно лырноепростое, незамысловатое, ни о чём не говорит и от него несёт штампами. Таким образом, задача писателя, если он не Стивен Кинг - придумать интересное сочетание слов, которое удачно подошло бы в качестве названия. Это, разумеется, вывод от Капитана Очевидность, но реальность, увы, такова, что почему-то далеко не всем это очевидно. Кроме того, на примере выше можно посмотреть, какие названия выглядят удачными, а какие - нет. Флуктуации никто не отменял (я, например, так и не понял, чем народу понравилось "Последнее прибежище монстров), но тем не менее.

Во-вторых, надо понимать, что всё вышесказанное относится к предмету в  общем. Если сузить рамки, можно получить совершенно иную картину -  например, большая часть "плохих" названий в лырно-ориентированной среде  вполне могут стать "хорошими".

В-третьих, чем более вычурное и оригинальное название, тем больше по нему оказывается разброс мнений. Это стоит учитывать и быть готовым, если вы хотите выпендриться.

На сим всё.

+13
1 338

0 комментариев, по

2 200 1 921 430
Наверх Вниз