Как не тратить время на мусор - искин для читателей
Автор: Эли ЭшерТут недавно в посте Шанс для новичка? Как бы не так! / Фонд А. я, в ответ на проблему, как же бедному читателю не тратить время на мусор, предложил создать нечто, что будет предсказывать конкретному читателю, пойдет ему-ей книга или нет. На основании рейтинга уже прочитанных книг. Возможно ли это? Сложный вопрос. Но задача востребованная. Нетфликс и Амазон уже не один год землю роют в этом направлении.
Почему-то это вызвало оверреакцию одного из мэтров как сайта, так и русской 2010+ литературы. Я с большим уважением отношусь к произведениям Андрея Васильева, несмотря на редкие провалы в его творчестве. Его культура общения с читателями в комментариях (см. выше)... ну, оставляет желать лучшего, но в конце концов все его главные герои изрядные резкие хамы (к слову, а в Файролле вообще есть положительные герои?), и мы все равно им симпатизируем, так что не страшно.
Просто поясню, что галантерейщик таки может кое-что сделать, даже без кардинала. И называется это кое-что machine learning. Или то, что нынешний хайп называет искинами, АИ и прочими странными словами. И это было более чем реально уже давно.
Более десяти-двенадцати лет назад моя дочка, закончив Йель, решила пожить в Нью-Йорке прежде чем получать следующую ступень образования. И она работала там в Random House - одном из крупнейших издательств США, где её задачей было натренировать модели для предсказания насколько успешной будет та или иная рукопись на основании данных об уже опубликованных книгах. Кстати, я в этом ей помогал по мелочам, но в целом она и сама очень умная девушка.
И знаете что? Кое-что получилось. Уже тогда. Так что, если кто из вас пошлет свою книгу на английском в Random House, я не скажу, что её искин будет решать судьбу этой рукописи, но если она дойдет до живого редактора, то решение этого искина будет где-то на первой странице прямо перед синопсисом. Хотя сам искин скорее всего с тех пор был изрядно дотренирован, а может и переписан. А может и нет. Но перед синопсисом будет.
Это я к чему? Андрей меня обозвал писателем "но нейм", но суть в том, что мне и не надо быть для этого писателем. Все, что мне надо, это быть хорошим инженером и иметь доступ к текстам и рейтингам от пользователей. С инженерной частью у меня проблем нет, а вот с доступом... думаю, это могут сделать только работники АТ. А так, да, все возможно.
Что этому мешает? АТ не настолько high margin бизнес, чтобы тратиться сейчас на этот проект, а инженер, хотя бы один, потребуется очень хороший (читай, хорошо оплачиваемый). Ну, и озадачиться проблемой читателей им надо. Что не факт, что вписывается в нынешнюю бизнес модель, учитывая какой мусор они рекламируют. Реклама для большинства (ЛР, боярка, нагибаторы), от которой многие скрипят зубами, тоже в своем роде machine learning aka АИ, только очень простое. Модель называется наивный байесиан, и хорошо известна в матстатистике. Если знаешь, как её использовать, то будет работать. Проверено в 2013-м лично. Например, обнаружили, что МакДональды в Китае почему-то классифицированы как пиццерии. Исправили. Но это если знаешь как использовать. Если не знаешь, то будет фуфло. Тоже доказано не раз и не два. Сделать что-то получше можно, но требует усилий и затрат. Как-то так.
Но честно, так хотелось бы не иметь список из 50-100 книг, их которых нужно прочитать хотя бы несколько глав, чтобы решить, читать их дальше или это мусор... Как сказал человек, которому я отвечал:
Вот мне осталось не так много жить. А стоит ли тратить свое практически бесценное время на чтиво сомнительного содержания? Ведь кот в мешке.
И правда, не хочется.