Читать «Код бестселлера» онлайн - страница 127
Мэттью Л. Джокерс
51
A Clockwork Orange, Anthony Burgess. Использован перевод «Заводного апельсина», сделанный Е. Г. Синельщиковым.
52
A River Runs through It, Norman Maclean.
53
Rogue Lawyer, John Grisham.
54
All the Light We Cannot See, Anthony Doerr.
55
The Girl on the Train, Paula Hawkins.
56
Go Set a Watchman, Harper Lee.
57
The Nightingale, Kristin Hannah.
58
O Alquimista, Paulo Coelho.
59
Ready Player One, Ernest Cline.
60
Роман Селесты Инг. Everything I Never Told You, Celeste Ng.
61
Роман Кристины Бейкер Кляйн. Orphan Train, Christina Baker Kline.
62
Роман Колма Тойбина. Brooklyn, Colm Tóibín.
63
House Rules, Jodi Picoult.
64
Точность измеряется с помощью перекрестной проверки. В этом случае мы использовали два типа перекрестной проверки: в первом (скажем для читателей, которых интересуют подробности) сначала использовалось многократное обучение на случайной выборке 90 % книг, а затем проверка результатов на оставшихся 10 %. Во втором мы использовали принцип «все, кроме одной», заключавшийся в том, что мы обучали модель на множестве всех книг, изымая оттуда лишь по одной книге единомоментно. В обоих экспериментах успехом считалось, когда машина правильно угадывала класс (бестселлер или небестселлер) изъятой книги (или книг, при первом подходе). Это длительный и кропотливый процесс, включающий в себя обучение и испытание множества моделей. При обучении этих моделей нам приходилось использовать уже изданные книги, про которые было известно, стали они бестселлерами или нет. Первая модель была построена в 2011 г. Добавив в корпус текстов все бестселлеры и некоторое количество небестселлеров, вышедшие за следующие пять лет, мы смогли снова испытать модель и в каком-то смысле проверить, работают ли наши наблюдения, сделанные в 2011-м, для 2015 г. Оказалось, что да. Подкрепив свою уверенность с помощью перекрестной проверки, мы можем исследовать прогноз и связанные с ним показатели вероятностей для каждой книги. По поводу некоторых книг модель не смогла прийти к окончательному выводу, и такие книги получали индекс 51 %. Поскольку случайная догадка имеет вероятность 50 на 50, это не очень высокая степень уверенности. В таком случае мы исследовали все остальные характеристики текста – например стиль или сюжет, – прежде чем сделать вывод о вероятности успеха. Но для других книг модель прогнозировала индекс успеха с большой уверенностью и присваивала им соответствующий рейтинг. (
65
The House on Hope Street, Danielle Steel.
66
Mixed Blessings, Danielle Steel.
67
Accident, Danielle Steel.
68
The Litigators, John Grisham.
69
The Associate, John Grisham.
70
Calico Joe, John Grisham.
71
Going Home, Danielle Steel.
72
The Firm, John Grisham.
73
Для тех, кого интересуют подробности, в послесловии объясняется, как мы вводили поправки при работе модели с несколькими книгами одного и того же автора. (
74
The Kiss, Danielle Steel.
75
The Pelican Brief, John Grisham.