Читать «Код бестселлера» онлайн - страница 134

Мэттью Л. Джокерс

260

Действительно, по-настоящему (англ.).

261

Чтобы границу было легче увидеть, мы изменили расположение книг на плоскости, убрав те, что оказались ближе всего к границе. (Примеч. авторов.)

262

В использованных нами алгоритмах обучения задействована довольно сложная математика. Прекрасный обзор методов KNN и SVM содержится в работе An Introduction to Statistical Learning by James, Witten, Hastie и Tibshirani. Springer: New York, 2013. Очень краткое описание метода Nearest Shrunken Centroids можно найти по адресу , вместе со ссылкой на научную работу «Diagnosis of multiple cancer types by shrunken centroids of gene expression», в которой описано первое испытание этого алгоритма. Заинтересованные читатели могут также ознакомиться со статьей: Jockers Matthew L. and Daniela M. Witten. A Comparative Study of Machine Learning Methods for Authorship Attribution // Literary and Linguistic Computing, 25.2, 2010, 215–224. (Примеч. авторов.)

263

Мы экспериментировали с различными значениями К. лучшие результаты получались при К = 15. (Примеч. авторов.)

264

Мы также изучали получившиеся матрицы ошибок, чтобы лучше понять факторы, влияющие на точность модели, но это уже выходит за рамки послесловия. (Примеч. авторов.)

265

Более подробное, но все же без явного технического уклона описание интеллектуального анализа текста и машинного обучения можно найти в работе: Jockers Matthew L. and Underwood Ted. Text-Mining the Humanities // New Companion to the Digital Humanities / Eds. Susan Schreibman, Ray Siemens, John Unsworth. Wiley-Blackwell, 2016. (Примеч. авторов.)