Читать «Методы статистического анализа исторических текстов (часть 1)» онлайн

Анатолий Тимофеевич Фоменко

Методы статистического анализа исторических текстов (часть 1)

Геродот, рассказывая о строительстве пирамид, отмечает: «Сколько же денег пошло на железные орудия» [78, кн. 2, № 125].

Современный комментарий: «Во времена Хеопса, т. е. в первой половине III тысячелетия до н. э., египтяне пользовались только медными орудиями» [76, с. 34, коммент. 18].

Предисловие А.Н. Ширяева

(К первому изданию книги «Методы статистического анализа нарративных текстов и приложения к хронологии» в 1990 году)

Сегодня методы прикладной статистики проникают в самые различные области знания, в том числе и в задачи изучения текстов различной природы. При этом под «текстом» могут пониматься последовательности сигналов того или иного типа, длинные коды, возникающие в генетике, графические изображения (которые можно закодировать и представить в виде «текста»), а также и реальные нарративные тексты (например, исторические хроники, первоисточники, документы и т. п.)

Одна из важных возникающих здесь задач состоит в распознавании зависимых текстов, т. е. «похожих» текстов, имеющих в некотором смысле общую природу, общее происхождение. Например, в задаче распознавания образов важно обнаружить среди большой совокупности «изображений» такое, которое максимально «близко» к заранее заданному: в задаче изучения длинных последовательностей сигналов важно уметь обнаруживать «однородные подпоследовательности» и места их стыковок. Сюда относится, в частности, и известная задача о разладке, решению которой в математической статистике, статистике случайных процессов уделяется большое внимание.

Применительно к проблемам изучения нарративных текстов задача распознавания зависимых и независимых текстов (например, хроник) звучит как задача поиска текстов, восходящих, например, к одному общему первоисточнику, оригиналу (такие тексты естественно назвать зависимыми), или, напротив, восходящих к существенно разным первоисточникам (такие тексты естественно назвать независимыми). Ясно, что задачи этого типа чрезвычайно сложны и поэтому следует приветствовать появление новых эмпирико-статистических методов распознавания, которые, в совокупности с классическими подходами могут быть полезны в конкретных исследованиях (например, источниковедческих).

Настоящая книга профессора чистой математики А.Т. Фоменко ориентирована, в основном, на разработку таких новых методов применительно к проблеме распознавания зависимых и независимых нарративных текстов и для их датировки (по отношению к текстам с заранее известной достоверной датировкой).

Автор книги предлагает новый подход к задаче распознавания зависимых и независимых нарративных (исторических) текстов на основе нескольких новых эмпирико-статистических моделей (закономерностей), обнаруженных им в результате обширных статистических экспериментов с различными количественными характеристиками конкретных текстов, хроник, первоисточников и т. п. Проверка этих моделей (статистических гипотез) на конкретном материале хроник подтвердила эффективность моделей и позволила предложить новые методы датировки текстов (а точнее, описываемых в этих текстах событий).