Читать «Книга 2. Тайна русской истории. Новая хронология Руси. Татарский и арабский языки на Руси. Ярославль как Великий Новгород. Древняя английская история — отражение византийской и ордынской» онлайн - страница 171

Анатолий Тимофеевич Фоменко

Трудности также связаны с тем, что многие числовые характеристики текстов чрезвычайно чувствительны в смене стиля в произведениях одного и того же автора. То есть принимают существенно различные значения для текстов, написанных автором в разное время. Таким образом, установление отличительных особенностей каждого писателя весьма сложно, особенно если мы хотим оценивать эти индивидуальные параметры количественно.

Искомая характеристика должна удовлетворять следующим условиям.

1) Она должна быть достаточно «массовой», чтобы слабо контролироваться писателем. Другими словами, характеристика должна быть в некотором смысле «бессознательным параметром» авторов.

2) Она должна быть «постоянной» для каждого автора. То есть иметь небольшое отклонение от среднего значения, слабо колебаться вдоль всех его произведений.

3) Она должна различать между собой разные группы авторов. То есть должны существовать разные группы писателей, для которых отличия в значениях этой характеристики были бы больше, чем ее колебания внутри текстов одного автора.

Рис. 2.148. Поведение процента служебных слов для выборок по 2000 слов. Видно, что получающиеся кривые — хаотичны

Рис. 2.149. Поведение процента служебных слов для выборок по 4000 слов. Видно, что кривые остаются пока хаотичными, однако уже начинается их сглаживание

Рис. 2.150. Поведение процента служебных слов для выборок по 8000 слов. Кривые пока еще «перемешиваются», однако начинают все более и более выпрямляться

После проведения В.П. Фоменко и Т.Г. Фоменко обширного численного эксперимента оказалось, что числовым параметром текстов, удовлетворяющим перечисленным условиям, является ОТНОСИТЕЛЬНАЯ ЧАСТОТА УПОТРЕБЛЕНИЯ АВТОРОМ СОВОКУПНОСТИ ВСЕХ СЛУЖЕБНЫХ СЛОВ — ПРЕДЛОГОВ, СОЮЗОВ И ЧАСТИЦ, рис. 2.148-2.151 [893], [909]. При движении вдоль текста с выборками величиной по 16 ООО слов, процент служебных слов для каждого писателя оказался приблизительно постоянным для всех его произведений. То есть, кривая, изображающая эволюцию указанной частоты, оказывается практически горизонтальной прямой. Выяснилось далее, что разность между максимальным и минимальным значениями этого параметра значительно больше амплитуды его колебаний внутри произведений отдельных авторов. Минимум и максимум были взяты по всем исследованным авторам. Следовательно, обнаруженный параметр хорошо различает между собой многих авторов. На этом основании он был назван авторским инвариантом. Его можно использовать как для атрибуции неизвестных произведений, так и для обнаружения плагиата. Хотя и с определенной осторожностью, поскольку у некоторых писателей могут быть очень близкие инварианты. Например, Фонвизин и Толстой. Кроме того, для достаточно уверенных статистических выводов требуются произведения большого объема.