Читать «Теория языка: учебное пособие» онлайн - страница 307

Александр Тимофеевич Хроленко

Связь языкознания с математикой не была односторонней. Используя методы математики, лингвистика в свою очередь питала математику плодотворными идеями. Наблюдения известного математика А.А. Маркова (1856–1922) над текстом «Евгения Онегина» (распределение доли гласных и согласных среди первых 20 ООО букв – «испытания, связанные в цепь») привели к открытию знаменитых «марковских цепей», обогативших теорию вероятностей и математическую статистику. Примером использования лингвистических знаний в математике служит создание математической лингвистики [Гладкий, Мельчук 1969].

Для описания и исследования лингвистических фактов привлекаются различные разделы математики: алгебра, теория множеств, математическая логика, теория информации, теория вероятностей и математическая статистика. В силу этого математическая лингвистика стала развиваться в нескольких направлениях – алгебраическая лингвистика, комбинаторная лингвистика, которая опирается на разделы «неколичественной» математики (теория множеств, математическая логика, теория алгоритмов), и квантитативная лингвистика, которая изучает лингвистические явления с помощью «количественной» математики (математическая статистика, теория вероятностей, теория информации и др.).

Квантитативная лингвистика отличается от математической лингвистики большим вниманием к языковой специфике, которая стоит за количественными отношениями. Главная её задача – поиск связи между количественными и качественными сторонами языка: между употребительностью и возрастом слов, длиной слова и его употребительностью, полисемией и употребительностью; делается попытка выявить объективный критерий таких лингвистических категорий, как продуктивность классов слов, однородность и регулярность отношений между единицами словаря [Арапов 1988].

Пока наиболее перспективным представляется исследование сущностных характеристик языка при помощи аппарата теории вероятностей и математической статистики – квантитативная лингвистика. Собственно говоря, связь математики с языкознанием началась с попыток установить статистические свойства речи, поскольку языку присущи объективные количественные характеристики. Благодаря вероятностной природе языковой структуры, она легко поддается изучению математическим аппаратом теории вероятностей и математической статистики. Основа тому – регулярность, упорядоченность языковых явлений. Уже существует большая специальная литература, отразившая результаты применения статистических методик в исследовании различных ярусов языковой системы.

Статистически исследуется фонетика, закладываются основы статистического изучения морфемного состава слова и морфологических категорий. В частности, установлена связь между числом фонем и средней длиной морфемы, стало известно, что количество фонем отражается на качестве морфем и слов, а количество морфем на качестве слов. Интересна попытка количественно выразить степень силы управления. Намечается статистическая классификация синтаксических конструкций, обследуются закономерности связи размера предложения с характером текста. Выявлено, что с XI до XX в. вероятность использования предлогов увеличилась с 0,096 (XI–XIII вв.) до 0,123 (XX в.), а союзов уменьшилась с 0,126 (XI–XIII вв.) до 0,085 (XX в.) [Русинов 1983: 37]. Количественной интерпретации подвергается даже такая «качественная» сторона языка, как семантика. Особенно эффективны статистические подсчеты в стилистике. Количественными параметрами обладают такие явления, как ритм и рифма. С применением статистики увеличивается надежность типологических разысканий. С помощью статистических методов устанавливается мера генетической близости между славянскими языками, сохраняемой, по данным праславянской лексики, каждым из них [Журавлев 1994].