Читать «Цифровой журнал «Компьютерра» № 202» онлайн - страница 44

Коллектив авторов

Для этого он использовал различные методики. В частности, для определения степени представленности разных языков в общедоступных онлайновых текстах он измерял объём и число статей в Википедии на каждом из языков. Чтобы установить уровень поддержки языка в программном обеспечении, изучались как локализации интерфейса программ и системы проверки орфографии, так и просто его наличие в стандарте Unicode и других базах данных, позволяющих компьютерным устройствам автоматически опознавать разные языки.

Присутствие языка в Википедии стало одним из важнейших индикаторов его способности выжить в цифровой век. Поскольку успешность языка в цифровом пространстве означает его активное использование, было необходимо определить по меньшей мере одно популярное онлайновое сообщество, основанное на языке как основном средстве коммуникации. Таким сообществом могли быть доски объявлений, рассылки, группы Yahoo или Google, но, по мнению Корная, Википедия всегда становится одним из первых активных цифровых языковых сообществ, которое можно рассматривать в качестве раннего индикатора того факта, что какой-то язык действительно преодолевает «цифровой барьер». Причина в том, что дети, едва начав пользоваться компьютером не только для игр, практически сразу знакомятся с Википедией, предлагающей чрезвычайно комфортную среду для единомышленников. Онлайновая энциклопедия, составляемая пользователями, не только позволяет суммировать знания человечества, но и способна стать мощным инструментом продвижения языка и культуры в цифровом мире.

Чтобы язык получил полномочное представительство в интернете, ему жизненно необходима своя Википедия. Это подтверждает тот факт, что в настоящее время на стадии «инкубатора» находятся 533 языковых заявки, что более чем вдвое превышает число существующих Википедий. Желание обзавестить полноценной работающей Википедией настолько велико, что нередко приводит к манипуляциям с , которая традиционно оценивает локализованные версии исключительно по числу входящих в них статей. Вопиющий пример таких манипуляций — это неизменно занимающая места в первых десятках энциклопедия на искусственном языке волапюк, который фактически не используется сегодня никем, кроме трёх десятков энтузиастов. Почти все её статьи написаны ботами и состоят из чрезвычайно «полезной» информации вроде «Китсеместа — деревня в Эстонии, расположена на широте 8°55′ N и долготе 26°19′ E». В настоящее время ведётся дискуссия о перемещении Википедии на волапюке обратно в инкубатор и о предотвращении появления в дальнейшем подобных псевдоэнциклопедий.

На основе полученных в ходе исследования данных все языки были поделены на пять категорий: процветающие, жизнеспособные, пограничные, наследие (онлайновое присутствие обусловлено исключительно работой учёных по их изучению) и мёртвые (вообще не присутствующие ни в онлайне, ни в цифровых устройствах).