Читать «Будущая революция и новое общество» онлайн - страница 63

Н Ключин

Б. "IPUMS"

Следующим об?ектом исследования стала электронная база данных "Integrated Public Use Microdata Series", сокращенно "IPUMS" ("ИПУМС") [ 114]. Ее создатели - американцы Стевен Руглс и Мэтью Собек - обработали первичные данные одиннадцати государственных переписей населения США: 1850, 1880, 1900, 1910, 1920, 1940, 1950, 1960, 1970, 1980 и 1990 годов.

Из всего массива переписей ими были созданы выборки. Из всего опрошенного переписями населения была выбрана небольшая часть (обычно 1 процент), и были взяты ответы на вопросы анкет этой небольшой части населения. При этом выборка пропорционально отражала полную картину первичных данных переписей. Кроме того, авторы привели данные каждой переписи к единой форме, что существенно облегчало анализ динамики показателей.

Мной для анализа не были взяты полные выборки ИПУМСа. Так как они, хотя и в 100 раз меньше, чем документы самих переписей, но тем не менее, тоже очень громоздки. Вместо полных выборок я использовал их сокращенные варианты, созданные авторами ИПУМСа. Эти выборки имеют название "tiny". Они созданы путем случайного отбора и имеют размер, равный 1/10 размера самой маленькой полной выборки ИПУМСа - выборки 1900 года. Каждая выборка "tiny" включает записи примерно о 2 100 семей каждая.

Из всех вопросов, которые содержались в анкетах переписей, меня интересовал в первую очередь вопрос о суммарном доходе физических лиц. Данные о полной сумме полученного за предыдущий год дохода содержатся в документах переписей населения США, только начиная с 1950 года. В переписи 1940 года были учтены только основные виды дохода. Поэтому, начиная с переписи 1950 года, возможно проследить динамику изменения полного суммарного дохода.

Я проанализировал пять выборок:

1. выборка "tiny19501.Z" охватывает 0,0045% всего опрошенного переписью 1950 года населения;

2. выборка "tiny19601.Z" охватывает 0,0038% всего опрошенного переписью 1960 года населения;

3. выборка "tiny19702.Z" охватывает 0,0032% всего опрошенного переписью 1970 года населения;

4. выборка "tiny19802.Z" охватывает 0,0025% всего опрошенного переписью 1980 года населения;

5. выборка "tiny19902.Z" охватывает 0,0022% всего опрошенного переписью 1990 года населения.

Перед началом работы с выборками я выделил из них группу, более узкую выборку, которую предстояло исследовать. Группа соответствовала следующим параметрам.

1. Это были личные доходы, т. е. доходы, полученные физическим лицом.

2. Возраст получателя дохода был не менее 30 и не более 55 лет. Это наиболее плодотворный период жизни человека. Примерно к 30 годам человек, как правило, окончательно определяется в своем жизненном пути и имеет стабильный доход. После 55 лет некоторые люди прекращают обычную трудовую деятельность, выходя на пенсию или сменяя вид деятельности на более легкий.

3. Получатель дохода имел статус работающего. Были исключены безработные, домохозяйки и т. д.

4. Все члены группы имели доход в году, предшествующем году переписи. Были исключены немногочисленные респонденты, совсем не имевшие дохода, а также имевшие убыток, т. е. отрицательный доход.