Читать «Фрікономіка. Зворотний бік усього на світі» онлайн - страница 19

Стівен Левітт

Якщо економіка — це наука, яка передусім зосереджує свою увагу на стимулах, то вона — на щастя — є також наукою, яка має статистичні інструменти для виміру реакції людей на ці стимули. Усе, що вам треба, — це мати достатньо інформації.

У цьому випадку нам стала у пригоді Чиказька система державних шкіл. Вона забезпечила доступ до бази даних з результатами тестування кожного учня цієї шкільної системи з третього до сьомого класу включно за період з 1993 по 2000 рік. Їхня кількість сягає приблизно 30 000 учнів щорічно на кожен клас, тобто понад 700 000 комплектів з результатами тестування і близько 100 мільйонів окремих відповідей. Ці дані, упорядковані за класами, містили ланцюжки відповідей кожного учня на послідовні запитання в тестових завданнях з читання й математики. (Реальних паперових аркушів як додатку до цифрового масиву даних не існує, бо вони зазвичай знищуються шляхом подрібнення одразу після тестування). Ці дані містили також певну інформацію про кожного вчителя та демографічну інформацію про кожного учня, включно з його тестовими оцінками як у минулому, так і в подальшому (що й стало основним чинником при виявленні вчительського шахрайства).

Потім настав час скласти алгоритм, спроможний виділити певні висновки з цього масиву інформації. Який же вигляд матиме типовий клас, де вчитель займається шахраюванням?

Перше, що слід шукати, — це незвична структура відповідей у тому чи іншому конкретному класі: наприклад, блоки ідентичних відповідей, особливо на складніші запитання. Якщо десять дуже здібних учнів (про що свідчать тестові оцінки як у минулому, так і в подальшому) дали правильні відповіді на перші п’ять екзаменаційних запитань (типово ці питання є найлегшими), то такий ідентичний блок не слід вважати підозрілим. Та коли десять слабких учнів дають правильні відповіді на останні п’ять екзаменаційних запитань (зазвичай найважчих), то до цього варто придивитися уважніше. Ще одним «червоним прапорцем» може слугувати дивна структура відповідей в екзаменаційному аркуші того чи іншого конкретного учня, наприклад, правильні відповіді на складні запитання і неправильні — на легкі; це дуже чітко виявляється на тлі тисяч учнів інших класів, які отримали схожі оцінки за те саме тестування. Крім того, цей алгоритм допоможе розшукати клас, де повно учнів, які отримали оцінки набагато кращі, аніж можна було припустити з огляду на їхні минулі результати, і які наступного року продемонстрували значно гірші показники. Спершу однорічний сплеск екзаменаційних оцінок можна було б пояснити появою гарного вчителя, та коли наступного року відбувається різкий спад, то існує висока ймовірність того, що цей сплеск був спричинений штучними заходами.