Читать «Фрікономіка. Зворотний бік усього на світі» онлайн - страница 19
Стівен Левітт
Якщо економіка — це наука, яка передусім зосереджує свою увагу на стимулах, то вона — на щастя — є також наукою, яка має статистичні інструменти для виміру реакції людей на ці стимули. Усе, що вам треба, — це мати достатньо інформації.
У цьому випадку нам стала у пригоді Чиказька система державних шкіл. Вона забезпечила доступ до бази даних з результатами тестування кожного учня цієї шкільної системи з третього до сьомого класу включно за період з 1993 по 2000 рік. Їхня кількість сягає приблизно 30 000 учнів щорічно на кожен клас, тобто понад 700 000 комплектів з результатами тестування і близько 100 мільйонів окремих відповідей. Ці дані, упорядковані за класами, містили ланцюжки відповідей кожного учня на послідовні запитання в тестових завданнях з читання й математики. (Реальних паперових аркушів як додатку до цифрового масиву даних не існує, бо вони зазвичай знищуються шляхом подрібнення одразу після тестування). Ці дані містили також певну інформацію про кожного вчителя та демографічну інформацію про кожного учня, включно з його тестовими оцінками як у минулому, так і в подальшому (що й стало основним чинником при виявленні вчительського шахрайства).
Потім настав час скласти алгоритм, спроможний виділити певні висновки з цього масиву інформації. Який же вигляд матиме типовий клас, де вчитель займається шахраюванням?
Перше, що слід шукати, — це незвична структура відповідей у тому чи іншому конкретному класі: наприклад, блоки ідентичних відповідей, особливо на складніші запитання. Якщо десять дуже здібних учнів (про що свідчать тестові оцінки як у минулому, так і в подальшому) дали правильні відповіді на