Читать «Голая статистика» онлайн - страница 226

Чарльз Уилан

66

Более общая формула для вычисления t-статистики имеет следующий вид: tb = (bb0) ÷ SEb, где b – наблюдаемый коэффициент, b0 – нулевая гипотеза для этого коэффициента, а SEb – стандартная ошибка для наблюдаемого коэффициента b.

67

Чтобы приспособить регрессионный анализ для использования данных с нелинейными связями, существуют более сложные методы. Однако прежде чем их применять, вам нужно уяснить, почему использование обычного метода наименьших квадратов с нелинейными связями лишено смысла.

68

Необходимо уточнить, что метод наименьших квадратов (МНК), который автор объявил основой регрессионного анализа, действительно можно использовать только для линейных уравнений регрессии. Но линейных относительно коэффициентов регрессии, а не переменных. Поэтому МНК вполне можно применять и для нелинейных (по переменным) уравнений регрессии, которые, однако, являются линейными относительно коэффициентов регрессии либо становятся таковыми после преобразований. Также отметим, что в арсенале регрессионного анализа есть методы, отличные от МНК, которые предназначены для нахождения коэффициентов регрессии в существенно нелинейных уравнениях. Прим. ред.

69

Проще говоря (так, как принято в этой книге), мультиколлинеарность заключается в наличии сильной линейной (статистической) зависимости внутри некоторой группы объясняющих переменных. Это порождает вычислительные сложности или вообще невозможность рассчитать коэффициенты функции регрессии. Прим. ред.

70

Еще одной проблемой «лишних» переменных является мультиколлинеарность (описанная выше), вероятность которой резко возрастает при внесении в уравнение регрессии дополнительных переменных, не прошедших специальной проверки. С другой стороны отметим, что в регрессионном анализе развиты средства отбраковки лишних незначимых объясняющих переменных. Простейшим из которых является так называемый скорректированный коэффициент детерминации, рассчитываемый на основе параметра R². Прим. ред.

71

Русский аналог этой телевикторины называется «Своя игра». Прим. перев.

72

В оригинале приведено слово treatment, которое имеет множество значений. Эти значения: обработка, решение, лечение, трактовка, активизация и др. Мы выбрали слово «активирование» как наиболее подходящее по смыслу для использования в данном тексте. Прим. ред.

73

Эспланада – отрезок музейно-парковой зоны в центре Вашингтона между Капитолием и памятником Джорджу Вашингтону. Прим. перев.

74

Участники этого эксперимента знали, что участвуют в клиническом испытании и что им могут сделать фиктивную хирургическую операцию.

75

В Соединенных Штатах в подготовительных школах учатся дети пяти-шести лет. Прим. перев.

76

Исследователям нравится слово «воспользоваться» (exploit). Оно, в частности, применяется в значении «воспользоваться какой-либо возможностью, связанной с данными». Например, когда исследователи обнаруживают какой-либо натурный эксперимент, который создает подопытную и контрольную группу, они пишут, как собираются «воспользоваться разбросом в соответствующих данных».