Читать «Ритейл-маркетинг: Практики и исследования» онлайн - страница 15
Йенс Нордфальт
Регрессионный анализ
Многие термины говорят сами за себя, например такой, как «сравнение средних значений». Даже неосведомленный человек может примерно понять, о чем идет речь. Сравнение средних значений будет приводиться во многих таблицах. С другой стороны, термин «регрессионный анализ» у многих вызывает страх – причем абсолютно необоснованно, поскольку за ним скрывается довольно простая вещь. Для пользователей статистики главная проблема состоит в понимании, какой метод что делает и что для этого требуется. Понять результаты, как правило, довольно легко.
В этой книге будет представлено несколько таблиц, содержащих результаты регрессионного анализа. Они могут выглядеть, как таблица 1.1. Ее вы увидите снова в главе 7.
Таблица 1.1. Пример результатов регрессионного анализа
Главное, что вы должны знать о регрессионном анализе: он представляет собой метод моделирования измеряемых данных с целью исследования, как некая независимая переменная или несколько переменных (множественная регрессия) влияют на некую зависимую переменную. В таблице 1.1 в качестве последней выступает «активация». Зависимая переменная почти всегда указывается в верхней строке таблицы. Ниже идут независимые (объясняющие) переменные. Их также называют коэффициентами регрессии. В таблице 1.1 мы видим, что «беспорядочность» не статистически значимая величина, поэтому мы ее просто проигнорируем. Остальные факторы являются статистически значимыми. Значение коэффициента показывает, какое влияние на «активацию» оказывает его увеличение на одну единицу. Если степень новизны повышается на одну единицу, активация возрастает на 0,35. Как видите, все просто. Чем выше значение статистически значимого коэффициента регрессии, тем интереснее для нас этот коэффициент.
Коэффициент детерминации (R2) показывает, какая доля вариаций зависимой переменной объясняется моделью. Вероятно, не все поняли эту фразу, поэтому ниже я постараюсь объяснить ее значение.
Чтобы немного упростить, используем следующий пример. Предположим, большое количество покупателей заполняет анкету о степени активации. Ответы даются по шкале от 1 до 7. Также при помощи шкалы они оценивают, в какой степени воспринимаемая ими обстановка в магазине является «новой», «разнообразной» и т. д. (см. таблицу 1.1). Окажется, что одни люди испытывают более высокую степень активации, другие – более низкую. Эта величина будет в разной степени коварьировать с разными объясняющими переменными. Например, если большинство тех, кто указал высокую степень активации, также отметили, что воспринимают пространство магазина как большое, то ковариация будет высокой. Если нет никакой взаимосвязи между объясняющей переменной и зависимой – например, обстановка в магазине охарактеризована как «беспорядочная», а степень активации названа высокой, – ковариация будет низкой.