Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
088111_MI_Kornienko_(k_razmescheniyu).doc
Скачиваний:
6
Добавлен:
01.05.2025
Размер:
991.74 Кб
Скачать

Тема 17 Корреляция и регрессия

После изучения материала этой темы вы должны уметь ...

1. Разбираться в том, что собой представляют парная корреляция, частная корреляция, частичная корреляция и показать, почему они являются основой для регрессионного анализа.

2. Объяснить природу и методы двумерного регрессионного анализа и описать общую модель, процедуры оценки параметров, нормирование коэффициента регрессии, проверки значи­мости, процедуру определения точности прогноза, анализ остатков и перекрестную провер­ку модели.

3. Объяснять природу и методы множественного регрессионного анализа и значение частных коэффициентов регрессии.

4. Описать специализированные методы, используемые в рамках множественного регресси­онного анализа, особенно пошаговую регрессию, регрессию с фиктивными переменными, а также дисперсионный и ковариационный анализ с регрессией.

5. Объяснить неметрическую корреляцию и такие показатели, как коэффициенты ранговой корреляции Спирмена и Кендалла.

Краткий обзор

В теме 16 рассматривались взаимосвязи между /-критерием, дисперсионным и ковариаци­онным анализом, а также регрессией. В этой главе вы познакомитесь с регрессионным анали­зом, объясняющим вариацию в доли рынка, продажах, предпочтении торговой марке и других маркетинговых результатах, получаемых при управлении такими маркетинговыми перемен­ными, как реклама, цена, распределение и качество продукции. Однако прежде чем присту­пить к изучению регрессии, мы рассмотрим парную корреляцию и частный коэффициент кор­реляции, лежащие в основе регрессионного анализа.

Разбираясь с регрессионным анализом, мы сначала обсудим самый простой его тип — дву­мерную регрессию, опишем процедуры оценки, нормирования коэффициентов регрессии, проверку и определение тесноты и значимости связи между переменными, а также точность прогноза и допущения, которые лежат в основе регрессионного анализа. Затем мы разберем мо­дель множественной регрессии, уделив особое внимание интерпретации параметров, тесноте связи, проверкам значимости и анализу остатков.

Резюме

Парный коэффициент корреляции r является мерой линейной связи между двумя метри­ческими (измеренными интервальной или относительной шкалой) переменными. Его квадрат r2 измеряет долю вариации одной из переменных, обусловленную вариацией другой. Частный коэффициент корреляции — мера зависимости между двумя переменными после исключения эффекта от влияния одной или нескольких дополнительных переменных. Порядок частной корреляции указывает на количество переменных, на которые необходимо внести поправку или которые следует исключить. Коэффициенты частной корреляции могут оказаться полез­ными для выявления ложных связей.

С помощью парной регрессии устанавливается математическая зависимость (в виде урав­нения) между метрической зависимой (критериальной) переменной и метрической независи­мой переменной (предиктором). Уравнение описывает прямую линию, и для его вывода ис­пользуют метод наименьших квадратов. В случае построения регрессии с нормированными данными отрезок, отсекаемый на оси OY, принимает значение, равное 0, и коэффициенты рег­рессии называют взвешенными "бета"-коэффициентами. Силу тесноты связи измеряют ко­эффициентом детерминации r2, который получают, вычисляя отношение SSрегресс к SSy. Стан­дартную ошибку уравнения регрессии используют для оценки точности предсказания, и ее можно интерпретировать как род средней ошибки, сделанной при теоретическом предсказании Y, исходя из уравнения регрессии.

Множественная регрессия включает одну зависимую и две (или больше) независимых пе­ременных. Частный коэффициент регрессии b1 представляет ожидаемое изменение Y, когда Х1 меняется на одну единицу, а переменные от Х2 до Xk остаются постоянными. Силу тесноты связи измеряют коэффициентом множественной детерминации R2. Значимость общего урав­нения регрессии проверяется общим F-критерием. Отдельные частные коэффициенты регрес­сии можно проверить на значимость, используя F-критерий приращений. Диаграммы рассея­ния остаточных членов, когда их значения представлены графически в зависимости от пред­сказанных теоретических значений Yi , времени или предикторов, полезны для проверки соответствия основным допущениям и подобранной регрессионной модели.

При пошаговой регрессии предикторы вводят или выводят из уравнения регрессии один за другим с целью выбора меньшего их числа, которые объясняют большую часть вариации кри­териальной переменной. Мультиколлинеарность или очень высокая взаимная корреляция ме­жду предикторами может вызвать некоторые проблемы. Из-за того, что предикторы взаимо­связаны (коррелируют), регрессионный анализ не обеспечивает однозначного свидетельства об относительной важности предикторов. Перекрестная проверка может установить, верна ли рег­рессионная модель для сопоставимых данных, не использованных при ее вычислении. Она яв­ляется полезным методом при оценке регрессионной модели.

Можно использовать категориальные переменные как предикторы путем их кодирования как фиктивных переменных. Множественная регрессия с фиктивными переменными предос­тавляет общий метод для выполнения дисперсионного и ковариационного анализа.