Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Конспект лекций по курсу Мн_ст_анализ.doc
Скачиваний:
68
Добавлен:
01.02.2015
Размер:
366.59 Кб
Скачать

4.6. Нормированный коэффициент регрессии и проверка значимости.

Нормированный коэффициент регрессии

Нормирование представляет собой процедуру, посредством которой исходные данные преобразуют в новые переменные со значением средней, равным нулю и дисперсией, равной единице. После нормирования данных, отрезок, отсекаемый на оси OY, принимает значение 0. Нормированный коэффициент регрессии обозначают как «бета»-коэффициент или взвешенный «бета»-коэффициент. В этом случае угловой коэффициент регрессии Y по Х, обозначаемый Bxy, тот же, что и угловой коэффициент регрессии Х по Y, обозначаемый Byx. Более того, каждый из этих коэффициентов регрессии равен простому (линейному) коэффициенту корреляции между Х и Y.

Byx = Bxy = rxy

Существует простая связь между нормированным и ненормированным коэффициентами регрессии:

Sx

Byx = byx 

Sy

Проверка значимости

Статистическую значимость линейной связи между Х и Y можно проверить, исследовав гипотезы:

H0 : 1 = 0

H1 : i  0

Нулевая гипотеза предполагает, что между Х и Y не существует линейной зависимости. Альтернативная гипотеза утверждает, что между Х и Y существует зависимость, либо положительная, либо отрицательная. Обычно проводят двустороннюю проверку. Можно использовать t-статистику с n-2 степенями свободы, где

b

t = 

SEb

SEb обозначает стандартное отклонение b, и этот показатель называют стандартной ошибкой коэффициента регрессии b.

Лекция 5

Вопросы лекции:

5.1. Теснота и значимость связи.

5.2. Точность предсказаний.

5.3. Допущения модели регрессионного анализа.

5.4. Факторный анализ.

5.1. Теснота и значимость связи

Соответствующий статистический вывод включает определение тесноты и значимости связи между Х и Y. Тесноту связи измеряют коэффициентом детерминации r2 . В парной регрессии r2 представляет собой квадрат линейного коэффициента корреляции. Коэффициент r2 изменяется от нуля до единицы. Он показывает долю от полной вариации переменной Y, которая обусловлена вариацией переменной Х. Разложение полной вариации переменной Y аналогично разложению полной вариации в дисперсионном анализе. Как показано на рис.1, полная вариация SSy раскладывается на вариацию, которую можно объяснить, исходя из линии регрессии SSрегрессии и вариацию ошибки или остаточную вариацию, SSошибки или SSостаточная

Y

Остаточная вариация

YSSres

Полная вариация Объяснимая вариация

SSy SSreg

Х

Рис.1 Разложение полной вариации в парной регрессии

SSy = SSрегрессии + SSостаточная

где

SSy =

SSрегрессии =

SSостаточная =

Тесноту связи вычислим следующим образом

SSрегрессии

r2 = 

SSy

SSy - SSостаточная

r2 = 

SSy

Другой равноценной проверкой значимости линейной зависимости между Х и Y (значимости b) является проверка значимости коэффициента детерминации. В этом случае гипотезы имеют следующий вид:

H0:R2совокупности = 0

H1:R2совокупности > 0

Соответствующей статистикой, лежащей в основе критерия, является F-статистика

SSрегрессии

F = ,

SSостаточная /(n-2)

которая подчиняется F-распределению с 1 и n-2 степенями свободы. F-критерий представляет собой обобщенную форму t-критерия. При этом, если случайная переменная подчиняется t-распределению с n степенями свободы, то значения r2 подчиняются F-распределению с 1 и n степенями свободы. Отсюда следует, что F-критерий для проверки значимости коэффициента детерминации эквивалентен проверке следующих гипотез:

H0 : 1 = 0

H1 : 1  0

или

H0:  = 0

H1:   0

Если зависимость между Х и Y статистически значима, то имеет смысл вычислить значение Y, исходя из значений Х, и оценить точность предсказания.