Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лаба 4 Люда.doc
Скачиваний:
7
Добавлен:
10.12.2018
Размер:
2.22 Mб
Скачать

Исследование построенной регрессионной модели

Так как можно считать, что регрессионные остатки имеют нормальное распределение, то есть смысл проводить дальнейший анализ построенного уравнения множественной регрессии. Вернемся к рисунку 1:

Коэффициент

Ст. ошибка

t-статистика

P-значение

const

60,4442

7,15865

8,4435

<0,00001

***

X1

0,193684

0,398708

0,4858

0,63268

X2

-0,0798086

0,0720325

-1,1080

0,28171

X3

0,053812

0,208385

0,2582

0,79900

X4

0,639778

0,170594

3,7503

0,00136

***

Оценка модели регрессии выглядит следующим образом:

ŷ = 60,44 + 0,19Х1 -0,08Х2 +0,05Х3 + 0,64Х4

(7,16) (0,40) (0,07) (0,21) (0,17)

В круглых скобках записаны стандартные ошибки оценки коэффициентов.

Проверка адекватности линейной модели множественной регрессии (лммр) выборочным данным

Общая вариация результативного признака складывается из вариации функции «регрессии», обусловленной варьированием значений объясняющих переменных (факторной дисперсии), и из вариации случайной величины относительно функции «регрессии» (остаточной дисперсии), то есть:

где - общая сумма квадратов;

- факторная сумма квадратов;

- остаточная сумма квадратов.

При этом, чем лучше построенное уравнение регрессии описывает исходные данные, тем больше будет факторная дисперсия и тем меньше будет остаточная дисперсия . Этот очевидный факт положен в основу критерия проверки адекватности (значимости) построенного уравнения регрессии. е будет факторен\а оно обхясняеплаты

0000000000000000000000000000000000000000000000000000000000000000000000000000

Выдвигается нулевая гипотеза о том, что ЛММР неадекватна выборочным данным (ни один из признаков не оказывает значимого влияния на y):

.

Для проверки гипотезы Н0 используется статистика

или

которая при справедливости Н0 имеет распределение Фишера – Снедекора с числом степеней свободы

Это означает, что можно указать такое число , что если гипотеза Н0 верна, то указанная статистика будет принимать значения меньше этого числа с заранее заданной, близкой к 1 вероятностью , и с вероятностью будет принимать значения больше . Следовательно, если наблюдаемое значение статистики окажется больше, чем , то либо произошел один из тех случаев, когда на самом деле Н0 верна и отвергая ее, мы ошибаемся, либо Н0 действительно неверна. Из описания ясно, что представляет собой квантиль уровня распределения Фишера-Снедекора с указанными степенями свободы, или, -ую критическую точку этого же распределения.

Из рисунка 1 видно:

R-квадрат 0,513441 Испр. R-квадрат 0,411008

F(4, 19) 5,012443 Р-значение (F) 0,006266

Наблюдаемое значение статистики F составило . Найдем критическое значение:

Рисунок 5 – Результат расчета критического значения распределения Фишера-Снедекора

Существует еще один вариант процедуры проверки статистической гипотезы, реализованной в большинстве статистических пакетов. Для наблюдаемого значения рассчитывается вероятность того, что статистика примет значение больше него (так называемый «достигаемый уровень значимости»), которая сравнивается с заданным уровнем значимости. Если рассчитанная вероятность окажется меньше, что нулевая гипотеза отвергается. Вернемся к рисунку 1:

R-квадрат 0,513441 Испр. R-квадрат 0,411008

F(4, 19) 5,012443 Р-значение (F) 0,006266

Достигаемый уровень значимости (p-значение) составил , что намного меньше , следовательно, Н0 отвергается, модель значима.

Поскольку нулевая гипотеза о незначимости уравнения регрессии была отвергнута, нужно проверить гипотезы о значимости коэффициентов уравнения регрессии.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]