- •Оценивание параметров линейной модели множественной регрессии
- •Проверка нормальности распределения регрессионных остатков
- •Исследование построенной регрессионной модели
- •Проверка адекватности линейной модели множественной регрессии (лммр) выборочным данным
- •Проверка значимости коэффициентов лммр
- •Исследование модели на мультиколлинеарность
Исследование построенной регрессионной модели
Так как можно считать, что регрессионные остатки имеют нормальное распределение, то есть смысл проводить дальнейший анализ построенного уравнения множественной регрессии. Вернемся к рисунку 1:
|
Коэффициент |
Ст. ошибка |
t-статистика |
P-значение |
|
const |
60,4442 |
7,15865 |
8,4435 |
<0,00001 |
*** |
X1 |
0,193684 |
0,398708 |
0,4858 |
0,63268 |
|
X2 |
-0,0798086 |
0,0720325 |
-1,1080 |
0,28171 |
|
X3 |
0,053812 |
0,208385 |
0,2582 |
0,79900 |
|
X4 |
0,639778 |
0,170594 |
3,7503 |
0,00136 |
*** |
Оценка модели регрессии выглядит следующим образом:
ŷ = 60,44 + 0,19Х1 -0,08Х2 +0,05Х3 + 0,64Х4
(7,16) (0,40) (0,07) (0,21) (0,17)
В круглых скобках записаны стандартные ошибки оценки коэффициентов.
Проверка адекватности линейной модели множественной регрессии (лммр) выборочным данным
Общая вариация результативного признака складывается из вариации функции «регрессии», обусловленной варьированием значений объясняющих переменных (факторной дисперсии), и из вариации случайной величины относительно функции «регрессии» (остаточной дисперсии), то есть:
где - общая сумма квадратов;
- факторная сумма квадратов;
- остаточная сумма квадратов.
При этом, чем лучше построенное уравнение регрессии описывает исходные данные, тем больше будет факторная дисперсия и тем меньше будет остаточная дисперсия . Этот очевидный факт положен в основу критерия проверки адекватности (значимости) построенного уравнения регрессии. е будет факторен\а оно обхясняеплаты
Выдвигается нулевая гипотеза о том, что ЛММР неадекватна выборочным данным (ни один из признаков не оказывает значимого влияния на y):
.
Для проверки гипотезы Н0 используется статистика
или
которая при справедливости Н0 имеет распределение Фишера – Снедекора с числом степеней свободы
Это означает, что можно указать такое число , что если гипотеза Н0 верна, то указанная статистика будет принимать значения меньше этого числа с заранее заданной, близкой к 1 вероятностью , и с вероятностью будет принимать значения больше . Следовательно, если наблюдаемое значение статистики окажется больше, чем , то либо произошел один из тех случаев, когда на самом деле Н0 верна и отвергая ее, мы ошибаемся, либо Н0 действительно неверна. Из описания ясно, что представляет собой квантиль уровня распределения Фишера-Снедекора с указанными степенями свободы, или, -ую критическую точку этого же распределения.
Из рисунка 1 видно:
R-квадрат 0,513441 Испр. R-квадрат 0,411008
F(4, 19) 5,012443 Р-значение (F) 0,006266
Наблюдаемое значение статистики F составило . Найдем критическое значение:
Рисунок 5 – Результат расчета критического значения распределения Фишера-Снедекора
Существует еще один вариант процедуры проверки статистической гипотезы, реализованной в большинстве статистических пакетов. Для наблюдаемого значения рассчитывается вероятность того, что статистика примет значение больше него (так называемый «достигаемый уровень значимости»), которая сравнивается с заданным уровнем значимости. Если рассчитанная вероятность окажется меньше, что нулевая гипотеза отвергается. Вернемся к рисунку 1:
R-квадрат 0,513441 Испр. R-квадрат 0,411008
F(4, 19) 5,012443 Р-значение (F) 0,006266
Достигаемый уровень значимости (p-значение) составил , что намного меньше , следовательно, Н0 отвергается, модель значима.
Поскольку нулевая гипотеза о незначимости уравнения регрессии была отвергнута, нужно проверить гипотезы о значимости коэффициентов уравнения регрессии.