
21. Оценка надежности результатов множественной регрессии и корреляции. Частный f-критерий
Значимость уравнения множественной регрессии в целом, также как и в парной регрессии, оценивается с помощью F-критерия Фишера:
где D факт - факторная сумма квадратов на одну степень свободы;
D ост - остаточная сумма квадратов на одну степень свободы;
R2 -индекс множественной детерминации;
m -число параметров при переменных х
п - число наблюдений.
Оценивается значимость не только уравнения в целом, но и фактора, дополнительно включенного в регрессионную модель. Необходимость такой оценки связана с тем, что не каждый фактор, вошедший в модель, может существенно увеличивать долю объясненной вариации результативного признака. Кроме того, при наличии в модели нескольких факторов они могут вводиться в модель в разной последовательности. Ввиду корреляции между факторами значимость одного и того же фактора может быть разной в зависимости от последовательности его введения в модель. Мерой для оценки включения фактора в модель служит частный F-критерий.
Частный F-критерий построен на сравнении прироста факторной дисперсии, обусловленного влиянием дополнительно включенного фактора, с остаточной дисперсией на одну степень свободы по регрессионной модели в целом. Если оцениваем значимость влияния фактора xi как дополнительно включенного в модель фактора, то используем следующую формулу:
где
-
коэффициент
множественной детерминации для модели
с полным набором факторов;
- тот
же показатель, но без включения в модель
фактора xi;
п
-
число наблюдений; т
- число
параметров в модели (без свободного
члена).
В числителе формулы показан прирост доли объясненной вариации у за счет дополнительного включения в модель соответствующего фактора xi .
В
знаменателе доля остаточной вариации
по регрессионной модели, включающей
полный набор факторов. Если числитель
и знаменатель Fx
умножить
на
или,
что то же самое, на nσ2y,
то получим соотношение прироста
факторной (объясненной) суммы квадратов
отклонений к остаточной сумме квадратов.
Чтобы получить величину F-критерия,
необходимо эти суммы квадратов отклонений
разделить на соответствующее число
степеней свободы. Т.к. прирост факторной
суммы квадратов отклонений обусловлен
дополнительным включением в модель
одного исследуемого фактора х
i,
то число степеней свободы для него равно
1. Для остаточной суммы квадратов
отклонений по регрессионной модели
число степеней свободы, как уже было
рассмотрено ранее, равно: п
- т - 1. Соотношение
числа степеней свободы приведено в
формуле частного F-критерия
в виде дроби: (n
- m - 1)/1.
Фактическое значение частного F-критерия сравнивается с табличным при заданном уровне значимости и числе степеней свободы: 1 и п - т - 1. Если фактическое значение Fx превышает Fкрит то дополнительное включение фактора хi в модель статистически оправданно и коэффициент чистой регрессии bi , при факторе хi статистически значим. Если же фактическое значение Fx меньше табличного, то дополнительное включение в модель фактора хi не увеличивает существенно долю объясненной вариации признака у, следовательно, нецелесообразно его включение в модель; коэффициент регрессии при данном факторе в этом случае статистически незначим.
С помощью частного F-критерия можно проверить значимость всех коэффициентов регрессии в предположении, что каждый соответствующий фактор хi вводился в уравнение множественной регрессии последним.
Оценка
значимости коэффициентов чистой
регрессии по t-критерию
Стью-дента может быть проведена и без
расчета частных F-критериев.
В этом случае, как и в парной регрессии,
для каждого фактора используется формула
где
bi
- коэффициент
чистой регрессии при факторе хi
;
Sbi - средняя квадратическая ошибка коэффициента регрессии bi
Для уравнения множественной регрессии
средняя квадратическая ошибка коэффициента регрессии может быть определена по следующей формуле:
Где
-коэффициент
детерминации для зависимости фактора
xi
со всеми
другими факторами уравнения множественной регрессии.
Чтобы
воспользоваться данной формулой,
необходимы матрица межфакторной
корреляции и расчет по ней соответствующих
коэффициентов детерминации
.
Так
для уравнения
Для
оценки значимости коэффициентов
регрессии b1,
b2,
b3
необходим
расчет 3 межфакторных коэффициентов
детерминации
,
,
.
Если
учесть, что
,то можно убедиться, что