- •Лекция №4. Модель множественной линейной регрессии
- •4.2. Теорема Гаусса-Маркова для модели множественной линейной регрессии
- •4.3. Дисперсии и стандартные ошибки оценок коэффициентов регрессии
- •4.4. Показатели качества модели множественной линейной регрессии
- •4.5. Анализ качества модели множественной линейной регрессии
- •4.6. Интервальные оценки для теоретических коэффициентов регрессии. Предсказание среднего и индивидуального (прогнозного) значений зависимой переменной
4.5. Анализ качества модели множественной линейной регрессии
Проверка качества модели множественной линейной регрессии включает:
проверку статистической значимости каждого из коэффициентов ,
;проверку общего качества (значимости) эмпирического уравнения регрессии.
Наиболее важной на начальном этапе
анализа построенной модели является
задача установления наличия линейной
связи между переменными
и
,
и
,
,
и
.
При этом для каждого коэффициента
,
(
)
выдвигается гипотеза
:
(или эмпирический коэффициент
статистически незначим);
при конкурирующей
:
(или эмпирический коэффициент
статистически значим).
Если верна гипотеза , то статистика
(4.15)
имеет распределение Стьюдента с числом
степеней свободы
.
По виду гипотезы
следует построить двустороннюю
критическую область, описываемую
неравенством
.
Далее вычисляют наблюдаемое значение
критерия
по формуле (4.15) и сравнивают величины
и
.
Если
(наблюдаемое значение статистики попало
в критическую область), то принимается
гипотеза
.
Это означает, что коэффициент
можно считать статистически значимым.
Если же
(наблюдаемое значение статистики попало
в область принятия гипотезы), то
принимается основная гипотеза, и
коэффициент регрессии
можно считать статистически незначимым.
Аналогично проверяется статистическая
значимость свободного члена
.
Если эмпирический коэффициент регрессии
оказался статистически незначимым, то
можно считать, что переменная
не связана линейно с переменной
.
В этом случае следует исключить из
уравнения (4.1) переменную
.
Свободный член
можно оставить в модели, даже если его
значимость невысока, поскольку он
позволяет уточнить вид зависимости и
учесть влияние внешней среды.
После проверки статистической значимости каждого из коэффициентов следует проанализировать совокупную значимость коэффициентов регрессии. Для этого выдвигается основная гипотеза об одновременном равенстве нулю всех теоретических коэффициентов регрессии при объясняющих переменных, т. е.
:
(или эмпирическое уравнение регрессии
незначимо);
при конкурирующей
: хотя бы один из коэффициентов отличен от нуля (или эмпирическое уравнение регрессии значимо).
Для проверки используется статистика
, (4.16)
которая имеет распределение Фишера-Снедекора
с
и
степенями свободы. Здесь необходимые
суммы квадратов
и
вычисляются по формулам (4.10), (4.11).
Далее рассматривается правосторонняя
критическая область, описываемая
неравенством:
,
и проверка
осуществляется по стандартной схеме.
Если
,
то гипотеза
принимается, т.е. совокупное влияние
всех объясняющих переменных
на
можно считать статистически несущественным,
уравнение регрессии незначимым, а его
общее качество невысоким. Если же
,
то гипотеза
отвергается в пользу
,
уравнение регрессии значимо, т.е. его
общее качество можно считать статистически
высоким.
Замечание. Если существует
сильная корреляция между объясняющими
переменными, то
-тест
для каждой переменной может оказаться
незначимым, в то время как
-тест
для модели в целом – значимым.
-тест можно использовать и для определения значимости совместного вклада группы переменных в объясняющую способность модели.
Предположим, что первоначальная модель
содержала
объясняющих переменных, и ее остаточная
сумма квадратов составляла
.
Далее в модель были включены еще несколько
объясняющих переменных, так что их общее
количество возросло до
,
а остаточная сумма квадратов уменьшилась
до
.
Возникает вопрос: можно ли считать, что
добавление в модель
переменных привело к значительному
улучшению качества модели? Нулевая
гипотеза дает отрицательный ответ на
этот вопрос, а конкурирующая –
положительный. Соответствующая
-
статистика имеет вид:
.
(4.17)
Она имеет распределение Фишера-Снедекора
с
и
степенями свободы.
