- •Оценки линейного уравнения множественной регрессии
- •Оценка коэффициентов классической линейной модели множественной регрессии
- •Анализ вариации результативного признака y. Выборочный коэффициент детерминации
- •Проверка гипотезы о нормальном характере распределения регрессионных остатков
- •Проверка значимости уравнения регрессии и значимости коэффициентов
- •Проверка гипотез о значимости коэффициента лммр
- •Построение доверительных интервалов для значимых коэффициентов клмнр
- •Мультиколлинеарность
- •Анализ внешних признаков мультиколлинеарности
- •1. Неправильные с экономической точки зрения знаки отдельных коэффициентов регрессии
- •2. Достаточно высокие значение множественного коэффициента корреляции (детерминации) одной из объясняющих переменных на другие
- •Анализ формальных признаков мультиколлинеарности
- •Метод пошаговой регрессии с включением переменных
- •Метод пошаговой регрессии с исключением переменных
- •Метод ридж-регрессии
- •Приложение 1
- •Приложение 2
Анализ вариации результативного признака y. Выборочный коэффициент детерминации
В качестве характеристики степени рассеивания случайной величины Y относительно функции регрессии используется в случае нелинейной связи корреляционное отношение
которое характеризует качество подгонки функции регрессии под выборочные данные. В случае линейной регрессии , называется коэффициентом детерминации. Определим выборочную вариацию результативной переменной Y.
,
где – выборочное среднее, ,
где ,
Следовательно, оценка коэффициента детерминации (квадрата множественного коэффициента корреляции)
Выборочный коэффициент детерминации характеризует долю общей вариации результативного признака у, объясняемую вариацией выборочной функции регрессии .
Рассчитав с помощью STATISTICA (рис.3),получим:
Рисунок 3 – оценка коэффициента детерминации в пакете STATISTICA
Из полученных результатов можно сделать следующие выводы:
- связь между ожидаемой продолжительностью жизни мужчин и рождаемостью населения, смертностью населения, браков на 1000 населения, разводов на 1000 населения, соотношением средней оплаты труда с учетом выплат социального характера и прожиточного минимума трудоспособного населения (%) - сильная
- доля вариации ожидаемой продолжительности жизни мужчин, обусловленная изменениями рождаемости населения, смертности населения, браков на 1000 населения, разводов на 1000 населения, соотношения средней оплаты труда с учетом выплат социального характера и прожиточного минимума трудоспособного населения (%) составляет 74,94%, т.е. на 25,06% зависит от неучтенных факторов.
Проверка гипотезы о нормальном характере распределения регрессионных остатков
Дальнейшее изучение свойств оценок КЛММР проводится при дополнительном предположении и нормальном характере распределения регрессионных остатков:
Это предположение необходимо проверить.
Выдвинем гипотезы:
Гипотеза H0: Распределение регрессионных остатков не отличается от нормального.
Гипотеза H1: Распределение регрессионных остатков отличается от нормального.
Построим график регрессионных остатков и посмотрим значение критерия, степени свободы, значимость нулевой гипотезы.
Рисунок 4 – проверка на нормальное распределение регрессионных остатков
На уровне значимости 0,05 можно принять нулевую гипотезу о том, что распределение регрессионных остатков не отличаются от нормального, так как значимость нулевой гипотезы (P=0,17) больше, чем заданный. Так как регрессионные остатки имеют нормальное распределение, то есть смысл проводить дальнейший анализ построенного уравнения множественной регрессии.
Проверка значимости уравнения регрессии и значимости коэффициентов
Для проверки значимости построенного уравнения регрессии выдвигается гипотеза Н0: линейная модель множественной регрессии не значима, что формально можно сформулировать так
Н0: β1=β2=…=βк=0
Альтернативная гипотеза Н1: ЛММР значима или формально
.
Для проверки гипотезы Н0 используем статистику:
которая в случае справедливости Н0 имеет распределение Фишера – Снедекорра с числом степеней свободы
Проверим гипотезу о не значимости ЛММР:
Альтернативная гипотеза Н1:
По итогам проверки в пакете STATISTICA (см. рис. 3) получили, что уровень значимости р<0,05. Таким образом, построенная ЛММР значима. Теперь проверим значимость коэффициентов ЛММР.