- •Оценки линейного уравнения множественной регрессии
- •Оценка коэффициентов классической линейной модели множественной регрессии
- •Анализ вариации результативного признака y. Выборочный коэффициент детерминации
- •Проверка гипотезы о нормальном характере распределения регрессионных остатков
- •Проверка значимости уравнения регрессии и значимости коэффициентов
- •Проверка гипотез о значимости коэффициента лммр
- •Построение доверительных интервалов для значимых коэффициентов клмнр
- •Мультиколлинеарность
- •Анализ внешних признаков мультиколлинеарности
- •1. Неправильные с экономической точки зрения знаки отдельных коэффициентов регрессии
- •2. Достаточно высокие значение множественного коэффициента корреляции (детерминации) одной из объясняющих переменных на другие
- •Анализ формальных признаков мультиколлинеарности
- •Метод пошаговой регрессии с включением переменных
- •Метод пошаговой регрессии с исключением переменных
- •Метод ридж-регрессии
- •Приложение 1
- •Приложение 2
Анализ вариации результативного признака y. Выборочный коэффициент детерминации
В качестве характеристики степени рассеивания случайной величины Y относительно функции регрессии используется в случае нелинейной связи корреляционное отношение

которое
характеризует качество подгонки
функции регрессии под выборочные
данные. В случае линейной регрессии
,
называется коэффициентом детерминации
.
Определим выборочную вариацию
результативной переменной Y.
,
где
– выборочное среднее,
,


где
,

Следовательно, оценка коэффициента детерминации (квадрата множественного коэффициента корреляции)

Выборочный
коэффициент детерминации характеризует
долю общей вариации результативного
признака у, объясняемую вариацией
выборочной функции регрессии
.
Рассчитав с помощью STATISTICA (рис.3),получим:


Рисунок 3 – оценка коэффициента детерминации в пакете STATISTICA
Из полученных результатов можно сделать следующие выводы:
- связь между ожидаемой продолжительностью жизни мужчин и рождаемостью населения, смертностью населения, браков на 1000 населения, разводов на 1000 населения, соотношением средней оплаты труда с учетом выплат социального характера и прожиточного минимума трудоспособного населения (%) - сильная
- доля вариации ожидаемой продолжительности жизни мужчин, обусловленная изменениями рождаемости населения, смертности населения, браков на 1000 населения, разводов на 1000 населения, соотношения средней оплаты труда с учетом выплат социального характера и прожиточного минимума трудоспособного населения (%) составляет 74,94%, т.е. на 25,06% зависит от неучтенных факторов.
Проверка гипотезы о нормальном характере распределения регрессионных остатков
Дальнейшее изучение свойств оценок КЛММР проводится при дополнительном предположении и нормальном характере распределения регрессионных остатков:


Это предположение необходимо проверить.
Выдвинем гипотезы:
Гипотеза H0: Распределение регрессионных остатков не отличается от нормального.
Гипотеза H1: Распределение регрессионных остатков отличается от нормального.
Построим график регрессионных остатков
и посмотрим значение
критерия, степени свободы, значимость
нулевой гипотезы.

Рисунок 4 – проверка на нормальное распределение регрессионных остатков
На уровне значимости 0,05 можно принять нулевую гипотезу о том, что распределение регрессионных остатков не отличаются от нормального, так как значимость нулевой гипотезы (P=0,17) больше, чем заданный. Так как регрессионные остатки имеют нормальное распределение, то есть смысл проводить дальнейший анализ построенного уравнения множественной регрессии.
Проверка значимости уравнения регрессии и значимости коэффициентов
Для проверки значимости построенного уравнения регрессии выдвигается гипотеза Н0: линейная модель множественной регрессии не значима, что формально можно сформулировать так
Н0: β1=β2=…=βк=0
Альтернативная гипотеза Н1: ЛММР значима или формально
.
Для проверки гипотезы Н0 используем статистику:

которая в
случае справедливости Н0 имеет
распределение Фишера – Снедекорра с
числом степеней свободы

Проверим гипотезу о не значимости ЛММР:

Альтернативная гипотеза Н1:

По итогам проверки в пакете STATISTICA (см. рис. 3) получили, что уровень значимости р<0,05. Таким образом, построенная ЛММР значима. Теперь проверим значимость коэффициентов ЛММР.
