- •4.1 Цели и задачи лабораторной работы
- •4.2 Понятие мультиколлениарности и гетероскедостичности, методы выявления и устранения
- •4.2.1 Мультиколлениарность, выявление и устранение
- •4.2.2 Гетероскедостичность, выявление и устранение
- •4.3 Рекомендуемая литература
- •4.4 Мультиколлениарность, выявление и устранение
- •4.4.1 Методы выявления мультиколлениарности
- •4.4.2 Устранение мультиколлениарности
- •4.5 Гетероскедостичность выявление и устранение
- •4.5.1 Графический анализ отклонений
- •4.5.2 Тест ранговой корреляции Спирмена
- •4.5.3 Тест Гольфельда-Квандта
- •4.5.4 Методы устранения гетероскедостичности
- •4.6 Анализ нормальности распределения случайного члена уравнения
- •4.7 Тесты для самоконтроля
- •4.8 Задание для самостоятельного выполнения
4.2.2 Гетероскедостичность, выявление и устранение
Одной из ключевых предпосылок МНК является условие постоянства дисперсий случайных отклонений (дисперсия случайных отклонений εi постоянная D(εi)=D(εj)=σ2 для любых наблюдений i и j). Выполнение данной предпосылки называется гомоскедостичностью. Не выполнимость данной предпосылки называется гетероскедостичностью.
При наличии гетероскедостичности все выводы, полученные на основе соответствующих t- и F-статистик, а также интервальные оценки будут ненадежными. Следовательно, статистические выводы, полученные при стандартных проверках качествах оценок, могут быть ошибочными и приводить к неверным заключениям по построенной модели.
В ряде случаев, значения характер данных, появление проблемы гетероскедостичности можно предвидеть и попытаться устранить этот недостаток еще на этапе спецификации.
В качестве наиболее популярных из имеющихся алгоритмов выявления гетероскедостичности можно назвать следующие:
графический анализ отклонений
тест ранговой корреляции Спирмена
тест Парка
тест Глейзера
тест Голдфреда-Квандта
Для борьбы с гетероскедостичностью используют обобщенный, доступный обобщенный или взвешенный метод наименьших квадратов.
4.3 Рекомендуемая литература
Для лучшего понимания материала изложенного в данной главе необходимо дополнительно проанализировать следующие источники литературы (см. список используемой литературы):
Мултиколлениарность |
Гетероскедостичность |
||
Номер в списке литературы |
Страницы |
Номер в списке литературы |
Страницы |
2.5 |
155-159 |
2.5 |
200-217 |
2.7 |
108-111 |
2.7 |
155-157 |
2.8 |
91-95 |
2.8 |
138-152 |
2.10 |
74-89 |
2.10 |
102-111 |
2.13 |
311 |
2.12 |
191-192 |
4.4 Мультиколлениарность, выявление и устранение
Используя данные, приведенные в приложении З, рассмотрим методы выявления и устранения мультиколлениарности
4.4.1 Методы выявления мультиколлениарности
На практике, для идентификации мультиколлениарности, наиболее часто прибегают к анализу матрицы парных коэффициентов корреляции. В паккете STATISTICA 6.0. данную процедуру можно реализовать двумя способами:
Первый способ:
Шаг 1. Выберем в главном меню Statistics Basic Statistics/Tables (Статистика Основные статистики и таблицы).
Шаг 2. В окне Basic Statistics and Tables выбреем пункт Correlation matrices (Корреляционная матрица) и нажмем кнопку ОК.
Шаг 3. В окне Moment and Partial Correlations выберем кнопку One variables list и выделим переменные для анализа Y, X1-X5, далее нажмем Summary (Итоги).
Таблица 4.1 – Матрица коэффициентов корреляции (первый способ)
|
Y |
X1 |
X2 |
X3 |
X4 |
X5 |
Y |
1,000 |
-0,194 |
0,737 |
-0,070 |
0,792 |
-0,165 |
X1 |
-0,194 |
1,000 |
-0,123 |
0,666 |
-0,154 |
0,566 |
X2 |
0,737 |
-0,123 |
1,000 |
-0,189 |
0,678 |
-0,264 |
X3 |
-0,070 |
0,666 |
-0,189 |
1,000 |
-0,152 |
0,313 |
X4 |
0,792 |
-0,154 |
0,678 |
-0,152 |
1,000 |
-0,160 |
X5 |
-0,165 |
0,566 |
-0,264 |
0,313 |
-0,160 |
1,000 |
Второй способ:
Шаг 1. В главном меню выберем Statistics Multiple Regression в окне Multiple Linear Regressions нажмем кнопку Variables (Зависимая переменная – Y, не зависимые – X1, X2, X3, X4, X5)
Шаг 2. Установим флажок напротив опции Review descriptive statistics, correlation matrix и нажмем кнопку ОК.
Шаг 3. В окне Review descriptive statistics (во вкладке Advanced) выберем кнопку Correlations (Корреляция).
Согласно данным, приведенным в таблице 4.2 (таблица 4.1), между переменными X2 и X4, а также X1 и X3, X5 наблюдается сильная взаимосвязь (0,678, 0,666 и 0,566 соответственно), что свидетельствует о наличии мультиколлениарности. В связи с этим при оценке модели с переменными X2 и X4 (оказывают сильное воздействие на Y) невозможно разделить влияние данных переменных на зависимую переменную, т.е. мы не можем одновременно включить переменную в модель.
Таблица 4.2 - Матрица коэффициентов корреляции (второй способ)
|
X1 |
X2 |
X3 |
X4 |
X5 |
Y |
X1 |
1,000 |
-0,123 |
0,666 |
-0,154 |
0,566 |
-0,194 |
X2 |
-0,123 |
1,000 |
-0,189 |
0,678 |
-0,264 |
0,737 |
X3 |
0,666 |
-0,189 |
1,000 |
-0,152 |
0,313 |
-0,070 |
X4 |
-0,154 |
0,678 |
-0,152 |
1,000 |
-0,160 |
0,792 |
X5 |
0,566 |
-0,264 |
0,313 |
-0,160 |
1,000 |
-0,165 |
Y |
-0,194 |
0,737 |
-0,070 |
0,792 |
-0,165 |
1,000 |
Еще одни распространенным способом выявления наличия мультиколлениарности является расчет показателей детерминации, для этого последовательно необходимо оценить пять уравнений регрессии.
В этом
случае зависимая переменная Y
исключается из рассмотрения, и уравнение
принимает вид -
Воспользуемся модулем Multiple Regression получим следующие результаты:
Таблица 4.3 - Показатели адекватности множественного уравнения регрессии влияния независимых переменных на фактор X1
|
Value |
Multiple R |
0,776 |
Multiple R? |
0,602 |
Adjusted R? |
0,549 |
F(4,30) |
11,329 |
p |
0,000 |
Std.Err. of Estimate |
1984,209 |
Согласно данным, приведенным в таблице 4.3, получаем значение коэффициента детерминации R2 X1 | X2, X3, X4, X5 равное 0,602.
Оценивая оставшиеся четыре регрессионных уравнения, получаем следующие результаты:
R2 X1 | X2, X3, X4, X5 = 0,602
R2 X2 | X1, X3, X4, X5 = 0,506
R2 X3 | X1, X2, X4, X5 = 0,469
R2 X4 | X1, X2, X3, X5 = 0,472
R2 X5 | X1, X2, X3, X4 = 0,380
Анализируя коэффициенты можно сделать вывод, что значимая связь наблюдается между всеми показателями (кроме X5) и остальными независимыми показателями, т.е. в очередной раз подтверждается наличие в имеющихся данных мультиколлениарности.
