Лекции эконометрика 1-8 / Лекция 7
.pdf
Совершенная мультиколлинеарность
Пример №4: Ловушка фиктивных переменных
Пусть Rurali (сельские школы), Suburbani (пригородные школы) и Urbani (городские школы) – три фиктивные переменные.
Тогда
Rurali +Suburbani+Urbani=1=X0i
Совершенная мультиколлинеарность
11
Несовершенная (неполная, частичная, нестрогая) мультиколлинеарность
Несовершенная мультиколлинеарность регрессоров – две или более объясняющие переменные (их линейные комбинации) сильно коррелированы между собой
-С математической точки зрения – проблемы нет, оценки МНК могут быть рассчитаны
-Оценки МНК (при выполнении предпосылок МНК) при коллинеарных переменных не смещены, но не являются эффективными
12
Несовершенная (неполная, частичная) мультиколлинеарность
Пример: процент иммигрантов в первом поколении
Переменная PctELi и процент иммигрантов в первом поколении сильно коррелированы
13
Мультиколлинеарность: причины
oОшибочное включение в уравнение регрессии двух или более линейно зависимых переменных;
oДве (или более) объясняющие переменные, слабо коррелированные в генеральной совокупности, но сильно коррелированные в конкретной выборке;
oВ модель включается объясняющая переменная, сильно коррелированная с зависимой переменной (такая переменная называется доминирующей).
14
Мультиколлинеарность
oМультиколлинеарность – не является редким явлением;
oВ модели множественной регрессии практически всегда присутствует мультиколлинеарность;
oРеагируем на мультиколлинеарность, если есть явные сильные признаки ее присутствия.
15
Мультиколлинеарность: механизм
Механизм: совместное действие факторов
-Оценка модели предполагает оценку вклада каждого фактора;
-Если регрессоры изменяются вместе, то разделить их вклады становится очень сложно;
-Чем сильнее связь между факторами, тем сложнее разделить это влияние.
16
Мультиколлинеарность: простой пример
Регрессия TestScore на STR и STR
Что такое коэффициент при STR?
Влияние единичного изменения STR на TestScore при постоянстве STR!
17
Последствия
мультиколлинеарности
-Оценки коэффициентов не являются смещенными;
-Стандартные ошибки оценок коэффициентов завышены;
-Соответствующие t-статистики занижены;
-Неустойчивость оценок: включение нового регрессора сильно меняет оценки коэффициентов;
-Трудности с интерпретацией коэффициентов при коррелированных коэффициентах;
-Общее качество уравнения, а также оценки переменных, не связанных мультиколлинеарностью, остаются незатронутыми;
-Чем сильнее мультиколлинеарность, тем больше последствия.
18
Последствия
мультиколлинеарности
Переоценка стандартных ошибок оценок коэффициентов: очень часто получается незначимый коэффициент или «неправильный» знак
Стандартная ситуация:
1.Оба коэффициента в теоретической модели положительны;
2.Коэффициенты парной корреляции между регрессорами и объясняемой переменной – положительны;
3.Коэффициент парной корреляции между объясняющими переменными положителен и больше, чем коэффициенты в пункте 2
У одного из коэффициентов, скорее, всего будет неправильный знак
19
Признаки мультиколлинеарности
1.(Частные) коэффициенты корреляции больше 0,7;
2.Определитель матрицы коэффициентов парной корреляции близок к нулю;
3.Оценки коэффициентов имеют большие стандартные ошибки (невысокую значимость), но модель в целом значима (имеет высокий коэффициент детерминации, F-статистика);
4.Введение в модель новой (коллинеарной) объясняющей переменной приводит к существенному изменению оценок коэффициентов (вплоть до смены знака) и небольшому изменению коэффициента
детерминации.
20
