- •Тема 1. Предмет и метод эконометрики история вопроса и задачи курса
- •Тема 2. Моделирование тенденции и сезонности одномерных временных рядов
- •Тема 3. Расчет оценок сезонной компоненты в аддитивной модели. Моделирование ряда
- •Тема 4. Выравнивание рядов динамики по мультипликативной модели
- •Тема 5. Парная линейная регрессия
- •Тема 6. Нелинейная регрессия
- •Тема 7. Коэффициент эластичности
- •Оценка надежности модели
- •Проверка гипотезы о линейности
- •Тема 8. Множественная регрессия
- •Тема 9. Мультиколлинеарность
- •Тема 10. Выбор формы уравнения регрессии
- •Тема 11. Оценка параметров уравнения множественной регрессии
- •Тема 12. Частные уравнения регрессии
- •Тема 13. Множественная корреляция
- •Тема 14. Фиктивные переменные во множественной регрессии
Тема 8. Множественная регрессия
1
Спецификация модели
Парная регрессия дает хороший результат, если выявлен один фактор, очень сильно влияющий на результат, а влиянием всех остальных факторов можно пренебречь.
Такие зависимости характерны для химических, физических и биологических исследований, когда существует возможность постановки эксперимента.
Поставить эксперимент – организовать среду, когда все остальные факторы, кроме одного, будут зафиксированы на одном уровне.
В экономике такие зависимости встречаются редко, и отсутствует возможность проведения эксперимента. Поэтому для экономики характерны многофакторные зависимости.
Спецификация модели заключается в решении двух вопросов:
1) отбор факторов из множества существующих у = f (х1, х2, …, хn)
у = f (xi, xi+1, …, xk), где k < n
2) выбор вида уравнения регрессии
2
Отбор факторов при построении уравнения множественной регрессии
Факторы должны удовлетворять условиям:
1. Они должны быть количественно измеримы.
Если факторы качественные, нужно придать им количественную оценку ( например, проранжировать, присвоить рейтинг, т.п.).
2. Факторы не должны быть взаимозависимыми (интеркоррелированными), т.е. факторы не должны быть в функциональной связи между собой.
Если факторы интеркоррелированны, то невозможно определить их индивидуальное влияние на результат. Т.о. параметры уравнения невозможно интерпретировать.
3. Факторы должны объяснять вариацию независимой переменной (результат), т.е. каждый следующий фактор, включенный в модель, должен увеличивать r2.
Т.е. при включении дополнительного фактора r2 должно возрастать существенно.
Существенно – если изменяется первый или второй знак после запятой.
R2n = 0,852
R2n+1 = 0,903 (нужно включить)
R2n+2 = 0,904 (несущественное изменение) (не нужно включать)
Если в модели есть «лишние» факторы, то модель может стать статистически не значимой.
Т.о. отбор факторов проводится в два этапа:
1) подбирают факторы исходя из существенности проблемы;
2) отбирают факторы по какому-нибудь алгоритму.
Тема 9. Мультиколлинеарность
Считают, что факторы коллинеарны, если rxixj ≥ 0,7, т.е факторы хi и xj тесно связаны между собой и находятся в линейной зависимости => хi и xj друг друга дублируют и один из них рекомендуется исключить из регрессии.
Оставляют в уравнении фактор, имеющий: 1) тесную связь с результатом;
2) наименьшую тесноту связи с другими факторами.
Для оценки мультиколлинеарности нужно построить матрицу парных линейных коэффициентов корреляции:
MS Excel: Сервис → Анализ данных → Корреляция → Выбор диапазона
В результате выходит таблица
|
у |
х1 |
х2 |
х3 |
у |
1 |
|
|
|
х1 |
0,8 |
1 |
|
|
х2 |
0,7 |
0,8 |
1 |
|
х3 |
0,6 |
0,5 |
0,2 |
1 |
Rx1x2 = 0,8 > 0,7 => х1 и x2 коллинеарны.
у = f (х2, х3) фактор х3 наиболее независим в данной системе, т.к. его линейные коэффициенты корреляции наименьшие (0,2).
Существуют случаи, когда нужно включить в модель факторы, имеющие сильную связь между собой, тогда используют следующие подходы для преодоления сильной межфакторной корреляции:
1. Исключение факторов;
2. Преобразование факторов, чтобы уменьшить корреляцию между ними:
А) переход к первым разностям
х1; х2; х3
х2 → х2 - х1; х3 → х3 – х2 и т.д.
Каждый уровень ряда заменяем на абсолютный прирост, соответствующий этому уровню. Используется в рядах динамики.
Б) метод главных компонент
Переход от исходных переменных к их линейным комбинациям.
3. Совмещенное уравнение регрессии
Отражает не только зависимость результата от фактора, но и совместное влияние факторов на результат.
у = f (х1, х2, х3)
ух = а+в1х1+в2х2+в3х3+в12х1∙х2+ в13х1∙х3+ в23х2∙х3+в123 х1∙х2∙х3
Ограничения для каждого параметра при х – нужно 6-7 измерений. Для данного уравнения нужно 42-49 измерений, что не всегда доступно.
4. Переход к уравнениям приведенной формы
Выражаем фактор из другого уравнения и подставляем в исходное уравнение.