
- •1. Спецификация модели
- •1.2. Отбор факторов
- •1.2. Выбор формы уравнения регрессии
- •II. Нелинейная регрессия.
- •2. Оценка параметров уравнения множественной регрессии
- •3. Частные уравнения регрессии
- •4. Множественная корреляция.
- •5.Частная корреляция.
- •6. Оценка надежности результатов множественной регрессии и корреляции.
- •7. Фиктивные переменные во множественной регрессии.
Тема № 3. Множественная регрессия и корреляция.
План:
спецификация модели
отбор факторов
выбор формы уравнения регрессии
оценка параметров уравнения множественной регрессии
частные уравнения регрессии
множественная корреляция
частная корреляция
оценка надёжности результатов множественной регрессии и корреляции
фиктивные переменные во множественной регрессии.
1. Спецификация модели
Множественная регрессия – один из распространённых методов в эконометрике. Она используется при решении проблем спроса, доходности акций, при изучении функций издержек производства в макроэкономических расчётах и т.д.
Главная цель множественной регрессии – построить модель с большим числом факторов, определив влияние каждого из них в отдельности и совокупное влияние на результирующий показатель.
Уравнение множественной регрессии – это уравнение вида y=f(xi)+E
Построение множественной регрессии начинается со спецификации модели. Она включает 2 вопроса:
отбор факторов;
выбор вида уравнения корреляции;
1.2. Отбор факторов
Отбор факторов осуществляется в 2 стадии. На первой стадии подбираются факторы, исходя из сущности проблемы. На второй – на основе матрицы показателей корреляции определяют t-критерий для параметров регрессии.
Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям:
они должны быть количественно измеримы (если необходимо включить качественный фактор, не имеющий количественного измерения, ему нужно придать количественную определённость)
факторы не должны быть коллинеарными (мультиколлинеарными) и не должны быть функционально зависимыми.
Факторы х1 и х2 являются коллинеарными (находятся в линейной зависимости), если Rx1x2>=0,7. Если факторы коллинеарные, то они дублируют друг друга и следовательно один из них следует исключить из регрессии. При этом предпочтение отдаётся не фактору более тесно связанному с результатом, а фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами.
По величине парных коэффициентов корреляции обнаруживается лишь явная коллинеарность факторов. Большие трудности возникают при наличии мультиколлинеарноси факторов: когда более чем 2 фактора связаны между собой множественной зависимостью, то есть существует совокупное воздействие факторов друг на друга.
Включение в модель мультиколлениарных факторов нежелательно, так как приводит к следующим последствиям:
затрудняется интерпретация параметров множественной регрессии (теряется эконометрический смысл);
оценки параметров не надёжны, так как содержат стандартные ошибки и меняются с изменением наблюдений.
Для оценки мультиколлинеарности используют определитель матрицы парных коэффициентов корреляции между факторами:
Пример: для уравнения регрессии с 3 неизвестными y=a+b1x1+b2x2+c3x3+E, матрица коэффициентов корреляции имеет вид:
Если факторы xi xj (i≠j) неколлинеарны, то есть rxixj=0, то Det|R|=1:
Если между факторами существует полная линейная зависимость, то есть парные коэффициенты корреляции между всеми парами факторов равны 1 rxixj=1, то Det|R|=0:
Итак, чем ближе к 0 определитель матрицы межфакторной корреляции, тем сильнее мультиколлениарность факторов и ненадёжней результаты множественной регрессии. Наоборот, чем ближе к 1 определитель, тем меньше мультиколлениарность факторов.
Через коэффициенты множественной детерминации можно найти переменные, ответственные за мультиколлениарность факторов. Для этого в качестве зависимой переменной рассматривается каждый из факторов и рассматриваются следующие коэффициенты детерминации:
R2x1|x2,x3… R2x2|x1,x3… R2x3|x1,x2…
Чем ближе значение коэффициента детерминации к 1, тем сильнее проявляется мультиколлениарность факторов. Сравнивая между собой коэффициенты множественной детерминации выделяют переменные, ответственные за мультиколлинеарность, оставляя факторы с минимальной величиной коэффициента множественной детерминации.
Отбор факторов, включаемых в регрессию – один из важнейших этапов использования регрессии. Подходы к отбору факторов на основе показателей корреляции могут быть разные:
метод исключения (отсев факторов из полного его набора);
метод включения (дополнительное введение фактора);
шаговый регрессионный анализ (исключение ранее введённого фактора).
Парные коэффициенты корреляции не в полной мере решат вопрос о включении факторов в модель. Эту роль выполняют частные коэффициенты корреляции (матрица частных коэффициентов корреляции). При отборе факторов следует пользоваться правилом: число включаемых факторов обычно в 6-7 раз меньше совокупности, на которой строится регрессия.