Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Эконометрика шпорки .docx
Скачиваний:
8
Добавлен:
25.09.2019
Размер:
306.87 Кб
Скачать

Мультиколлинеарность

В случаи множественной регрессии , коэффициент корреляции показывает на сколько в среднем изменится результат при изменении соответствующего фактора и неизменных закрепленных на среднем уровне значениях основных факторов.

Для того чтобы можно было определить влияние каждого конкретного фактора на результат исключив всех прочих факторов необходимо чтобы эти факторы были между собой независимы. В том случаи если между факторами существует линейная связь в этом случаи построение уравнения невозможно без исключения какого либо фактора. такая ситуация имеет название полной коллинеарности. Если между факторами существует корреляциооная связь, то имеет место мультиколлинеарность.

Мультиколлинеарность может возникать в силу разных причин. Например, несколько независимых переменных могут иметь общий временной тренд, относительно которого они совершают малые колебания.

Включение в модель мультиколлинеарных факторов нежелательно в силу следующих последствий:

  • Затрудняется интерпретация параметров множественной регрессии как характеристик действия факторов в «чистом» виде, ибо факторы коррелированны; параметры линейной регрессии теряют смысл:

  • Оценки параметров ненадежны, обнаруживают большие стандартные ошибки и меняются с изменением объема наблюдений (не только по величине, но и по знаку), что делает модель непригодной для анализа и прогнозирования.

Выделим некоторые наиболее характерные признаки мультиколлинеарности.

1. Небольшое изменение исходных данных (например, добавление новых наблюдений) приводит к существенному изменению оценок коэффициентов модели.

2. Оценки имеют большие стандартные ошибки, малую значимость, в то время как модель в целом является значимой (высокое значение коэффициента детерминации R2 и соответствующей F-статистики).

3. Оценки коэффициентов имеют неправильные с точки зрения теории знаки или неоправданно большие значения.

27. Фиктивные переменные

Некоторые переменные могут принимать всего два значения или, в более общей ситуации, дискретное множество значений. Необходимость рассматривать такие переменные возникает довольно часто в тех случаях, когда требуется принимать во внимание какой-либо качественный признак. Например, при исследовании зависимости зарплаты от различных факторов может возникнуть вопрос: влияет ли на ее размер, и если да, то в какой степени, наличие у работника высшего образования? Существует ли дискриминация в оплате труда между мужчинами и женщинами? Введение дискретных переменных позволяет оценивать одно уравнение сразу по всем категориям.

Покажем, как это можно сделать в примере с зарплатой.

Пусть xt = (xt1, . . . , xtk)' – набор объясняющих (независимых) переменных, т. е. первоначальная модель описывается уравнениями

yt = xt1b1 +...+xtkbk+ εt, t =1,..., n, (11.1)

где yt размер зарплаты t-го работника. Теперь мы хотим включить в рассмотрение такой фактор, как наличие или отсутствие высшего образования. Введем новую, фиктивную, переменную d, полагая dt = 1, если в t-м наблюдении индивидуум имеет высшее образование, и dt = 0 в противном случае, и рассмотрим новую систему:

yt = xt1b1 +...+xtkbk+ dt+ εt=z' t + εt , t =1,...,n, (11.2) где z = (x1,..., xk, d)' = (x',d)',  = (bl, .., bk, )'.

Иными словами, принимая модель (11.2), мы считаем, что средняя зарплата есть х'b при отсутствии высшего образования и х'b + – при его наличии. Таким образом, величина  интерпретируется как среднее изменение зарплаты при переходе из одной категории (без высшего образования) в другую (с высшим образованием) при неизменных значениях остальных параметров.

Выводы:

1) для исследования влияния качественных признаков в модель можно вводить фиктивные переменные;

2) способ включения фиктивных переменных зависит от априорной информации относительно влияния соответствующих качественных признаков на зависимую переменную и от гипотез, которые проверяются с помощью модели;

3) от способа включения фиктивной переменной зависит и интерпретация оценки коэффициента при ней.