Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лекции по эконометрике.doc
Скачиваний:
271
Добавлен:
22.02.2015
Размер:
820.74 Кб
Скачать

7. Ошибки спецификации

Построение экономической модели включает в себя спецификацию ее соотношений, выбор переменных, входящих в соотношение, определение математической функции, входящей в каждое соотношение. В данном пункте мы рассмотрим второй элемент.

Если точно известно, какая переменная должна быть включена в уравнение, то наша задача состоит в определении коэффициентов, построении доверительных интервалов, проверке различных гипотез. На практике мы никогда не можем быть уверены, что уравнение специфицировано правильно. Что случится, если мы включим в уравнение переменные, которых там быть не должно, и что случится, если мы не включим в уравнение переменные, которые там должны присутствовать. Свойства оценок коэффициентов в значительной степени зависят от правильности спецификации модели.

Ошибки спецификации бывают двух видов:

  1. невключение в уравнение существенной объясняющей переменной;

  2. включение в уравнение переменной, которая не должна там присутствовать.

3) неправильный выбор формы зависимости между переменными, мы предположили, что модель линейная, а она может быть более сложной.

1. Влияние отсутствия в уравнении переменной, которая должна быть включена.

Рассмотрим ситуацию для случая двух переменных.

Истинная модель выглядит следующим образом: . Но мы не уверены в значимостиZ, поэтому оцениваем «короткую» модель:. По методу наименьших квадратов вычисляем:

- несмещенная оценка , еслиM=. Посчитаем, чему равноM:

Таким образом, получаем в числителе:

Итак, .

Таким образом, мы получили смещенную оценку. Оценка будет несмещенной в двух случаях:

  1. ;

  2. XиZстатистически независимы.

Наша оценка будет завышать или занижать истинное значение коэффициента в зависимости от знака смещения.

Интуитивное объяснение.

Предположим, что иположительны, аXиZположительно коррелированны, тогда с увеличениемX

  1. Yбудет иметь тенденцию к росту, посколькуположителен;

  2. Zбудет иметь тенденцию к увеличению, посколькуXиZположительно коррелированны;

  3. Yполучит дополнительное ускорение из-за увеличенияZ, посколькуположительно.

Другими словами, изменение Yбудет преувеличивать влияние текущих значенийX, т. к. отчасти они будут связаны с изменениямиZ. Т.е. часть измененияYза счет измененияZбудет приписаноX.

Однако смещение оценок коэффициентов здесь – не единственная неприятность. Что будет с оценками дисперсий?

- в короткой регрессии (без доказательства).

- в длинной регрессии (без доказательства).

Таким образом, , т. е.- смещенная оценка, но обладает меньшей дисперсией.

Что будет с оценкой - ? Оказывается, что в случае, если мы не включаем в регрессию существенную переменную, эта оценка будет смещенной. Поскольку участвует во многих статистических тестах, то используя их для проверки гипотез, мы можем получить ложные выводы.

Итак, в случае невключения объясняющих переменных, МНК-оценка короткой регрессии смещена, и обладает меньшей дисперсией, чем у оценки в длинной регрессии. Оценка дисперсии ошибки имеет неотрицательное смещение.

2. Включение несущественных переменных.

Теперь у нас ситуация противоположная предыдущей. Истинная модель выглядит следующим образом: , а мы оцениваем «длинную» регрессию. Таким образом, включая в уравнение несущественную переменную, мы не учитываем информацию о том, что коэффициент приZравен нулю. Следует всегда ожидать, что неучитывание всей информации о модели потере эффективности оценок. Т. е. в нашем случае дисперсия оценки в «длинной» регрессии будет больше, чем дисперсия оценки коэффициента приХв истинной модели, поскольку мы вынуждены по тем же самым наблюдениям оценивать два параметра вместо одного. Тем не менее, оценки «длинной» регрессии останутся несмещенными.

Потеря эффективности не случится, если переменные ХиZнекоррелированны. Потеря эффективности приводит к тому, что мы с большей трудностью отвергаем гипотезу о незначимости коэффициента, тем не менее оценка дисперсииостанется несмещенной.

Выводы здесь мы приводить не будем. и - несмещенные оценки, но ее дисперсия больше, чем в правильной модели, т. е. точность оценки ухудшается.

Рисунок с графиками плотностей распределения.

3. Неправильный выбор функциональной зависимости.

Еще одна ошибка спецификации происходит, когда исследователь решает оценить линейную модель, в то время как истинная регрессионная модель нелинейная. Пример: , а оцениваем мы модель. Приведенная выше ситуация является частным случаем ситуации с пропущенными переменными. Выбор линейной модели, в то время как истинная модель нелинейная может привести к смещенности и несостоятельности оценок регрессии. Поэтому исследователи часто используют полиномиальную регрессию как тест на нелинейность в объясняющих переменных.

Итак, мы с вами рассмотрели теоретические аспекты включения лишних или невключения нужных переменных в уравнение. Что же делать на практике, когда мы никогда точно не знаем, какие переменные входят в модель, а какие нет. В таких ситуациях используют различные эвристические процедуры отбора регрессоров.