
- •13.Фиктивные переменные.
- •14.Гетероскедастичность.
- •15.Обобщенный метод наименьших квадратов.
- •16.Временные ряды.
- •17.Вычисление сезонной компоненты.
- •18.Вычисление тренда.
- •19.Выделение сезонной компоненты и тренда с помощью фиктивных переменных.
- •20.Автокорреляция в остатках. Модель Дарбина – Уотсона
- •21.Системы эконометрических уравнений.
- •22.Косвенный метод наименьших квадратов.
- •23.Двухшаговый метод наименьших квадратов.
13.Фиктивные переменные.
В некоторых задачах по эконометрике, может оказаться нужным включать в модель фактор, имеющий два или более качественных уровней. Это могут быть, например, разного рода атрибутивные признаки: профессия, образование, пол, климатические условия, проживание в определенном регионе.
Пример с фиктивными переменными
Чтобы использовать эти переменные в регрессионной модели, им должны быть присвоены цифровые метки, т. е. качественные переменные преобразованы в количественные. Такого вида сформированные переменные в эконометрике называют фиктивными переменными. В российской литературе по дисциплине эконометрика можно встретить термин «структурные переменные».
Рассмотрим использование фиктивных переменных для функции спроса. Предположим, что по группе лиц мужского и женского пола изучается линейная зависимость потребления кофе от цены. В общем виде для всех исследуемых данных уравнение регрессии имеет вид:
где у - количество потребляемого кофе; х — цена кофе.
Аналогичные уравнения находятся отдельно для лиц мужского пола:
и женского пола:
Разница в потреблении кофе проявятся в различии средних y1 и y2 . Вместе с тем сила влияния х на у может быть одинаковой. В этом случае можно построить общее уравнения регрессии с включением в него фактора «пол» в виде фиктивной переменной. Объединяя уравнения y1 и y2 и вводя фиктивные переменные, можно прийти к следующему выражению:
где z1 и z2 - фиктивные переменные, принимают значения: z1 = 1 – мужской пол, 0 – женский пол. z2 = 0 – мужской пол, 1 – женский пол.
В общем уравнении регрессии переменная у рассматривается как функция не только цены х, но также и пола (z1, z2). Переменная z рассматривается как дихотомическая переменная, которая принимает всего два значения: 1 и 0. При этом когда z1 = 1, то z2 = 0 и наоборот.
Для лиц мужского пола, когда z1 = 1 и z2 = 0, объединенное уравнение регрессии составит:
Для лиц женского пола, когда z1 = 0 и z2 = 1
Различия в потреблении для лиц мужского и женского пола обусловлены различиями свободных членов уравнения регрессии а. Параметр b является общим для всех лиц, как для мужчин, так и для женщин.
Следует иметь в виду, что при введении фиктивных переменных z1 и z2 в регрессионную модель применение МНК для оценивания параметров a1 и a2 в контрольные по эконометрике приведет к вырожденной матрице исходных данных, а значит к невозможности получения их оценок. Объясняется это тем, что при использовании МНК в таком уравнении появляется свободный член, т.е. уравнение принимает вид
Теоретические значения размера потребления кофе для мужского пола будут получены из уравнения
Для женского пола соответствующие значения получим из уравнения
Сравнивая эти результаты, видно, что различия в уровне потребления мужчин и женщин состоят в различии свободных членов данных уравнений: А - для женщин и А + А1 - для мужчин.
14.Гетероскедастичность.
Наличие гетероскедастичности в регрессионной модели может привести к негативным последствиям:
оценки уравнения нормальной линейной регрессии остаются несмещенными и состоятельными, но при этом теряется эффективность;
появляется большая вероятность того, что оценки стандартных ошибок коэффициентов регрессионной модели будут рассчитаны неверно, что в конечном счете может привести к утверждению неверной гипотезы о значимости регрессионных коэффициентов и значимости уравнения регрессии в целом.
Для устранения автокорреляции применяют взвешенный метод наименьших квадратов, который является частным случаем обобщенного метода наименьших квадратов.
Последствия гетероскедастичности
При гетероскедастичности последствия применения МНК будут следующими:
Оценки коэффициентов по-прежнему останутся несмещенными и линейными.
Оценки не будут эффективными (не будут иметь наименьшую дисперсию по сравнению с другими оценками такого же параметра). При увеличении дисперсии оценок снижается вероятность получения максимально точных оценок.
Дисперсии оценок будут рассчитываться со смещением.
Вследствие того, что было сказано выше, все выводы, получаемые на основе соответствующих t- и F-статистик (критериев Стьюедента и Фишера), а также интервальные оценки будут ненадежными. Значит, статистические выводы, которые получаются при стандартных проверках качества оценок, могут быть ошибочными и приводить к неверным выводам по построенной модели. Вполне вероятно, что стандартные ошибки коэффициентов будут занижены, следовательно, t-статистики будут завышены. Это может приводить к признанию статистически значимыми коэффициентов, таковыми на самом деле не являющихся.
Обнаружение гетероскедастичности
В ряде случаев, зная характер данных, появление проблемы гетероскедастичности можно предвидеть и попытаться устранить этот недостаток еще на этапе спецификации. Однако значительно чаще проблему приходится решать после построения уравнения регрессии. Для определения гетероскедастичности разработано довольно большое число тестов и критериев для них.
Тест Спирмена
При использовании теста Спирмена предполагается, что дисперсия отклонения будет или увеличиваться, или уменьшаться с увеличением значений X. Поэтому для регрессии, построенной по методу наименьших квадратах, абсолютные величины отклонений ei и значения xi объясняющей переменной X будут коррелированы. Значения xi и ei ранжируются (упорядочиваются по величинам). Затем определяется коэффициент ранговой корреляции:
где di — разность между рангами xi и |ei|, i = 1,..., n ; 6 — число шесть (иногда думают, что это стандартное оклонение).
Тест Парка
Тест Глейзера
Тест Глейзера по своей сути аналогичен тесту Парка и дополняет его анализом других (возможно, более подходящих) зависимостей между дисперсиями отклонений σi и значениями переменной xi. По данному методу оценивается регрессионная зависимость модулей отклонений |ei| (тесно связанных с σ2 от xi. При этом рассматриваемая зависимость моделируется следующим уравнением регрессии:
Изменяя значения k, можно построить различные регрессии. Обычно k =..., -1; -0,5; 0,5; 1,... Статистическая значимость коэффициента β в каждом конкретном случае фактически означает наличие гетероскедастичности. Если для нескольких регрессий коэффициент β оказывается статистически значимым, то при определении характера зависимости обычно ориентируются на лучшую из них.
Тест Голдфелда-Квандта