Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекция Эконометрик.doc
Скачиваний:
10
Добавлен:
21.11.2019
Размер:
736.77 Кб
Скачать

Лекция 7. Регрессионные модели с переменной структурой. Фиктивные переменные во множественной регрессии.

Цель лекции: ознакомить студентов с переменной структурой регрессионных моделей, с необходимостью введения фиктивных переменных в модель.

Регрессионные модели с переменной структурой.

Фиктивные переменные во множественной регрессии.

До сих пор рассматривали в качестве факторов экономические переменные, принимающие количественные значения в некотором интервале. Иногда возникает необходимость включения в модель фактора, имеющего два или более качественных уровней. Это могут быть разного рода атрибутивные признаки, такие, как профессия, пол, образование, климатические условия, принадлежность к региону. Чтобы ввести такие переменные в регрессионную модель, им должны быть присвоены те или иные цифровые метки, т.е. качественные переменные преобразованы в количественные.

Такого рода сконструированные переменные в эконометрике называют фиктивными переменными.

Рассмотрим применение фиктивных переменных для функции спроса. Пусть по группе лиц мужского и женского пола изучается линейная зависимость потребления кофе от цены. В общем виде уравнение регрессии имеет вид:

y=a+bx+ε,

где y – количество потребляемого кофе;

x – цена.

Аналогичные уравнения могут быть найдены отдельно для лиц мужского и женского пола:

Различия в потреблении кофе проявятся в различии средних и Вместе с тем сила влияния x на y может быть одинаковой, т.е. В этом случае возможно построение возможно построение общего уравнения регрессии с включением в него фактора "пол" в виде фиктивной переменной. Объединяя y1 и y2 и вводя фиктивные переменные, можно прийти к следующему выражению:

где Z1 и Z2 – фиктивные переменные, принимающие значения:

1

Z1 =

Z2 =

– мужской пол 0 – мужской пол

0 – женский пол 1 – женский пол .

В общем уравнении регрессии зависимая переменная y рассматривается не только как функция цены x, но и пола Z1 и Z2. Переменная Z рассматривается как дихотомическая переменная, принимающая всего два значения 1 и 0.

Для мужчин, когда Z1=1 и Z2=0, объединенное уравнение регрессии составит:

а для женщин, когда Z1=0 и Z2=1,

Параметр b является общим для всей совокупности лиц, различия в потреблении вызваны тем, что

При введении фиктивных переменных Z1 и Z2 в модель применение МНК для оценивания параметров a1 и a2 приведет к вырожденной матрице исходных данных и к невозможности получения их оценок. Это объясняется тем, что при использовании МНК в данном уравнении появляется свободный член, т.е. уравнение примет вид

Предполагая при параметре A независимую переменную, равную 1, имеем матрицу исходных данных:

.

В данной матрице есть линейная зависимость между 1, 2, и 3 столбцами, т.к. 1ст-ц=2ст-ц+3ст-ц. Поэтому матрица исходных факторов вырождена. Выходом является переход к уравнениям:

или

т.е. каждое уравнение включает только одну фиктивную переменную.

Предположим, что определено уравнение

где Z1=1 для мужчин и Z2=0 для женщин.

Теоретическое значение размера потребления кофе для мужчин будут получены из уравнения

Сопоставляя эти результаты, видим, что различия в уровне потребления для мужчин и женщин состоят в различии свободных членов: А для женщин и А+А1 для мужчин.

Лекция 8. Линейные регрессионные модели с гетероскедастичными и автокоррелированными остатками. Предпосылки метода наименьших квадратов (МНК). Гетероскедастичность, методы смягчения проблемы гетероскедастичности. Автокорреляция, методы устранения автокорреляции. Тест ранговой корреляции Спирмена, тест Парка, тест Голдферда-Квандта. Обобщенный метод наименьших квадратов (ОМНК).

Цель лекции: познакомить студентов с проблемами возникновения гетероскедастичности и автокорреляции остатков, с тестами ранговой корреляции и необходимостью применения ОМНК.

Линейные регрессионные модели с гетероскедастичными и автокоррелированными остатками.

Предпосылки метода наименьших квадратов.

При оценке параметров уравнения регрессии применяется МНК. При этом делаются определенные предпосылки относительно случайной составляющей ε.

В модели y=a+b1x1+b2x2+…+bnxn+ε случайная составляющая ε представляет ненаблюдаемую величину. После оценки параметров модели делают оценку остатков εi. При изменении спецификации модели, добавление в нее новых наблюдений выборочные оценки остатков εi могут меняться.

С помощью t-критерия, F-критерия и Z-преобразования делается формальная проверка статистической достоверности коэффициентов регрессии и корреляции в предложении, что остатки εi – независимые случайные величины и их среднее значение равно 0, они имеют постоянную (одинаковую) дисперсию и подчиняются нормальному закону распределения.

После построения уравнения регрессии проводится оценка остатков. Это связано с тем, что оценки параметров регрессии должны отвечать условиям несмещенности (математическое ожидание остатков равно нулю), состоятельности (увеличение точности с увеличением объема выборки), эффективности (с увеличением объема выборки дисперсия →0). Условия, необходимые для получения несмещенных, эффективных, состоятельных оценок, представляют собой предпосылки МНК.

Исследования остатков εi предполагают проверку наличия следующих пяти предпосылок МНК:

  1. Случайный характер остатков;

  2. нулевая средняя величина остатков, не зависящая от xi;

  3. гомоскедастичность – дисперсия каждого отклонения εi одинакова для всех x;

  4. отсутствие автокорреляции остатков. Значения остатков εi распределены независимо друг от друга;

  5. остатки подчиняются нормальному распределению.

Гетероскедастичность, методы смягчения проблемы

гетероскедастичности.

Автокорреляция, методы устранения автокорреляции.

  1. Д

    рис. 1

    ля проверки случайного характера остатков εi от теоретических значений результативного признака

Е

0

εi

сли на графике получена горизонтальная полоса (рис. 1), то остатки представляют собой случайные величины и МНК оправдан, теоретические значения хорошо аппроксимируют фактические значения y. Возможны следующие случаи: если εi зависит от , то

  • о

    0

    εi

    рис. 2

    статки εi не случайны (рис. 2)

  • о

    εi

    0

    рис. 3

    статки не имеют постоянной дисперсии (рис. 3)

  • остатки носят систематический характер (рис. 4)

0

εi

рис. 4

В случае рис. 1 дисперсии независимы от значений переменной, выполняются условия гомоскедастичности.

В случаях рис. 2-4 наблюдаются изменения в соотношениях между значениями переменной xi и квадратами отклонений – выполняются условия гетероскедастичности.

Графический анализ надежен в случае парной регрессии. При множественной регрессии графический анализ возможен для каждой из объясняющих переменных.

  1. Вторая предпосылка МНК относительно средней величины остатков означает, что .Это выполнимо для линейных моделей, нелинейных относительно включаемых переменных. Для моделей, нелинейных по оцениваемым параметрам и приводимых к линейному виду логарифмированием, средняя ошибка равна нулю для логарифмов исходных данных. Так, для модели вида

Для оценки гетероскедастичности используются: