Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Эконометрика.-6

.pdf
Скачиваний:
2
Добавлен:
05.02.2023
Размер:
1.86 Mб
Скачать

Контрольные вопросы по главе 4

81

 

8. Какой переход к новым переменным обеспечит линеаризацию гиперболи-

ческой зависимости вида f x, Θ x Θ0x Θ1 , x

Θ1 Θ0?

9.В каких ситуациях используются функции гиперболической зависимости?

10.Как должны формироваться матрицы X и Y, используемые в формулах МНК, при переходе к новым переменным гиперболической зависимости?

11.Что представляют собой графики показательной зависимости для случаев

 

Θ1

1 и Θ1 1?

 

 

 

 

 

 

12.

Какой переход к новой переменной позволяет свести показательную зави-

 

симость f x, Θ Θ0eΘ1x к линейному виду (случаи Θ1

0 и Θ1

0)?

13.

С помощью каких преобразований переменных осуществляется линеари-

 

зация зависимости f x, Θ

Θ0eΘ1x (случаи Θ1

0 и Θ1

0)?

 

14.

Как определяются матрицы X и Y , используемые в формулах МНК, для

 

случая зависимости f x, Θ

Θ0eΘ1x?

 

 

 

15.

Какой вид имеет график логистической кривой вида f x, Θ

1

Θ0 Θ1e x ,

 

Θ1

0?

 

 

 

 

 

 

16.

С помощью каких преобразований переменных осуществляется линеари-

 

зация зависимости f x, Θ

1

Θ0

Θ1e x , Θ1

0 (Θ1

0)?

 

17.

Как определяются матрицы X и Y , используемые в формулах МНК, для

 

случая зависимости f x, Θ

1

Θ0

Θ1e x , Θ1

0?

 

 

18.

Где используются логистические кривые?

 

 

 

19.

Какой вид имеет график степенной зависимости f x, Θ

Θ0xΘ1 , Θ1 0,

 

Θ1

0?

 

 

 

 

 

 

20.

С помощью каких преобразований переменных осуществляется линеари-

 

зация зависимости f x, Θ

Θ0xΘ1 ?

 

 

 

 

21.Где используются степенные зависимости?

22.Какой вид имеет график логарифмической зависимости?

23.С помощью какого преобразования осуществляется переход логарифмической зависимости к линейному виду?

24.Как определяется общая сумма квадратов?

25.Как рассчитывается коэффициент детерминации?

26.Какие значения может принимать коэффициент детерминации?

27.В каком случае значение коэффициента детерминации может оказаться отрицательным?

28.Как рассчитывается приведенный коэффициент детерминации?

29.Когда целесообразно использовать приведенный коэффициент детерминации?

30.Каким образом можно вычислить коэффициент корреляции?

31.Какие значения может принимать коэффициент корреляции?

32.Как можно оценить значимость уравнения регрессии?

33.Как осуществляется подбор линеаризующего преобразования с помощью подхода Бокса—Кокса?

34.Как выполняется тест Зарембки?

35.Какие формы зависимости можно выбрать с помощью теста Зарембки?

Глава 5

ГЕТЕРОСКЕДАСТИЧНОСТЬ

5.1 Понятие гетероскедастичности

Равенство дисперсий возмущений (ошибок) регрессии (гомоскедастичность) является существенным условием линейной классической регрессионной модели

множественной регрессии, записываемым в виде Mε2

σ2.

i

 

Однако на практике это условие нередко нарушается, и мы имеем дело с гете-

роскедастичностью модели (в том случае условие будет записано Mε2

σ2).

 

 

i

i

. . . . . . . . . . . . . . . . . . . . . .

Пример 5.1

. . . . . . . . . . . . . . . . . . . . .

Предположим, что необходимо изучить зависимость размера оплаты труда Y (в усл. ден. ед.) сотрудников фирмы от разряда X , принимающего значения от 1 до 10. Получены n 100 пар наблюдений (xi, yi). График зависимости переменной Y от номеров наблюдений, упорядоченных по возрастанию уровня значений объясняющей переменной X , показан на рисунке 5.1.

Из графика видно, что вариация размера оплаты труда сотрудников высоких уровней значительно превосходит его вариацию для сотрудников низких уровней. Следовательно, можно предположить, что регрессионная модель получится гете-

роскедастичной и условие Mε2

σ2 не выполняется.

i

 

Гетероскедастичность чаще всего встречается в пространственных выборках, а также во временных рядах, когда зависимая переменная имеет большой интервал качественно неоднородных значений или высокий темп изменения.

Гетероскедастичность увеличивает дисперсию распределения оценок коэффициентов.

5.2 Графический анализ остатков

83

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 5.1 – График зависимости Y от номеров наблюдений

.. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

5.2Графический анализ остатков

Использование графического представления отклонений позволяет определиться с наличием гетероскедастичности. В этом случае по оси абсцисс откладывается объясняющая переменная X (либо линейная комбинация объясняющих перемен-

ных Y Θ0

Θ1X 1 . . . ΘpX p ), a пo оси ординат — либо отклонения εi, либо их

квадраты ε2

. Примеры таких графиков приведены на рисунке 5.2.

i

 

На рисунке 5.2, а все отклонения ε2i находятся внутри полуполосы постоянной ширины, параллельной оси абсцисс. Это говорит о независимости дисперсий ε2i от значений переменной X и их постоянстве, т. е. в этом случае мы находимся в условиях гомоскедастичности.

На рисунке 5.2, бг наблюдаются некие систематические изменения в соотношениях между значениями xi переменной X и квадратами отклонений ε2i . На рисунке 5.2, в отражена линейная; 5.2, г — квадратичная; 5.2, д — гиперболическая зависимости между квадратами отклонений и значениями объясняющей переменной X . Другими словами, ситуации, представленные на рисунке 5.2, бд, отражают большую вероятность наличия гетероскедастичности для рассматриваемых статистических данных.

Отметим, что графический анализ отклонений является удобным и достаточно надежным в случае парной регрессии. При множественной регрессии графический анализ возможен для каждой из объясняющих переменных X j , j 1, . . ., p отдельно. Чаще же вместо объясняющих переменных X j по оси абсцисс откладывают значения yi, получаемые из эмпирического уравнения регрессии. Поскольку по уравнению множественной линейной регрессии yi является линейной комбинацией xi j , j 1, . . ., p, то график, отражающий зависимость ε2i от yi, может указать на

84

Глава 5. Гетероскедастичность

 

 

наличие гетероскедастичности аналогично ситуациям на рисунке 5.2, бд. Такой анализ наиболее целесообразен при большом количестве объясняющих переменных.

Рис. 5.2 – Графики остатков

5.3Тесты на гетероскедастичность

Впримере 5.1 наличие гетероскедастичности не вызывает сомнения, — чтобы убедиться в этом, достаточно взглянуть на рисунке 5.1. Однако в некоторых случаях гетероскедастичность визуально не столь очевидна.

Рассмотрим еще один пример, в котором исследуется зависимость дохода ин-

дивидуума (Y) от уровня его образования X1, принимающего значения от 1 до 5, по данным n 150 наблюдений. В число объясняющих переменных (регрессоров)

включен также и возраст X2.

На рисунке 5.3 приведен график зависимости переменной Y от номеров наблюдений, упорядоченных по возрастанию уровня значений объясняющей пере-

менной X1.

Хотя диаграмма имеет локально расположенные пики, в целом подобный рисунок может соответствовать как гомо-, так и гетероскедастичной выборке.

Чтобы определить, какая же именно ситуация имеет место, используются тесты на гетероскедастичностъ. Все они используют в качестве нулевой гипотезы H0 гипотезу об отсутствии гетероскедастичности.

5.3 Тесты на гетероскедастичность

85

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 5.3 – График зависимости переменной Y от номеров наблюдений, упорядоченных по возрастанию уровня значений объясняющей переменной X1

5.3.1 Тест ранговой корреляции Спирмена

Этот тест использует наиболее общие предположения о зависимости дисперсий

ошибок регрессии от значений регрессоров: σ2

fi xi , i 1, . . ., n.

i

 

При этом никаких дополнительных предположений относительно вида функций fi не делается. Не накладываются также ограничения на закон распределения возмущений (ошибок) регрессии.

Идея теста заключается в том, что абсолютные величины остатков регрессии εi являются оценками σi, поэтому в случае гетероскедастичности абсолютные величины остатков εi и значения регрессоров xi будут коррелированны.

Тест состоит из следующих шагов.

Шаг 1. Выборка упорядочивается по фактору x. Рассчитываются ранги x (по-

рядковый номер).

Шаг 2. Рассчитывается уравнение регрессии yi Θ0 Θ1x εi. Шаг 3. Вычисляются остатки εi yi yi.

Шаг 4. Выборка снова упорядочивается по величине остатков (по модулю). Рассчитываются ранги (порядковый номер) остатков.

Шаг 5. Рассчитывается коэффициент ранговой корреляции Спирмена:

 

 

 

 

 

n

d2

 

 

6

 

 

 

 

 

 

 

i 1

 

i

 

rx, ε

1

 

 

 

 

 

,

n

n2

1

 

 

 

 

где di — разность рангов x и ε.

 

 

 

 

 

 

 

 

 

Шаг 6. Рассчитывается статистика

 

 

 

 

 

 

 

 

 

 

 

 

 

tr

 

rx, ε

n

1

.

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

rx2, ε

 

Шаг 7. Проверяется гипотеза.

86 Глава 5. Гетероскедастичность

Если в модели регрессии имеется более одной объясняющей переменной, то проверка гипотезы может выполняться с использованием каждой из них.

Условие принятия гипотез: tr tα, n 2.

Если данное условие выполняется, то нулевая гипотеза об отсутствии гетероскедастичности отклоняется при уровне значимости α.

. . . . . . . . . . . . . . . . . . . . . .

Пример 5.2 . . . . . . . . . . . . . . . . . . . . .

В таблице 5.1 представлена зависимость спроса Y от цены X . Выполнить тест на гетероскедастичность с помощью теста Спирмена.

 

 

Таблица 5.1 – Исходные данные

 

 

 

 

 

 

 

 

 

 

 

Цена, X

15.91

15.54

16.76

15.21

15.28

15.92

15.95

16.69

 

 

 

 

 

 

 

 

 

Спрос, Y

117.088

119.864

110.023

123.809

121.175

116.17

118.344

110.106

 

 

 

 

 

 

 

 

 

Цена, X

15.09

15.62

16.31

16.33

16.60

15.49

15.70

 

Спрос, Y

125.178

118.068

116.201

111.457

115.103

116.914

123.589

 

 

 

 

 

 

 

 

 

 

Решение:

Такой тест удобнее всего выполнять с помощью электронных таблиц Excel. Для проведения теста ранговой корреляции Спирмена необходимо выполнить следующие действия.

1.Отсортировать данные в таблице по возрастанию значений x.

2.Придать каждому наблюдению ранг, для чего необходимо добавить новый столбец, в котором задать числа от 1 до n.

3.Вычислить регрессионные остатки. В Excel это можно выполнить различными способами. Один из них — с помощью функции ЛИНЕЙН (или ОТРЕЗОК, НАКЛОН) найти оценку функции y, а затем вычислить остатки εi как разность

yi yi. Другой способ — с использованием надстройки «Анализ данных. . .». Нужно вызвать опцию «Регрессия», указать диапазон Y и X и выбрать в диалоговом окне опцию «Остатки». После выполнения данной надстройки появится дополнительная таблица, в которой содержатся номера наблюдений, прогнозы и остатки. Тот столбец таблицы, в котором находятся остатки, необходимо перенести к исходным данным. После выполнения этих действий наша таблица будет содержать четыре столбца: ранг наблюдения, упорядоченные значения регрессора x, значения y и значения остатков (табл. 5.2).

Таблица 5.2 – Расчет характеристик

Ранг по X

Цена X (р.)

Спрос Y (тыс. шт.)

Остатки ε

 

 

 

 

1

15.09

125.178

1.450697114

2

15.21

123.809

1.006051072

 

 

 

 

3

15.28

121.175

1.088742452

 

 

 

 

4

15.49

116.914

3.732123026

 

 

 

 

продолжение на следующей странице

5.3 Тесты на гетероскедастичность

87

 

 

 

 

 

 

 

 

Таблица 5.2 – Продолжение

 

 

 

 

 

 

 

 

 

Ранг по X

Цена X (р.)

Спрос Y (тыс. шт.)

Остатки ε

 

 

 

 

 

 

 

 

5

15.54

119.864

0.396975543

 

 

 

 

 

 

 

 

6

15.62

118.068

1.576739571

 

 

7

15.70

123.589

4.560496401

 

 

 

 

 

 

 

 

8

15.91

117.088

0.322884172

 

 

 

 

 

 

 

 

9

15.92

116.17

1.163854676

 

 

 

 

 

 

 

 

10

15.95

118.344

1.241233814

 

 

 

 

 

 

 

 

11

16.31

116.201

1.871295688

 

 

 

 

 

 

 

 

12

16.33

111.457

2.718645319

 

 

13

16.60

115.103

3.007151087

 

 

 

 

 

 

 

 

14

16.69

110.106

1.296583445

 

 

 

 

 

 

 

 

15

16.76

110.023

0.840376969

 

 

 

 

 

 

 

4.Отсортировать данные по возрастанию модулей остатков и добавить новый столбец рангов остатков, аналогичным образом задав значения от 1 до n.

5.В дополнительном столбце вычислить значения разности между двумя полученными рангами (это и будет значение di) (табл. 5.3).

Таблица 5.3 – Расчет характеристик

Ранг по X

Цена X (р.)

 

Спрос Y

 

 

Остатки ε

Ранг по

Разность

 

(тыс. шт.)

 

 

(модуль)

остаткам

рангов di

8

15.91

 

 

117.088

 

0.322884172

 

1

7

 

 

 

 

 

 

 

 

 

 

 

 

5

15.54

 

 

119.864

 

0.396975543

 

2

3

 

 

 

 

 

 

 

 

 

 

 

 

15

16.76

 

 

110.023

 

0.840376969

 

3

12

 

 

 

 

 

 

 

 

 

 

 

 

2

15.21

 

 

123.809

 

1.006051072

 

4

2

3

15.28

 

 

121.175

 

1.088742452

 

5

2

 

 

 

 

 

 

 

 

 

 

 

 

 

9

15.92

 

 

116.17

 

 

1.163854676

 

6

3

 

 

 

 

 

 

 

 

 

 

 

 

10

15.95

 

 

118.344

 

1.241233814

 

7

3

 

 

 

 

 

 

 

 

 

 

 

 

14

16.69

 

 

110.106

 

1.296583445

 

8

6

1

15.09

 

 

125.178

 

1.450697114

 

9

8

 

 

 

 

 

 

 

 

 

 

 

 

6

15.62

 

 

118.068

 

1.576739571

 

10

4

 

 

 

 

 

 

 

 

 

 

 

 

11

16.31

 

 

116.201

 

1.871295688

 

11

0

 

 

 

 

 

 

 

 

 

 

 

 

12

16.33

 

 

111.457

 

2.718645319

 

12

0

 

 

 

 

 

 

 

 

 

 

 

 

13

16.60

 

 

115.103

 

3.007151087

 

13

0

4

15.49

 

 

116.914

 

3.732123026

 

14

10

 

 

 

 

 

 

 

 

 

 

 

 

7

15.70

 

 

123.589

 

4.560496401

 

15

8

 

 

 

 

 

 

 

 

 

 

6. Подсчитать коэффициент ранговой корреляции и статистику:

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

6

 

D2

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

6

508

 

 

 

 

rx, e

1

 

 

i 1

 

1

 

0.0928.

 

 

n

n2 1

15

225 1

 

 

 

 

 

 

 

 

 

 

 

 

 

0.0928

 

 

 

 

 

 

 

 

 

tr

 

15 1

0.35.

 

 

 

88

Глава 5. Гетероскедастичность

 

 

7. Проверить гипотезу.

 

Рассчитаем t-статистику: t0.95, 13

2.16.

Так как условие tr tα, n 2 не выполняется, то нулевая гипотеза об отсутствии гетероскедастичности принимается при уровне значимости α 0.95.

.. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

5.3.2Тест Парка

Тест Парка осуществляется с помощью следующих шагов. Шаг 1. Рассчитывается уравнение регрессии yi Θ0 Θ1x εi. Шаг 2. Вычисляются остатки εi yi yi.

Шаг 3. Оценивается вспомогательное уравнение регрессии

ln ε2

a b ln x

ij

ν

,

i

 

i

 

где xij i-е значение фактора; vi — случайный остаток.

Шаг 4. Проверяется значимость коэффициента b. Условие принятия гипотезы:

tb tα, n 2.

Если данное условие выполняется, то нулевая гипотеза о наличии гетероскедастичности будет принята при уровне значимости α.

5.3.3 Тест Гольдфельда—Квандта

Этот тест применяется в том случае, если ошибки регрессии можно считать нормально распределенными случайными величинами. Предположим, что средние квадратические отклонения возмущений σi пропорциональны значениям объясняющей переменной X (это означает постоянство часто встречающегося на практике относительного (а не абсолютного, как в классической модели) разброса возмущений εi регрессионной модели).

В этом случае все наблюдения необходимо упорядочить по мере возрастания значений x. Разделить исходную модель на три равные части. Если количество наблюдение не делится нацело на 3, то уменьшается количество наблюдений в средней части, а первая и вторая части остаются одинаковыми по количеству наблюдений. Затем построить регрессионную модель для первых k и последних k

наблюдений. Соответственно обозначим через S 1 и S 3

сумму квадратов откло-

нений в каждой регрессии. Тогда статистика имеет вид:

 

F

 

S 3

 

 

 

.

 

 

S 1

 

Если выполняется условие F Fγ

k m 1, k m

1 , то гипотеза об от-

сутствии гетероскедастичности отвергается. Здесь m — количество объясняющих переменных в уравнении, k — объем подвыборки.

5.4 Устранение гетероскедастичности

89

 

 

5.4 Устранение гетероскедастичности

Если дисперсии σ2i (i 1, . . ., n) случайной величины известны, то гетероскедастичность устраняется путем нормирования переменных. Для модели парной регрессии такое нормирование будет иметь вид:

Yi

 

Θ0

 

Θ1x

 

εi

.

 

 

 

 

 

 

σi

 

σi

 

σi

 

σi

Далее может быть использован метод наименьших квадратов. Для парной регрессии минимизируемая функция имеет вид:

n

yi Θ0

Θ1xi

2

 

 

 

min .

 

σi

 

i 1

 

Θ0, Θ1

Оценки неизвестных параметров могут быть вычислены по формулам:

 

 

n

n

 

 

 

 

n

n

 

 

 

 

 

λi

 

 

λixiyi

 

λixi

 

λiyi

 

 

Θ1

i 1

i 1

 

 

 

i

1

i 1

 

,

(5.1)

 

 

n

 

n

 

n

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

λi

 

 

λixi2

 

 

λixi

 

 

 

 

 

i

1

 

i

1

 

 

i 1

 

 

 

 

 

 

 

 

n

 

 

 

n

 

 

 

 

 

 

 

 

 

λiyi

 

λixi

 

 

 

 

 

 

Θ0

i

1

 

Θ1

i

1

,

 

 

 

 

 

 

n

 

 

n

 

 

 

 

 

 

 

 

λi

 

λi

 

 

 

 

 

 

 

 

i

1

 

 

 

i 1

 

 

 

 

где λi

1 σ2.

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

Также для расчета оценок может быть использован обобщенный МНК. В этом

случае оценка определяется по формуле:

 

 

Θ X T V

1X

1X T V

1Y,

 

ε

 

ε

где V — единичная матрица, диагональные элементы которой равны σ2.

Однако в большинстве случаев информация о дисперсиях σ2i отсутствует. В этом случае используется двухшаговый метод взвешенных наименьших квадратов. Кратко опишем этот метод для гетероскедастичной линейной регрессионной модели

с двумя объясняющими переменными (m

3), в которой дисперсии σ2

возмущений

εi зависят от значений xij, как

 

 

 

i

 

 

 

 

 

 

σ2

α0

α1x

1 α2x 2

,

 

i

 

i

i

 

 

где параметры α0, α1, α2 — неизвестны.

 

 

 

На первом шаге находим вектор b с помощью МНК:

 

 

b

X T X

1X T Y,

 

 

ивычисляется вектор остатков (невязок):

εY Y Y X T b.

90 Глава 5. Гетероскедастичность

Предполагая, что D εi

M ε2

σ2

, формируем линейную регрессионную

 

 

i

i

 

 

 

 

модель, в которой объясненной частью является σ2, т. е.

 

 

 

 

 

 

i

 

 

 

ε2

α0

α1x 1

α2x 2

γi, i

1, 2, . . ., n.

 

 

i

 

i

i

 

 

 

 

Применяя к этой модели обычный МНК, находим оценки α0, α1, α2 для пара-

метров α0, α1, α2.

 

 

 

 

 

 

 

На втором шаге подставляем оценки α0, α1, α2

в уравнение σ2

α0

α1x 1

 

 

 

 

 

i

 

i

α2x

2

и вычисляем значения σ2, из которых формируем ковариационную матрицу

 

 

i

 

 

 

i

 

 

Vε

diag σ2

, σ2

, . . ., σ2

и вычисляем оценку Θ:

 

 

 

 

1

2

n

 

 

 

 

 

 

 

 

 

Θ X T V

1X 1X T V

1Y.

 

 

 

 

 

 

 

ε

ε

. . . . . . . . . . . . . . . . . . . . . . Пример 5.3 . . . . . . . . . . . . . . . . . . . . .

Используя исходные данные таблицы 5.4, найти оценки неизвестных параметров функции регрессии: а) используя обобщенный МНК, б) используя двухфазный МНК, считая, что значения σ2i неизвестны.

 

 

 

Таблица 5.4 – Исходные данные

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X 1

8

11

12

9

8

8

9

9

8

12

X 2

5

8

8

5

7

8

6

4

5

7

Y

5.11

8.81

9.71

5.82

4.79

5.74

5.36

5.46

4.57

8.01

 

 

 

 

 

 

 

 

 

 

 

σ2

0.22

0.66

0.79

0.3

0.29

0.32

0.34

0.26

0.22

0.73

Решение:

а) Запишем исходные данные:

 

 

1

8

5

 

 

 

1

11

8

 

 

 

1

12

8

 

 

 

1

9

5

 

 

X

1

8

7

,

 

1

8

8

 

 

1

9

6

 

 

 

1

9

4

 

 

 

1

8

5

 

 

 

1

12

7

 

Y

5.11 8.81 9.71 5.82 4.79 5.74 5.36 5.46 4.57 8.01 T ,