Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Уч.пос.Колпаков В.Ф. (ГМУ).doc
Скачиваний:
22
Добавлен:
23.08.2019
Размер:
5.41 Mб
Скачать

4.2. Реализация задания на компьютере с помощью ппп Ехсеl

Исходным статистическим материалом для решения задач этой темы являются задания из раздела «Множественная регрессия». Каждому студенту необходимо уравнение множественной регрессии, полученное в Главе II, проверить на предмет нарушения предпосылок МНК и при необходимости произвести коррекцию модели.

4.2.1. Проверка наличия гетероскедастичности

Задание:

1) Графически и с помощью тестов проверить наличие гетероскедастичности;

2) При наличии гетероскедастичности с помощью тестов Уайта, Парка и Глейзера выбрать наилучшую аппроксимацию или ( по значению коэффициента детерминации R2) и с помощью ВМНК скорректировать уравнение регрессии.

Пример 4.1. В табл. 4.1 приведены данные об объеме импорта Y (млрд долл.), валовом национальном продукте Х1 (млрд долл.) и индексе потребительских цен Х2 в США за период с 1964 по 1979 гг.

Таблица 4.1

Годы

Y

Х1

Х2

1964

28,4

635,7

92,9

1965

32,0

688,1

94,5

1966

37,7

753,0

97,2

1967

40,6

796,3

100,0

1968

47,7

868,5

104,2

1969

52,9

935,5

109,8

1970

58,5

982,4

116,3

1971

64,0

1063,4

121,3

1972

75,9

1171,1

125,3

1973

94,4

1306,6

133,1

1974

131,9

1412,9

147,7

1975

126,9

1528,8

161,2

1976

155,4

1702,2

170,5

1977

185,8

1899,5

181,5

1978

217,5

2127,6

195,4

1979

260,9

2368,5

217,4

Параметры множественной регрессии определим с помощью функции ЛИНЕЙН и построим графики и (рис. 4.1.).

Из рисунка видно, что уравнение множественной регрессии имеет вид:

.

Качество уравнение регрессии в целом достаточно высокое (R2 = 0.987). Из графиков распределения видно, что ошибки зависят от факторов, причем эта зависимость имеет явно нелинейный характер. Однозначно из графиков сказать нельзя присутствует ли гетероскедастичность и в какой степени. Если гетероскедастичность существует, то носит явно нелинейный характер. Поэтому проверки с помощью тестов Спирмена и Голдфелда-Квандта здесь не правомочны. Покажем это.

Тест ранговой корреляции Спирмена.

Результаты реализации этого теста на компьютере представлены на рис.4.2.

Рис. 4.1

Х1

модЕ

Ранг Х

Ранг Е

dкв

Коэф. Ранговой корр. Спирмена

0,123529

635,7

9,494539

1

11

100

688,1

7,765652

2

10

64

Т набл =

0,465772

753

6,320676

3

8

25

796,3

3,696187

4

5

1

Ткрит =

2,160369

(для аl =0,05)

868,5

1,940079

5

2

9

935,5

2,369626

6

3

9

982,4

5,383489

7

6

1

1063,4

10,03754

8

13

25

1171,1

9,629909

9

12

9

1306,6

7,688036

10

9

1

1412,9

10,38887

11

14

9

1528,8

13,95374

12

16

16

1702,2

6,12615

13

7

36

1899,5

0,434927

14

1

169

2127,6

3,677338

15

4

121

2368,5

11,47022

16

15

1

596

Рис. 4.2

Обозначения на рисунке имеют следующий смысл:

модЕ = ; dкв = (ранг хi - ранг )2.

Для вычисления рангов была использована статистическая функция РАНГ(число; массив; порядок), которая возвращает ранг числа из массива. Если порядок = 1, то ранжирование по возрастанию, если порядок=0 - ранжирование по убыванию.

Так как Тнабл , то коэффициент ранговой корреляции Спирмена статистически не значим, что является признаком отсутствия гетероскедастичности в смысле Спирмена (что априорно и предполагалось).

Тест Голдфелда-Квандта.

В связи с тем, что выборка небольшая (n = 16), принимаем k = 8. Результаты анализа с помощью этого теста представлены на рис. 4.3.

Х1

Y

Линейн

Х1

Y

Линейн

635,7

28,4

0,085431

-26,5681

1171,1

75,9

0,148877

-95,4629

688,1

32

0,001743

1,484911

1306,6

94,4

0,007266

12,5994

753

37,7

0,997508

0,685035

1412,9

131,9

0,985909

8,008884

796,3

40,6

2401,455

6

1528,8

126,9

419,816

6

868,5

47,7

1126,939

2,815641

1702,2

155,4

26927,94

384,8534

935,5

52,9

1899,5

185,8

982,4

58,5

2127,6

217,5

1063,4

64

2368,5

260,9

Рис. 4.3

Из рисунка видно, что S1 = 2,816, а S2 = 384,85, в результате чего

= 136,68 > fкр = 4,28, что с одной стороны свидетельствует о значительных расхождениях отклонений в начале и в конце списка данных, но это обусловлено двумя «выбросами» (см. рис. 4.1), а вовсе не тенденцией .

Как уже было отмечено выше, наиболее подходящим тестом для выявления гетероскедастичности, в этом случае, является тест Уайта.

Тест Уайта.

В этом тесте будем предполагать, что квадраты ошибок можно представить уравнением вида:

Результаты расчетов с помощью функции Линейн представлены на рис.4.4. Из рисунка следует (2,442274) < (3,325835), что свидетельствует об отсутствии регулярности ошибок, а это значит гетероскедастичностью можно пренебречь.

Рис. 4.4

Если бы факт гетероскедастичности подтвердился, то все составляющие исходного уравнения

необходимо разделить на , которые для данного примера вычисляются по формуле:

,

и оценить его. В результате чего уравнение регрессии будет адаптировано к переменным дисперсиям ошибок измерений.