Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

эконометрика для очно-заочного 4 курс 2024-2025 год / 04-УП Базовый курс эконометрики (Писарева О.М., Черников Г.В.) 2024

.pdf
Скачиваний:
10
Добавлен:
19.01.2025
Размер:
1.65 Mб
Скачать

заключение требуется сравнить прогностические свойства конкурирующих моделей на тестовой выборке данных, то есть с 28-го по 30-е наблюдение.

В рамках Примера необходимые подробные пояснения к процедуре расчетов приводятся только для модели вида: yˆ 473 ,33 5,62 x2 .

Заметим, что, по возможности, начинать исследования остатков модели стоит с визуального анализа графика их распределения (рисунок 4.10).

Рисунок 4.10 - График распределения стандартизированных остатков модели yˆ 473 ,33 5,62 x2 .

Несмотря на весьма небольшой объем исходных наблюдений, распределение стандартизированных остатков на рисунке 4.10 позволяет нам заподозрить, вопервых, некоторую регулярность в их поведении, во-вторых, возможную повышающую тенденцию в их абсолютных значениях с ростом номера соответствующего наблюдения.

Таким образом, исходя из приведенного графика, можно сделать следующие вероятные предположения:

ряд остатков возможно не стационарен, похоже на наличие в нем повышающей тенденции;

в ряду остатков возможно обнаружение авторегрессионных связей. Осуществим статистическое тестирование сделанных предположений. В

ходе тестирования на основе выборочных данных ряда остатков (e) модели

yˆ 473 ,33 5,62 x2 на соответствие гипотезам Гаусса-Маркова предстоит проверить следующие свойства случайной составляющей :

М( i ) = 0, i 1; n ;

 

2

, i

j

 

 

 

,

cov( i , j ) ( i j )

 

 

j

0, i

 

или, иначе говоря, дисперсия остатков ограничена, то есть и в ряду остатков автокорреляция отсутствует.

Если условия будут выполнены, можно попытаться проверить остатки на наличие свойства нормальности распределения.

Проверка случайности ряда остатков.

Для проверки свойств остатков можно воспользоваться критериями различной степени точности. Сделаем это с помощью «сильного» критерия «восходящих» и «нисходящих» серий.

Расчеты числа и длительности серий разности остатков для модели yˆ 473 ,33 5,62 x2 иллюстрируются содержанием таблицы 4.8.

В соответствии с правилами критерия для исходного числа наблюдений

n 27 определим значения (n)

- фактического числа серий в ряду разниц

последовательных остатков и (n)

- длительности однотипных знаков в самой

длинной серии. Из таблицы 4.8 очевидно, что (27) 14 , а (27) 6 .

С учетом табулирования их значений при уровне значимости 0,05

выполняются условия

 

[ (27) 14] [1 (2 27 1) 1,96 16 27 29 )] 13,519 ;

3

90

[ (27) 6] [ 0 (27) 6] .

В нашем случае нарушено последнее из неравенств, следовательно, гипотеза о случайности выборки отвергается.

В целом же можно отметить, что «неслучайность» выборки не столь очевидна, так как по второму условию мы находимся как раз на границе области принятия решения.

Таблица 4.8 - Расчет числа и длительности серий разности остатков для модели yˆ 473 ,33 5,62 x2 .

Код

ei

ei 1 ei

(ei e)2

Знак

п./п.

 

банка

 

 

 

серии

 

 

 

 

 

 

1

2

3

4

5

6

1

Б1

268,87

-280,84

72289,42

-

2

Б2

-11,97

11,05

143,40

+

3

Б3

-0,92

-227,90

0,85

-

4

Б4

-228,83

157,06

52360,97

+

5

Б5

-71,77

-148,20

5150,41

-

6

Б6

-219,96

-120,71

48384,31

-

7

Б7

-340,67

392,01

116057,78

+

8

Б8

51,34

-314,73

2635,35

-

9

Б9

-263,40

78,04

69378,37

+

10

Б10

-185,35

256,88

34356,06

+

11

Б11

71,53

-24,84

5116,30

-

12

Б12

46,69

301,91

2180,17

+

13

Б13

348,61

35,63

121526,82

+

14

Б14

384,23

-141,63

147635,04

-

15

Б15

242,61

-68,61

58857,57

-

16

Б16

174,00

-225,23

30274,95

-

17

Б17

-51,24

333,36

2625,13

+

18

Б18

282,12

-130,82

79591,33

-

19

Б19

151,30

-289,06

22891,54

-

20

Б20

-137,76

-250,60

18977,04

-

21

Б21

-388,36

11,64

150824,98

+

22

Б22

-376,72

16,95

141921,32

+

23

Б23

-359,78

133,17

129439,78

+

24

Б24

-226,61

328,64

51350,59

+

25

Б25

102,04

225,03

10411,27

+

26

Б26

327,07

85,82

106973,54

+

27

Б27

412,88

 

170473,26

 

 

Сумма

-0,07

 

1651827,55

 

 

Среднее

-0,00254

 

 

 

 

Количество

 

 

 

14

 

серий (n)

 

 

 

 

 

 

 

 

 

Максимальная

 

 

 

6

 

длина (n)

 

 

 

 

 

 

 

 

Далее попытаемся понять, какое из условий случайности нарушается, то есть уловить некоторые закономерности в ряду остатков. Они могут формироваться как через экзогенные, так и эндогенные влияния. Например, в первом случае может иметь место гетероскедастичность остатков (нарушается свойство ограниченности дисперсии остатков), во втором – их автокорреляция.

Оценка остатков модели на гетероскедастичность.

Иллюстрацию оценивания остатков модели на наличие свойства гетероскедастичности проведем только с помощью критерия ранговой корреляции Спирмэна.

Для начала осуществим ранжировку абсолютных значений остатков модели и объясняющей переменной (фрагменты действий представлены в таблице 4.9). После этого можно приступить к вычислению коэффициента Спирмэна, а именно

 

 

 

n

 

 

 

 

 

 

r

 

1

6 di2

1

6 1883

1

11298

1 0,575 0,425.

e

i 1

 

X

 

n(n2

1)

 

27(729 1)

 

19656

 

 

 

 

 

 

 

Однако, по значению коэффициента согласия трудно однозначно сделать заключение о наличии связи между изменениями в остатках и факторе модели.

Таблица 4.9 - Расчет значений разности (d) рангов остатков и переменной x2

для модели yˆ 473 ,33 5,62 x2 .

Код

x2

Ранг

 

ei

 

Ранг

 

ei

 

 

 

п./п.

 

 

 

 

d

d2

x2

 

 

 

 

 

банка

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

2

3

4

 

5

 

 

 

5

6

1

Б1

445,40

27

268,87

10

 

 

 

17,00

289,00

 

 

 

 

 

 

 

 

 

 

2

Б2

486,60

26

11,97

26

 

 

 

0,00

0,00

 

 

 

 

 

 

 

 

 

 

3

Б3

507,00

25

0,92

27

 

 

 

-2,00

4,00

 

...

 

 

 

 

 

 

 

 

 

 

 

 

...

 

 

27

Б27

921,40

1

412,88

1

 

 

 

0

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Сумма

 

 

 

 

 

 

 

 

 

 

1883,00

 

 

 

 

 

 

 

 

 

 

 

 

 

Проверим статистическую значимость коэффициента Спирмэна. Определим расчетное значение t-статистики. Оно составит

t

rX

 

e

 

 

 

n 2

0 ,425

 

 

27

2

0 ,425

 

25

 

 

 

 

1

rX2

 

e

 

 

1 0 ,425 2

1 0,181

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0 ,425

 

5

 

 

 

0 ,425 5,525

 

2,349.

 

 

 

 

0,905

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Сравним его с табличным уровнем t-статистики для значимости в 5%. t 2,349 tтабл(0,05;25) 2,06 , следовательно, свойство гетероскедастичности в остатках обнаруживается, хотя мы находимся на границе принятия решения.

Оценка автокорреляции остатков модели.

Для примера здесь будем идентифицировать лишь АК первого порядка. Определим для регрессионной модели значение DW-статистики (расчеты представлены в таблице 4.10).

Таблица

4.10

-

Расчет

значений

DW-статистики

для

модели

yˆ 473 ,33 5,62 x2 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Код

 

yi

 

ˆ

 

ei

ei

 

ei 1

2

 

(ei ei 1 )

2

 

 

п./п.

 

 

 

 

 

 

 

 

банка

 

 

yi

 

 

ei

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

2

 

2

 

3

 

4

 

5

 

6

 

 

7

 

 

 

1

 

Б1

 

2296,5

 

2027,63

 

268,87

 

 

 

72289,42

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

Б2

 

2247,0

 

2258,97

 

-11,97

-280,84

143,40

 

 

78872,06

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

Б3

 

2372,6

 

2373,52

 

-0,92

11,05

0,85

 

 

122,15

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

...

 

 

 

 

 

 

 

 

 

 

 

...

 

 

 

 

 

 

 

 

 

27

 

Б27

 

5113,3

 

4700,42

 

412,88

85,82

170473,26

 

 

7364,38

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Сумма

 

 

 

 

 

 

 

 

 

1651827,55

1144238,13

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Исходя из формулы (4.46), имеем

27

 

 

 

 

 

DWрасч

(ei

ei 1 )2

 

1144238,13

0,69 .

i 2

 

 

 

 

27

 

1651827,55

 

 

ei2

 

 

i 1

Сучетом числа наблюдений и количества параметров модели (27 и 2

соответственно) для уровня значимости 5% из таблицы DW - статистики получаем: dL = 1.32 и dU = 1.47, что представлено на рисунке 4.11. Следовательно, как ранее предполагалось, в остатках модели наблюдается автокорреляция первого порядка.

Положительная Не определена Автокорреляция отсутствует Не определена Отрицательная

0 0,71 1,32 1,47 2 2,53 2,68 4

Рисунок 4.11 - Графическая иллюстрация граничных условий статистики Дарбина-Уотсона в условиях Примера.

Таким образом, свойство случайности остатков нарушается серийной корреляцией первого порядка в ряду. Тем не менее, далее проведем весь необходимый спектр исследований случайной компоненты, а также проиллюстрируем процедуру расчета интервального прогноза с целью пояснения ранее изложенного теоретического материала.

Проверка гипотезы о равенстве нулю математического ожидания случайной составляющей.

Проверку гипотез H0 : M (ei ) 0; H1 : M (ei ) 0 проведем на основании критерия Стьюдента. В силу того, что доказана однородность дисперсии по выборке остатков, для вычислений критерия можно воспользоваться его первой модификацией. В этом случае, расчетное значение t-статистики составит

t p

e 0

n

- 0,00254 - 0

 

- 0,00254

-0,00001 .

(ei e )2

252,06

 

s

 

 

 

n 1

Следовательно, [ tp 0,00001] [tтабл(0,05;26) 2,06].

Таким образом, гипотеза о равенстве нулю математического ожидания переменной ряда остатков не отвергается, то есть это условие Гаусса-Маркова работает.

Проверка гипотезы о нормальности распределения случайной составляющей осуществляется в том случае, если остатки действительно подчиняются случайному распределению. Через оценку показателей асимметрии и эксцесса проверяется соответствие формы распределения случайной компоненты нормальному закону.

Итак, коэффициент асимметрии для ряда остатков составит

 

 

1

(ei e )3

 

 

1

10873490,6

6

 

 

402721,88

 

A

 

n

 

 

 

27

 

0,027 .

 

 

 

 

 

 

 

 

 

1

 

 

 

3

 

247,34

3

 

15132177,0 2

 

(ei e )

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Коэффициент эксцесса

 

 

1

(ei e)4

 

 

1

1809018333 44,25

 

6700067901

,64

 

Э

 

n

 

3

27

3

3 1,79 - 3 -1,210 .

 

 

 

 

 

 

1

(ei e)

2

4

 

247,34 4

3742845360

,72

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Определим среднеквадратические ошибки коэффициентов асимметрии и эксцесса распределения. Они составят соответственно

A

 

6 (n 2)

 

 

6(27 2)

 

 

150 0,179

0,423;

 

 

 

(n 1)(n 3)

(27 1)(27 3)

 

 

 

 

 

 

840

 

 

 

 

Э

 

24 n (n 2) (n 3)

 

 

24 27 (27 2) (27 3)

 

388800

 

0,517 0,719 .

(n 1)2 (n 3) (n 5)

(27 1)2

(27 3) (27 5)

752640

 

 

 

 

 

Рассмотрим разрешающие условия теста. В нашем случае проверим первую систему ограничений:

0,027

1,5 0,423

0,635

 

 

 

 

 

 

 

6

 

 

 

 

 

 

.

 

- 1,21

 

 

 

0,996

1,5

0,719

1,078

 

 

 

 

 

27

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таким образом, распределение остатков могло бы быть признано нормальным, если бы оно было случайным.

Оценка прогностических свойств моделей.

Оценим прогностические свойства конкурирующих моделей на тестовой выборке данных, то есть с 28-го по 30-е наблюдение.

Общие результаты вычислений по всем четырем моделям сведены в таблицу 4.13. Обозначения в ней даны в соответствии с ранее введенной идентификацией. Под значениями оценок параметров регрессии приводятся значения соответствующих расчетных характеристик t-статистики.

Порядок вычислений критериев прогностической пригодности регрессионных моделей иллюстрируется на модели вида:

yˆ 4,95 x2 .

Необходимые промежуточные вычисления сведены в таблице 4.11. Используя результаты расчетов из таблицы 4.11, получим следующие

значения коэффициентов несоответствия:

 

 

 

 

 

30

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

K

 

 

 

 

( yi yˆi )2

 

 

 

 

319710,82 99946,16 32393,35

 

 

452050,33

0,074 ,

 

1

 

i 28

 

 

 

 

 

 

 

 

T

 

 

 

30

 

 

 

 

26735104,36 28187604,64 28706020,84

83628729,84

 

 

 

 

 

 

 

yi2

 

 

 

 

 

 

 

 

 

 

 

i 28

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

30

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

KT 2

 

 

( yi

yˆi )2

 

 

 

452050 ,33

 

0,053

,

 

 

 

 

i 28

 

 

 

 

 

 

 

 

 

 

30

N L

 

83628729 ,84 76805238 ,93

 

 

 

 

 

 

 

 

 

yi2 yˆi2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i 28

i 28

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

30

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

( yi yˆi )2

 

 

452050 ,33 / 3

 

 

 

 

 

U 1

 

 

 

3 i 28

 

 

 

 

 

 

 

 

 

 

0,038 .

 

 

 

 

 

 

 

 

 

 

83628729 ,84 / 3

76805238 ,93 / 3

 

 

T

 

 

 

1 yi2

 

1 yˆi2

 

 

 

 

 

 

 

30

 

 

 

30

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3 i 28

 

 

3 i 28

 

 

 

 

 

 

 

 

 

 

Таблица 4.11 - Промежуточные вычисления для определения значений коэффициентов Тейла для зависимости вида yˆ 4,95x2 .

№ п./п.

Код

 

y

 

 

 

 

 

ˆ

 

 

 

 

 

 

2

 

 

 

 

2

 

 

 

 

банка

 

 

 

 

 

 

yi

 

 

 

 

 

 

yi

 

 

yˆi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

1

 

2

2

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

5

 

28

 

Б28

5170,60

 

 

4605,17

 

 

 

26735104,36

 

21207592,87

29

 

Б29

5309,20

 

 

4993,06

 

 

 

28187604,64

 

24930621,88

30

 

Б30

5357,80

 

 

5537,78

 

 

 

28706020,84

 

30667024,19

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Сумма

15837,60

 

 

15136,01

 

 

83628729,84

 

76805238,93

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

№ п./п.

 

Код

 

( y

 

yˆ

 

)2

 

 

y

i 1

y

i

2

 

yˆ

 

y

2

 

 

 

 

i

i

 

 

 

 

 

 

 

 

 

i 1

i 1

 

 

 

 

 

банка

 

 

 

 

 

 

 

 

 

yi

 

 

 

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

2

 

 

 

6

 

 

 

 

 

 

 

 

 

7

 

 

 

 

 

 

8

 

 

 

28

 

Б28

 

319710,82

 

-0,06114

 

0,0037384

 

 

29

 

Б29

 

99946,16

 

 

 

0,03390

 

0,0011492

 

 

30

 

Б30

 

32393,35

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Сумма

 

452050,33

 

-0,02724

 

0,0048876

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В дополнение на тестовом множестве можно оценить и различного рода ошибки прогноза. Они проведены с учетом информации таблицы 4.12.

Таблица 4.12. Промежуточные вычисления для определения значений ошибок прогноза для зависимости вида yˆ 4,95x2 .

 

Код

ˆ

y yˆ

( y

yˆ

 

)2

 

yi yˆi

 

 

 

yi yˆi

 

 

 

 

yi yˆi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

п./п.

 

 

yi

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

y

 

 

 

 

 

 

 

банка

yi

i i

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

3

4

 

5

 

 

6

 

 

7

 

 

 

 

8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

28

Б27

4605,17

565,43

319710,82

0,10935

 

565,43

 

 

0,10935

 

29

Б28

4993,06

316,14

99946,16

0,05955

 

316,14

 

 

0,05955

 

30

Б30

5537,78

-179,98

32393,35

 

 

 

 

179,98

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Сумма

15136,01

701,59

452050,33

0,16890

 

1061,55

 

 

0,16890

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таким образом, для нашего примера имеем

 

 

 

 

 

 

 

 

 

 

средняя ошибка прогноза:

 

 

 

 

 

e 1 701,59 233,86 ,

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

средняя абсолютная ошибка:

средний квадрат ошибки:

стандартная ошибка прогноза:

средняя относительная ошибка прогноза:

средняя процентная ошибка прогноза:

13 1061,55 353,85 ,

e 2 13 452050,33 150683,44 ,

S

e 2 388,18 ,

 

 

 

0,16890

0,0563003 ,

3

 

 

 

 

 

 

0,16890

100%

5,63% .

 

 

3

 

 

 

 

Приведенные в таблице 4.13 результаты вычислений по четырем модификациям факторной линейной модели дают возможность сделать следующие выводы.

Таблица 4.13 - Значения информационных и прогностических характеристик конкурирующих регрессионных моделей.

Модель

yˆ 245,58 2,13x1

3,63x2

yˆ 2,29x1

3,16x2

 

yˆ 473,33 5,62x2

 

yˆ 4,95 x2

Оценка

(-1,32)

(4,66)

(7,29)

(5,12)

(8,94)

 

(-1,95)

(16,05)

 

(65,97)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

2

 

3

 

 

4

 

 

5

R2

99,36

 

99,71

 

91,15

 

99,41

 

s

190,00

 

192,81

 

257,05

 

270,53

 

F

246,62

 

4296,94

 

257,61

 

4351,89

DW

0,84

 

0,82

 

0,69

 

 

0,54

KT1

0,09178

 

0,09161

 

0,06860

 

0,07352

KT 2

0,06458

 

0,06505

 

0,04855

 

0,05308

UT1

0,04567

 

0,04600

 

0,03433

 

0,03754

 

e

-26,38

 

69,89

 

26,45

 

233,86

 

 

 

435,17

 

455,06

 

329,01

 

353,85

 

 

 

 

 

 

 

0,0387850

0,0498140

 

0,0341778

 

0,0563003

~

 

3,88%

 

4,98%

 

3,42%

 

5,63%

 

 

 

 

 

e 2

234837,76

233950,08

 

131200,74

 

150683,44

 

S

484,60

 

483,68

 

362,22

 

388,18

 

 

Показатели информационной пригодности моделей говорят о весьма

высоком

качестве

«предсказания»

всеми

моделями

прошлого

изучаемой

переменной y. Все модели значимы.