Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

эконометрика для очно-заочного 4 курс 2024-2025 год / 04-УП Базовый курс эконометрики (Писарева О.М., Черников Г.В.) 2024

.pdf
Скачиваний:
10
Добавлен:
19.01.2025
Размер:
1.65 Mб
Скачать

если UT 1 - нет оснований использовать более сложные методы прогнозирования, чем наивный прогноз.

Очевидным апостериорным показателем точности предсказания

является доля исполнения прогнозов: p p q , где p - доля подтвердившихся

прогнозов; q - доля не подтвердившихся прогнозов.

Чем выше значение приведенной характеристики, тем более успешно работает генератор прогноза, и это относится не только к эконометрическому инструментарию предсказания.

С другими метриками и процедурами оценки качества прогнозов на основе эконометрических методов и моделей подробнее можно познакомиться

вработах [10, 13, 16].

4.6.ПРИМЕР ПОСТРОЕНИЯ ФАКТОРНОЙ РЕГРЕССИОННОЙ МОДЕЛИ И

ИССЛЕДОВАНИЯ ЕЁ СВОЙСТВ

Приведём пример использования методов эконометрического моделирования для построения факторной регрессионной модели и её дальнейшего использования в прогнозировании [11, с. 160-180]. Исходная статистика приводится в Приложении 2. Она содержит фрагмент данных из рейтинговой таблицы банков на определённую дату (названия банков обезличены).

Сформулируем задачу следующим образом. На основе данных о деятельности 30-и коммерческих банков (КБ) проверить гипотезу о влиянии размеров среднемесячных величин чистых активов банка (Х1, млн. руб.) и их привлеченных средств (Х2, млн. руб.) на ожидаемую годовую величину банковской прибыли (Y, тыс.руб.). Если зависимость подтвердится, определить доверительный интервал прогноза величины ожидаемой прибыли для КБ, у

которого среднемесячная величина чистых активов ожидается на уровне 890 млн. руб., а предполагаемая величина привлеченных средств - 1010 млн. руб.

1. Корреляционный анализ.

Исходный этап построения модели – корреляционный анализ массива изучаемых показателей. Он поможет сориентироваться в выборе верной спецификации исходных оцениваемых моделей. Для этого предстоит оценить наличие существенной линейной связи

между рядами экзогенных переменных модели, то есть Х1 и Х2;

зависимой переменной Y и каждой из независимых переменных Х1 и Х2;

определить коэффициент множественной корреляции r.

Как видно из упомянутых расчетных формул, вычисления удобно проводить в центрированных координатах. Фрагмент преобразований исходных данных приведен в таблице 4.5.

Таблица 4.5 - Фрагмент массива исходных данных с результатами вспомогательных вычислений для расчета матрицы cov(x) и вектора cov(x, y) .

Код

Прибыль,

Чистые

Привлеченные

Y'=

X1'=

X2'=

тыс.руб.

активы,

средства,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x1 - X1

x2 - X 2

п./п.

банка

Y -Y

(Y)

млн.руб. (Х1)

млн.руб.( Х2)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

3

4

5

6

 

 

7

 

8

 

1

Б1

2296,5

368,9

445,4

-1240,02

-191,14

-268,25

2

Б2

2247,0

264,3

486,6

-1289,52

-295,74

-227,05

3

Б3

2372,6

382,2

507,0

-1163,92

-177,84

-206,65

 

...

30

...

Б30

5357,8

1047,0

1119,3

1821,28

486,96

405,65

 

Среднее

3536,52

560,04

713,65

 

 

 

 

 

 

 

 

 

 

значение

 

 

 

 

 

 

 

 

 

Вычислим матрицу cov(x) и вектор cov(x, y) .

Используя значения центрированных переменных, приведенные в табл.6, имеем:

 

 

 

 

 

 

 

 

 

 

 

-191,14

268,25

 

 

 

1

 

 

 

1

 

-191,14

295,74 ...

486,96

 

295,74

227,05

 

 

 

 

T

 

 

 

 

 

cov(x)

 

 

X

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N 1

 

 

N 1

 

268,25

227,05 ...

405,65

 

...

...

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

486,96

405,65

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

1022858,11

 

835208,70

34095,27

27840,29

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N 1

 

 

 

 

870144,60

 

 

 

29004,82

 

 

 

 

 

 

835208,70

 

 

27840,29

 

 

 

 

 

Далее определяем

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

-1240,02

 

 

 

 

 

 

1

 

 

 

 

1

 

-191,14

 

295,74 ...

486,96

 

-1289,52

 

 

 

 

 

 

 

T

 

 

 

 

 

cov(x, y)

 

X

 

Y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N 1

 

 

 

 

 

 

268,25

 

227,05 ...

405,65

 

...

 

 

 

 

 

 

 

 

 

 

N 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1821,28

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

4982511,61

 

166083,72

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4826697,02

 

160889,90

 

 

 

 

 

 

 

Значения Q12 , Q22

 

расположены на главной диагонали матрицы cov(x) ,

следовательно:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Q12 34095,27

, Q1

184,65,

 

 

 

 

 

 

 

 

 

Q22

29004,82

, Q2

170,31,

 

 

 

 

 

 

 

 

 

кроме того,

Qy2 960496,75, Qy 980,05 .

Составим диагональную матрицу U из чисел Q j :

Q1.

U ..0

. .

.

0

 

 

 

 

 

 

.

 

 

 

 

Q

 

 

184,65

0

j

.

 

 

 

.

 

 

 

 

0

 

 

 

.

 

170,31

 

 

 

 

 

 

. .

.

 

 

 

 

 

Qm

 

 

 

Очевидно, что

 

1

0

 

 

 

 

 

 

 

 

0,00542

0

 

 

U 1 Q1

1

 

 

 

 

 

 

 

 

 

0

0,00587

.

 

0

 

 

 

 

 

 

Q2

 

 

 

 

 

 

 

 

Окончательно матрица коэффициентов корреляции независимых переменных примет вид:

R U 1 cov(x)U 1

0,00542

0

34095,27

27840,29 0,00542

0

 

 

 

 

 

 

 

 

 

.

 

 

0

0,00587

 

27840,29

 

0

0,00587

 

 

 

 

29004,82

 

184,65

150,77 0,00542

0

 

 

1

0,88530

 

 

 

 

 

 

 

 

 

 

 

0

0,00587

 

 

0,88530

1

.

163,47

170,31

 

 

 

Вычислим вектор коэффициентов корреляции зависимой и независимых переменных Ry:

 

 

 

 

1

U 1 cov( x, y)

 

1

 

 

0,00542

0

166083,72

 

 

R

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Qy

 

 

 

 

 

980,05

 

 

0

0,00587

 

 

 

 

 

 

 

 

 

 

 

 

 

 

160889,90

 

.

 

 

 

1

 

899,46

 

 

0,91777

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

980,05

 

 

 

 

0,96393

 

 

 

 

 

 

 

 

 

944,70

 

 

 

 

 

 

 

 

 

В результате проеденных вычислений получили следующую корреляционную матрицу:

 

Y

X1

X2

Y

1

0,91777

0,96393

X1

0,91777

1

0,88530

X2

0,96393

0,88530

1

Вектор коэффициентов корреляции зависимой и независимых переменных Ry показывает наличие сильной линейной связи результативного признака Y с регрессором Х1 ( ryx1 ≈ 0,918) и Х2 ( ryx2 ≈ 0,964).

Вместе с этим достаточно велика линейная связь между этими регрессорами, так как rx1x2 ≈ 0,885, что дает право признать их мультиколлинеарными.

Поскольку одним из условий корректного построения уравнения регрессии является независимость действия объясняющих факторов, то есть в идеале rx1x2 = 0, то, действуя формально, один из факторов следует исключить из регрессионной модели. Формально в уравнении регрессии целесообразно оставить фактор Х2, так как корреляция Х2 с результатом Y сильнее, чем корреляция фактора Х1 с Y (0,964>0,918).

Теснота связи зависимой переменной (Y) от совокупности независимых (X1, Х2) измеряется при помощи коэффициента множественной корреляции r, для данного примера он составит:

 

T

1

Ry

 

0,918

 

4,624

4,094

0,918

 

 

r

Ry R

 

 

 

 

 

 

 

 

 

 

 

 

0,964

4,094

4,624

 

0,964

 

 

 

 

 

 

 

 

 

 

 

 

0,2979

 

0,918

 

 

0,948676 0,974

 

0,7002

 

 

.

 

 

 

0,964

 

 

 

 

 

 

 

 

 

 

Полученный результат означает, что вариация Y практически полностью объясняется вариацией независимых переменных Х1 и Х2, то есть не имеет смысла учитывать какие-либо дополнительные переменные.

Рассчитаем коэффициент детерминации:

Q2

R2 Qy2ˆ или R2 r 2 100% 94,87% .

y

Такое значение коэффициента R2 показывает, что взаимодействие чистых активов (Х1) и привлеченных средств (Х2) объясняет 94,87% общей вариации прибыли (результативного признака Y), а на долю прочих факторов приходится лишь 5,13% ее вариации.

Таким образом, результаты корреляционного анализа формально дают повод усомниться в целесообразности построения модели двухфакторной регрессии.

Стоит оценивать однофакторную регрессионную модель, где в качестве объясняющего фактора выступает величина привлеченных средств банка, то есть Х2. Поэтому далее проиллюстрируем построение уравнения линейной однофакторной регрессии на основе исходных данных по оценочной выборке из 27 первых наблюдений Приложения 2.

2. Регрессионный анализ

Исходя из результатов корреляционного анализа, на начальной стадии исследования появились основания в качестве основного варианта модели прогноза принять однофакторную модель со свободным членом, то есть вида yˆ a0 a2 x2 . В дальнейшем проведем сравнение качества данной модели с другими вариантами регрессий, в том числе вида

yˆ a0 a1 x1 a2 x2 ; yˆ a1x1 a2 x2 ;

yˆ a2 x2 .

Подробные выкладки вычислений с целью иллюстрации метода будем проводить только для модели yˆ a0 a2 x2 .

Итак, в качестве основы для вычислений значений параметров однофакторной регрессионной зависимости воспользуемся формулой (4.13), причем матрица Z имеет вид

 

 

1

445,4

 

 

 

 

 

 

 

 

 

 

 

 

 

1

486,6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

507,0

 

 

 

 

 

 

 

 

 

 

Z

.

 

 

 

 

 

 

 

 

 

 

 

...

 

...

 

 

 

 

 

 

 

 

 

 

 

 

 

1

921,4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Вычисляя матрицу (Z T Z) 1 , имеем:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

445,4

 

 

 

 

 

 

 

1

 

1

...

1

 

1

486,6

 

27

18350

 

Z

T

 

 

 

 

 

Z

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

445,4

486,6

...

921,4

 

 

...

 

13010992

 

 

 

 

 

...

 

18350

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

921,4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Следовательно,

 

 

 

 

 

 

 

 

 

 

 

(Z T Z) 1

 

0,89259

 

0,00126

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

0,00126

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,0000019

 

 

 

 

 

 

Далее определим значения вектора Z T Y :

 

 

 

 

 

 

 

 

 

 

 

2296,5

 

 

 

 

 

 

 

 

 

 

 

 

 

1

1

 

...

1

 

2247,0

 

 

 

90258

 

 

 

 

 

Z

T

 

 

 

 

 

 

 

 

 

 

 

Y

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

445,4

486,6

 

...

921,4

 

...

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

64373046

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5113,3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Окончательно имеем:

 

 

 

 

 

 

 

 

 

 

 

 

a

 

 

(ZT Z ) 1 ZTY

 

0,89259

 

0,00126

90258

 

 

473,33

,

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,00126

 

0,0000019

 

 

 

 

5,62

 

 

a

 

 

 

 

 

 

 

 

64373046

 

 

 

то есть, получено следующее оцененное уравнение регрессии: yˆ 473,33 5,62x2 .

Графическая иллюстрация решаемой задачи приведена на рисунке 4.9.

Y

 

 

 

 

yˆ 473,33 5,62x2 , R2=91,15%

5000

 

 

 

 

(Xi,Yi)

 

 

 

 

 

 

 

4000

 

 

 

 

ei

 

y 3342,89

 

 

 

 

 

 

3000

 

 

 

 

 

 

2000

 

 

 

 

Yi

ˆ

 

 

 

 

 

Yi

1000

 

Y

 

 

 

 

1

Y

aˆ

 

5,62

 

X

2

 

X

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

aˆ0 473,33 100 200 300

 

400 500

 

600 700 800 900

1000 X

-1000

 

 

 

 

x 679,64

 

Рисунок 4.9 - Графическая иллюстрация результатов оценки параметров однофакторной регрессионной зависимости

Предварительно полученные результаты оценки регрессионной модели можно интерпретировать следующим образом:

1) свободный член уравнения регрессии не может быть интерпретирован в контексте исходных условий решаемой задачи;

2)коэффициент при переменной Х2 показывает, что с ростом привлеченных средств на 1 млн. руб. ожидаемая прибыль увеличивается в среднем на 5,62 тыс. руб.;

3)коэффициент эластичности анализируемой модели:

Эyx2 a1 XY2 5,62 3342,9679,6 1,14 .

Он показывает, что увеличение средней величины привлеченных средств (Х2) на 1% процент ведет к увеличению прибыли на 1,14%.

Оценим качество полученной модели, начиная с ее дисперсионного анализа.

3. Дисперсионный анализ

Вычислим основные составляющие (см. таблица 4.6) полной вариации объясняемой переменной.

Определить ее можно следующим образом:

Qy2 Qy2ˆ Q2 17021150,69 1651827,55 18672978,24

(есть ошибки округления, разница составляет -20,82 единиц или 0,00011%).

Таблица 4.6 - Фрагмент расчета составляющих полной вариации переменной y

№ банка

( yi y)2

( yˆi y)2

( yˆi yi )2

1

2

3

4

1

1094937,46

1729907,57

72289,42

2

1200980,57

1174877,79

143,40

3

941467,72

939678,12

0,85

26

2331140,86

1439374,40

106973,54

27

3134342,39

1842869,60

170473,26

Сумма

18672978,24

17021150,69

1651827,55

Cоставим таблицу дисперсионного анализа (таблица 4.7) и проверим модель на значимость. Иначе говоря, проверим гипотезу о существенности значений параметров полученной регрессии в целом.

Таблица 4.7 - Таблица дисперсионного анализа.

F ( 1, 2 )
1 m

Источник

 

Показатели

 

Число степеней

F-статистика

вариации

 

вариации

 

свободы

 

 

 

Модельная

Qy2ˆ

17021150,69

1

m 1

 

 

 

 

 

 

F 257,61

Остаточная

Q2

1651827,55

2

n m 1 25

 

Общая

Qy2

18672978,24

n 1 26

 

 

 

 

 

 

 

Проверка проводится на основе расчета критерия Фишера.

Вычисляется F-статистика (4.25), которая далее сравнивается с табличным значением распределения Фишера с и 2 n m 1 степенями свободы, где n – количество наблюдений, m – количество независимых переменных (X).

В нашем случае

 

 

1

 

 

 

 

ˆ

473,33

 

5,62x2

 

 

 

1, так как полученное уравнение y

 

содержит одну независимую переменную х2; 2

27 1 1 25 , где n=27, так как

уравнение строилось по выборке в 27 наблюдений.

 

 

 

Таким образом,

 

 

 

 

 

 

 

 

 

 

 

F

17021150,6

9 /

1651827,55

 

257,61 ,

 

 

 

 

1

 

 

 

 

25

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

а из

таблиц

распределения

Фишера

(Приложение 4)

определяем

F0,05 (m,n m 1) 4,24 .

 

 

 

 

 

 

 

 

 

 

 

Следовательно,

 

так

как

F F0,05 (1;25) ,

то есть 257,61 4,24 ,

 

то с

вероятностью 95% можно говорить о значимости в целом построенной модели регрессии.

Далее проанализируем значимость отдельных параметров уравнения регрессии, то есть a0 и a2 , с помощью t-критерия Стьюдента. Для этого на основе (4.26) определим t-статистику коэффициентов регрессии a j .

Заметим, что предварительно требуется оценить дисперсию ряда - s2 , а

также стандартные ошибки параметров регрессии - sa2j . Это возможно с учетом того, что ранее получены значения матрицы Z T Z 1 .

Таким образом,

s2

 

 

Q2

 

 

 

1651827,55

66073,10 .

 

n m 1

 

27 -1-1

 

 

 

 

 

 

 

Далее, используя диагональные элементы матрицы

Z

T

 

1

 

 

0,89259

0,00126

 

Z

 

 

 

 

 

 

 

, получаем:

 

 

 

 

 

 

 

 

 

 

0,00126

0,0000019

 

 

 

 

 

 

 

 

 

 

 

sa20

66091,93 0,893 58993,2 , следовательно sa0 242,89 ;

sa22

66091,93 0,0000019 0,122 , следовательно sa2 0,35 .

Тогда для соответствующих параметров регрессионной модели можно

определить

 

 

 

 

 

 

 

 

 

 

t0

 

 

a0

 

 

 

- 473,17

-1,95 ;

 

 

sa0

242,89

 

 

 

 

 

 

 

 

t2

 

 

a2

 

 

5,6

 

 

16,05 .

 

 

 

sa2

0,35

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Следовательно, при 5% уровне значимости коэффициент регрессии

a2

существенно отличен от 0, так как

 

t2

 

tтабл(0,05;25) 2,06 .

 

 

 

 

 

 

 

Коэффициент

регрессии a0 может быть признан незначимым, так как

 

t0

 

tтабл(0,05;25) 2,06

, а следовательно, исключен из уравнения регрессии.

В

 

 

результате переоценки параметра однофакторной модели без учета свободного члена получим следующее значимое уравнение регрессии:

yˆ 4,95x2 .

4. Проверка дополнительных информационных и прогностических свойств уравнения регрессии.

На этом этапе исследования предстоит изучить специфические характеристики свойств остаточной компоненты ряда. Это выражается в необходимости тестирования остаточных составляющих на соответствие исходным гипотезам Гаусса-Маркова. Далее, если возникнет дополнительная необходимость, следует оценить наличие автокорреляции в остатках, например, по DW-статистике, за тем проверить свойство их гомоскедастичности и др. В