эконометрика для очно-заочного 4 курс 2024-2025 год / Эконометрика 2023
.pdf
Приемлемой считается абсолютная процентная ошибка менее 15%, при этом о хорошем качестве модели можно говорить, если ошибка менее 5%. Значения обычного и исправленного коэффициентов детерминации низкие.
Ответ: модель обладает довольно низкой точностью. Средняя абсолютная процентная ошибка составляет 5,75%, исправленный коэффициент детерминации 35%.
5.4 Прогностические характеристики качества. Прогнозирование на факторных регрессионных моделях.
Задача для решения в классе (пример 5.4).
По данным 16 регионов ЦФО без Москвы и Московской области за 2012
год построена модель простой линейной регрессии |
|
15,496, |
0,027 |
||||
среднемесячной номинальной начисленной заработной платы ( |
тыс. руб.) от |
||||||
инвестиций в основной капитал на одного работника ( |
|
, тыс. руб.). Наблюдения |
|||||
представленывтаблице66, графикразбросана |
представленнарисунке28. Дайте |
||||||
|
|
|
|
|
|
|
|
интервальный прогноз заработной платы для Ростовской области, где инвестиции в основной капитал составили 103,6 тыс. руб.
Решение |
|
|
15,496 |
0,027 |
, чтобы |
дать |
прогноз |
|
Воспользуемся |
моделью |
|||||||
заработной |
платы в |
Ростовской |
|
|
). |
|||
|
|
|
|
области (наблюдение №17, |
|
|||
Подставим |
известное |
|
значение |
независимой переменной |
осуществим |
|||
|
и |
103,6 |
||||||
точечный прогноз значения заработной платы в регионе. |
18,3 |
|
||||||
|
15,496 |
0,027 |
15,496 |
0,027 ∙ 103,6 |
|
|||
Построим 95%-й доверительный интервал для полученного прогноза по формуле для уравнения парной регрессии (64).
|
∙ КРИТ |
; |
1 |
|
|
|
|
∙ КРИТ |
; |
|
1 |
|
|
|
|
|
|
|
(64) |
||||||||
|
|
|
|
1 |
1 |
|
|
|
|
|
|||
|
|
|
|
|
∑ |
|
|
|
|
|
|||
|
Критическое значение определяется по таблицам распределения |
||||||||||||
Стъюдента. |
|
0,05; 14 |
2,14. |
|
|
|
|
|
|||||
наблюдения: КРИТ |
Ошибка |
прогноза |
для |
нового |
|||||||||
|
|
|
|
|
|
|
91 |
|
|
|
|
|
|
|
|
|
1 |
|
103,6 |
124 |
|
|
|
|
1,51 |
1 |
|
1,51 |
1 |
0,0625 |
0,0015 |
||||
16 |
|
274754,64 |
||||||||
|
|
|
1,51 |
1,064 |
1,56 |
|
|
|
|
|
Получаем интервальный прогноз:
18,3 1,56 ∙ 2,14 |
|
18,3 |
1,56 ∙ 2,14 |
15,0 |
|
21,6 |
|
Чтобы показать, как доверительный интервал соотносится с масштабом зависимой переменной, рассчитаем долю ширины интервала в точечном прогнозе:
21,6 |
15,0 |
∙ 100% 0,185 ∙ 100% 36% |
18,3 |
||
Ответ: Точечный прогноз уровня заработной платы в регионе номер 17 (Ростовская область) составляет 18,3 тыс. руб., а истинное значение, согласно модели, с вероятностью 95% лежит в интервале от 15 до 21,6 тыс. руб.
5.2. Реализация этапа проверки качества регрессионной модели в Excel
Сопоставим названия критериев информационной пригодности модели с обозначениями в Excel.
Стандартная ошибка модели – стандартная ошибка.
Коэффициекнт детерминации – R-квадрат.
Скорректированный коэффициент детерминации - нормированный R- квадрат.
Коэффициент множественной корреляции – множественный R.
Коэффициент Акаике, Шварца , Хеннана-Куинна - в Excel не считаются. Отчет по характеристикам качества в Excel дополнен двумя
характеристиками, которые рассчитываются на основании коэффициента детерминации (рисунок 29):
множественный R ( ;
нормированный R-квадрат . Нормированный R-квадрат имеет смысл рассчитывать при большом числе независимых переменных,
92
а также при сравнении моделей с разным числом независимых переменных.
Информационные характеристики качества регрессионной модели в Excel по данным примера 5.1 представлен на рисунке 29.
Рис. 29. Отчет Excel «Регрессионная статистика» для данных пример 5.1
5.3.Задачи для самостоятельной отработки знаний, навыков
иумений по теме 5
|
|
Задача 1. Самостоятельная отработка навыков по теме 5. |
|||||
|
|
На основании данных таблицы 68 построены две регрессионные модели: |
|||||
|
|
Модель 1. |
|
|
|
||
|
|
Модель 2. Y |
|||||
|
|
РезультатыYпостроения ^2 |
|||||
|
|
|
|
|
модели представлены на рисунке 30. |
||
|
|
Осуществите сравнение моделей по информационным характеристикам |
|||||
качества ? |
|
|
|
|
|
||
|
|
Таблица 68 – исходные данные для задачи 1. Самостоятельная отработка |
|||||
навыков по теме 5. |
|
|
|
|
|
||
|
|
|
|
|
|
|
|
t |
|
Квартал |
6,78 |
0,95 |
|
|
|
|
1 |
I квартал 2007 |
|
|
|||
|
2 |
II квартал 2007 |
|
7,77 |
1,48 |
|
|
|
3 |
III квартал 2007 |
|
8,90 |
1,81 |
|
|
|
4 |
IV квартал 2007 |
|
9,80 |
2,74 |
|
|
|
5 |
I квартал 2008 |
|
8,90 |
1,40 |
|
|
|
6 |
II квартал 2008 |
10,26 |
2,09 |
|
|
|
|
7 |
III квартал 2008 |
11,59 |
2,47 |
|
|
|
|
8 |
IV квартал 2008 |
10,68 |
3,22 |
|
|
|
|
9 |
I квартал 2009 |
|
8,40 |
1,34 |
|
|
10 |
II квартал 2009 |
|
9,29 |
1,79 |
|
|
|
11 |
III квартал 2009 |
10,51 |
2,16 |
|
|
||
12 |
IV квартал 2009 |
10,90 |
3,09 |
|
|
||
93
Рис. 30 Результаты построения регрессионных моделей для решения задачи 1. Самостоятельная отработка навыков по теме 5.
Задача 2. Самостоятельная отработка навыков по теме 5.
Осуществите прогноз зависимой переменной KD если известно, что количество изучаемых дисциплин равно 49, а средний балл успеваемости равен
3.6
Для расчетов используйте две модели, представленные на рисунке 31:
Рисунок 31. Отчеты Excel для решения задачи 2. Самостоятельная отработка навыков по теме 5.
94
Рассчитайте прогностические способности обоих моделей, если известно что KD в прогнозном периоде равно 16. Постройте доверительный интервал прогноза по лучшей модели.
Задача 3. Самостоятельная отработка навыков по теме 5.
В результате изучения влияния предложения рабочей силы от ее стоимости была построенная однофакторная линейная регрессионная модель 40014,6 768,665 ∙ и доказана ее информационная пригодность на данных обучающей выборки. Рассчитайте показатели прогностической пригодности модели, если известны значения переменных на тестовом период (таблица 69) Предскажите значение предложения рабочей силы в I квартале 2021 года, если ожидается увеличение стоимости рабочей силы на 1% по сравнению последним наблюдением ретроспективного периода.
Таблица 69 – Данные и вспомогательные расчеты для решения задачи 3. Самостоятельная отработка навыков по теме 5.
Период |
, |
|
|
∆ |
|
|
кварталы, |
||||||
(2020 год) |
||||||
I |
120,418 |
52547 |
52783 |
|
236 |
|
II |
121,05 |
53032 |
53118 |
|
86 |
|
III |
122,36 |
54039 |
53952 |
|
87 |
|
IV |
123,71 |
55077 |
54859 |
|
218 |
|
Задача 4. Самостоятельная отработка навыков по теме 5.
По макроэкономической статистике из таблицы 70 определите, используя информационные критерии Акаике и Шварца, какое количество переменных включать в модель множественной регрессии, если Y – ВВП.
Таблица 70 – Исходные данные к задаче 4. Самостоятельная отработка навыков по теме 5.
Страна |
Гос. расходы |
Валовое накопление |
Экспорт |
Импорт |
ВВП |
основного капитала |
|||||
Армения |
517,93 |
945,82 |
1002,68 |
1969,57 |
3997,63 |
Австрий |
58,36 |
67,67 |
175,59 |
165,72 |
307,00 |
Беларусь |
76806,16 |
173242,04 |
430540,09 |
406645,81 |
527385,07 |
Бельгия |
93,57 |
78,00 |
319,03 |
314,54 |
376,23 |
Болгария |
12,06 |
16,60 |
51,69 |
54,56 |
77,58 |
Хорватия |
65,30 |
63,29 |
143,25 |
140,97 |
330,23 |
Куба |
25,84 |
7,05 |
15,25 |
12,93 |
71,02 |
Кипр |
3,44 |
2,43 |
7,71 |
8,18 |
17,72 |
Чехия |
788,83 |
892,65 |
3032,63 |
2817,30 |
3845,93 |
Дания |
521,64 |
312,55 |
991,76 |
901,31 |
1823,99 |
Эстония |
3,35 |
4,40 |
15,77 |
15,73 |
17,42 |
Финляндия |
48,31 |
37,72 |
78,12 |
79,76 |
192,54 |
Франция |
502,73 |
402,46 |
557,57 |
602,62 |
2032,30 |
95
Страна |
Гос. расходы |
Валовое накопление |
Экспорт |
Импорт |
ВВП |
основного капитала |
|||||
Германия |
514,35 |
470,55 |
1381,03 |
1223,12 |
2666,40 |
Греция |
34,40 |
25,47 |
52,31 |
62,05 |
193,75 |
Ирландия |
29,43 |
17,43 |
176,74 |
136,99 |
163,94 |
Италия |
314,96 |
283,13 |
473,47 |
455,81 |
1567,01 |
Латвия |
2,49 |
3,54 |
9,56 |
10,17 |
15,52 |
Литва |
20,00 |
19,01 |
95,47 |
94,54 |
113,73 |
Нидерланды |
170,61 |
102,01 |
527,58 |
477,23 |
599,34 |
Польша |
297,36 |
305,41 |
744,75 |
739,95 |
1595,23 |
Португалия |
30,12 |
26,49 |
63,88 |
64,89 |
165,11 |
Сербия |
682,59 |
604,29 |
1349,62 |
1952,95 |
3386,17 |
Словакия |
12,52 |
14,30 |
68,68 |
64,96 |
71,10 |
Задача 5. Самостоятельная отработка навыков по теме 5.
В таблице 71 представлены данные по макроэкономическим показателям Германии. Определите, используяинформационныекритерии Акаикеи Шварца, какое количество переменных включать в модель множественной регрессии, если Y – темп роста ВВП.
Таблица 71 – Исходные данные к задаче 5 Самостоятельная отработка навыков по теме 5.
Год |
Темп роста |
Инфляция |
Уровень |
Изменение уровня |
|
ВВП |
|
безработицы |
безработицы |
|
|
|
|
|
2010 |
4,185 |
1,119 |
6,933 |
-0,734 |
2011 |
3,914 |
2,501 |
5,858 |
-1,075 |
2012 |
0,427 |
2,141 |
5,367 |
-0,491 |
2013 |
0,432 |
1,607 |
5,242 |
-0,125 |
2014 |
2,217 |
0,761 |
5,008 |
-0,234 |
2015 |
1,487 |
0,671 |
4,633 |
-0,375 |
2016 |
2,23 |
0,375 |
4,158 |
-0,475 |
2017 |
2,604 |
1,711 |
3,758 |
-0,4 |
2018 |
1,268 |
1,951 |
3,417 |
-0,341 |
2019 |
0,555 |
1,346 |
3,133 |
-0,284 |
5.4. Решение тестовых заданий по теме 5 |
|
Тестовое задание 1 по теме 5 |
|
Построена модель регрессии. Запишем модель в явном виде: |
. |
Y 10 2
Рассчитайте значение коэффициента Тейла, если известно, что фактическое значение зависимой переменой Y равно 32 при значении независимой переменной X, равной 10.
Решение
96
Коэффициент Тейла определяем по формуле (65) и показывает долю ошибки в фактических значениях. l – это число наблюдений тестового (прогнозного периода)
|
|
|
|
∑ ∑ |
|
|
(65) |
||
10 |
Найдем значение точечного прогноза для значения |
10. 10 2 ∙ |
|||||||
30 |
|
|
|
303232 |
|
0,0625 |
|
||
|
Ответ: |
|
|
|
|||||
|
|
0,0625 |
|
|
|
|
|
|
|
Тестовое задание 2 по теме 5
Рассортируйте по корзинам показатели качества регрессионной модели:
коэффициент Тейла;
коэффициент детерминации;
стандартная ошибка модели;
стандартная ошибка прогноза;
средняя абсолютная процентная ошибка прогноза;
F-критерий Фишера;
t-критерий Стъюдента.
Перечень корзин:
Корзина 1 - Информационные характеристики качества; Корзина 2 – Прогностические характеристики качества.
Решение
Корзина 1 - Информационные характеристики качества:
коэффициент детерминации;
стандартная ошибка модели;
F-критерий Фишера.
Корзина 2 – Прогностические характеристики качества.
коэффициент Тейла;
средняя абсолютная процентная ошибка прогноза.
Стандартная ошибка прогноза и t-критерий Стъюдента не относятся к характеристикам качества регрессионной модели.
97
Тестовое задание 3 по теме 5
В таблице 72 представлены информационные и прогностические характеристики качества двух моделей: линейной и нелинейно модели регрессии. Какая из двух моделей является лучшей. По каким характеристикам это явно видно.
Таблица 72 - Сопоставление результатов оценки информационной и прогностической пригодности регрессионных моделей.
|
|
|
|
Информационные характеристики |
Прогностические |
|||
|
Модель в явном виде |
|
качества модели |
характеристики |
||||
|
s |
R2 |
РАСЧ |
Kt |
∆ |
|||
|
|
|
|
|||||
|
|
|
|
0,54 |
|
|
||
|
2,17575 |
0,618074 ∙ |
|
0,9694 |
443,83 |
0,02438 |
0,317 |
|
0,57 |
0,9768 |
427,73 |
0,1113 |
1,447 |
||||
|
, |
, |
∙ |
|
|
|
|
|
А. |
Информационные характеристики качества |
|||
Б. |
Прогностические характеристики качества |
|||
В. |
Лучше модель |
2,17575 |
0,618074 ∙ |
|
Г. |
Лучше модель |
, |
, |
∙ |
Решение
На основании представленных характеристик качества информационные характеристики практически идентичны. Так как прогностические характеристики качества должны стремиться к нулю, то лучшей является нелинейная модель регрессии.
Ответ: Б, Г.
5.5. Решение варианта контрольной работы №2 по теме 5
Задача 1. Контрольная работа 2 по темам 4,5.
По результатам исследования выборки из 52 автомобилей построены две конкурирующиемоделидляпрогнозированиярекомендованнойрозничнойцены
(млн руб.) при различных факторах (таблица 73). |
|
|
|
|
||
Известны диагональные элементы расширенных матриц |
: |
|||||
Модель №1 |
0,755; |
0,000007; |
0,0004; |
. |
||
Модель №2 |
|
0,000008 |
||||
А) Проверьте |
28,99; |
0,00008; |
0,000001; |
|
0,000006. |
|
|
каждую модель на значимость в целом, оцените значимость |
|||||
оценок параметров.
98
Б) Рассчитайте все известные характеристики качества аппроксимации моделей и заполните таблицу 74. Укажите, какая модель наиболее точно объясняет ретроспективу.
Таблица73 – Исходные данные к задаче 1. Контрольная работа 2 по темам 4,5.
№ |
|
Вид |
|
| | |
|
|
| |
| |
|
|
|
|
|
|
|
|
|
|
|||||
1 |
|
2,96 |
0,009 1 |
0 |
22,46 |
18,18 |
12,4 |
24,49 |
|
64,83 |
|
|
|
|
0,046 2 |
|
|
|
|
|
|
|
|
2 |
|
8,78 |
0,0001 3 |
|
|
|
|
|
|
|
|
|
0,01 4 |
0 |
20,36 |
15,79 |
9,15 |
20,47 |
|
67,22 |
|
||
|
|
|
0,002 5 |
|
|
|
|
|
|
|
|
|
|
|
0,002 6 |
|
|
|
|
|
|
|
|
Таблица 74 – Форма для оценки качества аппроксимации моделей
№ модели |
Характеристики качества аппроксимации |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
Решение |
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
А) Проверим модели на значимость в целом. |
|
|
|||||||||||||
H0: в генеральной совокупности все коэффициенты модели равны нулю, |
||||||||||||||||
H |
|
: в |
0 |
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
, т.е. модель в целом незначима. |
|
|
|
||||||||
|
1 |
|
генеральнойсовокупностихотябыодинкоэффициентнеравен нулю, |
|||||||||||||
Гипотеза |
0 |
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
, т.е. модель в целом значима. |
|
|
|
||||||||
|
|
|
|
|
проверяется по критерию Фишера Таблица А2 Приложения |
|||||||||||
АОшибка! Источник ссылки. |
не найден. с критической границей КРИТ |
|||||||||||||||
|
; По |
; |
|
|
|
1 |
|
|
|
|
|
|
|
|
||
|
|
|
|
данным таблицы 73 рассчитаем F-статистики для каждой модели. |
||||||||||||
Модель №1: |
∑ |
|
|
|
|
|
∑ |
|
64,83 |
|
18,18 |
|
||||
|
модель |
|
: |
|
: |
21,61: 0,38 |
||||||||||
|
РАСЧ |
|
|
|
3 |
|
52 |
3 1 |
3 |
52 3 1 |
||||||
|
Модель №2: |
56,87. |
|
|
|
|
|
|
|
|
|
|||||
99
модель |
|
∑ |
|
|
: |
∑ |
|
67,22 |
: |
|
15,79 |
22,41: 0,33 |
РАСЧ |
|
3 |
|
|
52 |
3 1 |
3 |
52 3 1 |
||||
|
|
полученные значения с табличным значением |
|
|||||||||
Сравним |
67,91. |
|
|
|
|
|
|
|
вероятностью 95%. Оценки |
|||
. |
|
|
|
. Обе модели значимы с |
||||||||
|
|
|
|
|
0,05; 3; 48 |
|||||||
параметров в целом не равны нулю. |
|
|
|
|
|
|
||||||
2,8 |
|
КРИТ |
|
|
|
|
|
|
|
|
|
|
Проверим значимость отдельных параметров модели.
Рассчитаем значение t-статистики каждой оценки коэффициента в модели, чтобы проверить гипотезы о возможности исключения отдельных переменных. Расчётные значения критерия найдём по формуле (32).
|
Модель №1: |
|
|
0,046; |
|
|
0,0001; |
|
|
|
|
|
|
|
|
|
|
|||||||||||
2,96; |
|
0,009; |
|
|
0,000008; |
|
|
|
|
|
|
|||||||||||||||||
|
0,755; |
|
|
|
0,000007; |
|
|
|
0,0004; |
|
|
|
|
|
|
|
||||||||||||
|
∑ |
|
|
18,18 |
0,38; |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
1 |
|
|
|
48 |
|
|
0,38 ∙ 0,000007 |
|
0,000003, |
|
|
|
|
|||||||||||||
|
0,38 ∙ 0,755 |
0,287, |
|
|
|
|
|
|
|
|
||||||||||||||||||
|
0,38 ∙ 0,0004 |
|
0,0002, |
|
|
0,38 ∙ 0,000008 |
|
0,000003; |
|
|
|
|||||||||||||||||
|
0,536, |
|
0,0017, |
|
0,014, |
|
0,0017. |
|
|
|
|
|
||||||||||||||||
|
2,96 |
5,52, |
|
|
0,009 |
|
|
5,29, |
|
|
|
0,046 |
|
3,29, |
|
|
||||||||||||
|
0,536 |
0,0001 |
|
0,0017 |
|
|
|
|
|
|
0,014 |
|
|
|
|
|
||||||||||||
|
|
|
|
|
0,0017 |
0,06. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
Модель №2: |
|
|
0,002; |
|
0,002. |
|
|
|
|
|
|
|
|
|
|
||||||||||||
8,78; |
|
0,01; |
|
0,000006. |
|
|
|
|
|
|||||||||||||||||||
|
28,99; |
|
|
|
0,00008; |
|
|
0,000001; |
|
|
|
|
|
|||||||||||||||
|
Сравним полученное значение с табличным значением t-статистики с |
|||||||||||||||||||||||||||
2,84, |
|
|
|
1,95, |
|
|
|
|
|
3,48, |
|
|
|
1,42. |
|
|
|
|
|
|||||||||
числом степеней свободы |
|
|
|
|
значения |
t-статистик |
|
. Получаем |
|
|
|
|||||||||||||||||
|
|
|
|
|
|
. В модели |
№1 |
48 |
|
|
КРИТ |
|
||||||||||||||||
|
0,05; 48 . |
|
|
1 52 |
3 |
1 |
|
|
|
|
||||||||||||||||||
Оценки параметров |
|
|
|
|
– статистически значимы и не равны |
|||||||||||||||||||||||
2,01 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
не |
||||||
нулю в генеральной совокупности. Оценка параметра |
|
статистически |
|
|||||||||||||||||||||||||
КРИТ |
|
|
|
|
|
|
|
|
|
|
|
|
, |
, |
|
|
|
|
|
|
|
|
|
|
3 |
|||
значима. Значит, в модели №1 допущена ошибка спецификации, т.к. фактор |
||||||||||||||||||||||||||||
может быть исключен. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
В |
модели №2 |
значения |
t-статистик |
|
|
|
|
|
|
|
|
|
|
. |
|||||||||||||
Оценки параметров |
|
|
статистически значимы. Оценки параметров |
– |
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
100 |
|
|
|
|
|
|
|
|
|
|
|
|
||
