Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
4
Добавлен:
19.01.2025
Размер:
2.21 Mб
Скачать

Приемлемой считается абсолютная процентная ошибка менее 15%, при этом о хорошем качестве модели можно говорить, если ошибка менее 5%. Значения обычного и исправленного коэффициентов детерминации низкие.

Ответ: модель обладает довольно низкой точностью. Средняя абсолютная процентная ошибка составляет 5,75%, исправленный коэффициент детерминации 35%.

5.4 Прогностические характеристики качества. Прогнозирование на факторных регрессионных моделях.

Задача для решения в классе (пример 5.4).

По данным 16 регионов ЦФО без Москвы и Московской области за 2012

год построена модель простой линейной регрессии

 

15,496,

0,027

среднемесячной номинальной начисленной заработной платы (

тыс. руб.) от

инвестиций в основной капитал на одного работника (

 

, тыс. руб.). Наблюдения

представленывтаблице66, графикразбросана

представленнарисунке28. Дайте

 

 

 

 

 

 

 

интервальный прогноз заработной платы для Ростовской области, где инвестиции в основной капитал составили 103,6 тыс. руб.

Решение

 

 

15,496

0,027

, чтобы

дать

прогноз

Воспользуемся

моделью

заработной

платы в

Ростовской

 

 

).

 

 

 

 

области (наблюдение №17,

 

Подставим

известное

 

значение

независимой переменной

осуществим

 

и

103,6

точечный прогноз значения заработной платы в регионе.

18,3

 

 

15,496

0,027

15,496

0,027 103,6

 

Построим 95%-й доверительный интервал для полученного прогноза по формуле для уравнения парной регрессии (64).

 

КРИТ

;

1

 

 

 

 

КРИТ

;

 

1

 

 

 

 

 

 

(64)

 

 

 

 

1

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Критическое значение определяется по таблицам распределения

Стъюдента.

 

0,05; 14

2,14.

 

 

 

 

 

наблюдения: КРИТ

Ошибка

прогноза

для

нового

 

 

 

 

 

 

 

91

 

 

 

 

 

 

 

 

1

 

103,6

124

 

 

 

 

1,51

1

 

1,51

1

0,0625

0,0015

16

 

274754,64

 

 

 

1,51

1,064

1,56

 

 

 

 

Получаем интервальный прогноз:

18,3 1,56 2,14

 

18,3

1,56 2,14

15,0

 

21,6

 

Чтобы показать, как доверительный интервал соотносится с масштабом зависимой переменной, рассчитаем долю ширины интервала в точечном прогнозе:

21,6

15,0

100% 0,185 100% 36%

18,3

Ответ: Точечный прогноз уровня заработной платы в регионе номер 17 (Ростовская область) составляет 18,3 тыс. руб., а истинное значение, согласно модели, с вероятностью 95% лежит в интервале от 15 до 21,6 тыс. руб.

5.2. Реализация этапа проверки качества регрессионной модели в Excel

Сопоставим названия критериев информационной пригодности модели с обозначениями в Excel.

Стандартная ошибка модели – стандартная ошибка.

Коэффициекнт детерминации – R-квадрат.

Скорректированный коэффициент детерминации - нормированный R- квадрат.

Коэффициент множественной корреляции – множественный R.

Коэффициент Акаике, Шварца , Хеннана-Куинна - в Excel не считаются. Отчет по характеристикам качества в Excel дополнен двумя

характеристиками, которые рассчитываются на основании коэффициента детерминации (рисунок 29):

множественный R ( ;

нормированный R-квадрат . Нормированный R-квадрат имеет смысл рассчитывать при большом числе независимых переменных,

92

а также при сравнении моделей с разным числом независимых переменных.

Информационные характеристики качества регрессионной модели в Excel по данным примера 5.1 представлен на рисунке 29.

Рис. 29. Отчет Excel «Регрессионная статистика» для данных пример 5.1

5.3.Задачи для самостоятельной отработки знаний, навыков

иумений по теме 5

 

 

Задача 1. Самостоятельная отработка навыков по теме 5.

 

 

На основании данных таблицы 68 построены две регрессионные модели:

 

 

Модель 1.

 

 

 

 

 

Модель 2. Y

 

 

РезультатыYпостроения ^2

 

 

 

 

 

модели представлены на рисунке 30.

 

 

Осуществите сравнение моделей по информационным характеристикам

качества ?

 

 

 

 

 

 

 

Таблица 68 – исходные данные для задачи 1. Самостоятельная отработка

навыков по теме 5.

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

Квартал

6,78

0,95

 

 

 

1

I квартал 2007

 

 

 

2

II квартал 2007

 

7,77

1,48

 

 

 

3

III квартал 2007

 

8,90

1,81

 

 

 

4

IV квартал 2007

 

9,80

2,74

 

 

 

5

I квартал 2008

 

8,90

1,40

 

 

 

6

II квартал 2008

10,26

2,09

 

 

 

7

III квартал 2008

11,59

2,47

 

 

 

8

IV квартал 2008

10,68

3,22

 

 

 

9

I квартал 2009

 

8,40

1,34

 

 

10

II квартал 2009

 

9,29

1,79

 

 

11

III квартал 2009

10,51

2,16

 

 

12

IV квартал 2009

10,90

3,09

 

 

93

Рис. 30 Результаты построения регрессионных моделей для решения задачи 1. Самостоятельная отработка навыков по теме 5.

Задача 2. Самостоятельная отработка навыков по теме 5.

Осуществите прогноз зависимой переменной KD если известно, что количество изучаемых дисциплин равно 49, а средний балл успеваемости равен

3.6

Для расчетов используйте две модели, представленные на рисунке 31:

Рисунок 31. Отчеты Excel для решения задачи 2. Самостоятельная отработка навыков по теме 5.

94

Рассчитайте прогностические способности обоих моделей, если известно что KD в прогнозном периоде равно 16. Постройте доверительный интервал прогноза по лучшей модели.

Задача 3. Самостоятельная отработка навыков по теме 5.

В результате изучения влияния предложения рабочей силы от ее стоимости была построенная однофакторная линейная регрессионная модель 40014,6 768,665 и доказана ее информационная пригодность на данных обучающей выборки. Рассчитайте показатели прогностической пригодности модели, если известны значения переменных на тестовом период (таблица 69) Предскажите значение предложения рабочей силы в I квартале 2021 года, если ожидается увеличение стоимости рабочей силы на 1% по сравнению последним наблюдением ретроспективного периода.

Таблица 69 – Данные и вспомогательные расчеты для решения задачи 3. Самостоятельная отработка навыков по теме 5.

Период

,

 

 

 

 

кварталы,

(2020 год)

I

120,418

52547

52783

 

236

 

II

121,05

53032

53118

 

86

 

III

122,36

54039

53952

 

87

 

IV

123,71

55077

54859

 

218

 

Задача 4. Самостоятельная отработка навыков по теме 5.

По макроэкономической статистике из таблицы 70 определите, используя информационные критерии Акаике и Шварца, какое количество переменных включать в модель множественной регрессии, если Y – ВВП.

Таблица 70 – Исходные данные к задаче 4. Самостоятельная отработка навыков по теме 5.

Страна

Гос. расходы

Валовое накопление

Экспорт

Импорт

ВВП

основного капитала

Армения

517,93

945,82

1002,68

1969,57

3997,63

Австрий

58,36

67,67

175,59

165,72

307,00

Беларусь

76806,16

173242,04

430540,09

406645,81

527385,07

Бельгия

93,57

78,00

319,03

314,54

376,23

Болгария

12,06

16,60

51,69

54,56

77,58

Хорватия

65,30

63,29

143,25

140,97

330,23

Куба

25,84

7,05

15,25

12,93

71,02

Кипр

3,44

2,43

7,71

8,18

17,72

Чехия

788,83

892,65

3032,63

2817,30

3845,93

Дания

521,64

312,55

991,76

901,31

1823,99

Эстония

3,35

4,40

15,77

15,73

17,42

Финляндия

48,31

37,72

78,12

79,76

192,54

Франция

502,73

402,46

557,57

602,62

2032,30

95

Страна

Гос. расходы

Валовое накопление

Экспорт

Импорт

ВВП

основного капитала

Германия

514,35

470,55

1381,03

1223,12

2666,40

Греция

34,40

25,47

52,31

62,05

193,75

Ирландия

29,43

17,43

176,74

136,99

163,94

Италия

314,96

283,13

473,47

455,81

1567,01

Латвия

2,49

3,54

9,56

10,17

15,52

Литва

20,00

19,01

95,47

94,54

113,73

Нидерланды

170,61

102,01

527,58

477,23

599,34

Польша

297,36

305,41

744,75

739,95

1595,23

Португалия

30,12

26,49

63,88

64,89

165,11

Сербия

682,59

604,29

1349,62

1952,95

3386,17

Словакия

12,52

14,30

68,68

64,96

71,10

Задача 5. Самостоятельная отработка навыков по теме 5.

В таблице 71 представлены данные по макроэкономическим показателям Германии. Определите, используяинформационныекритерии Акаикеи Шварца, какое количество переменных включать в модель множественной регрессии, если Y – темп роста ВВП.

Таблица 71 – Исходные данные к задаче 5 Самостоятельная отработка навыков по теме 5.

Год

Темп роста

Инфляция

Уровень

Изменение уровня

 

ВВП

 

безработицы

безработицы

 

 

 

 

 

2010

4,185

1,119

6,933

-0,734

2011

3,914

2,501

5,858

-1,075

2012

0,427

2,141

5,367

-0,491

2013

0,432

1,607

5,242

-0,125

2014

2,217

0,761

5,008

-0,234

2015

1,487

0,671

4,633

-0,375

2016

2,23

0,375

4,158

-0,475

2017

2,604

1,711

3,758

-0,4

2018

1,268

1,951

3,417

-0,341

2019

0,555

1,346

3,133

-0,284

5.4. Решение тестовых заданий по теме 5

 

Тестовое задание 1 по теме 5

 

Построена модель регрессии. Запишем модель в явном виде:

.

Y 10 2

Рассчитайте значение коэффициента Тейла, если известно, что фактическое значение зависимой переменой Y равно 32 при значении независимой переменной X, равной 10.

Решение

96

Коэффициент Тейла определяем по формуле (65) и показывает долю ошибки в фактических значениях. l – это число наблюдений тестового (прогнозного периода)

 

 

 

 

 

 

(65)

10

Найдем значение точечного прогноза для значения

10. 10 2

30

 

 

 

303232

 

0,0625

 

 

Ответ:

 

 

 

 

 

0,0625

 

 

 

 

 

 

Тестовое задание 2 по теме 5

Рассортируйте по корзинам показатели качества регрессионной модели:

коэффициент Тейла;

коэффициент детерминации;

стандартная ошибка модели;

стандартная ошибка прогноза;

средняя абсолютная процентная ошибка прогноза;

F-критерий Фишера;

t-критерий Стъюдента.

Перечень корзин:

Корзина 1 - Информационные характеристики качества; Корзина 2 – Прогностические характеристики качества.

Решение

Корзина 1 - Информационные характеристики качества:

коэффициент детерминации;

стандартная ошибка модели;

F-критерий Фишера.

Корзина 2 – Прогностические характеристики качества.

коэффициент Тейла;

средняя абсолютная процентная ошибка прогноза.

Стандартная ошибка прогноза и t-критерий Стъюдента не относятся к характеристикам качества регрессионной модели.

97

Тестовое задание 3 по теме 5

В таблице 72 представлены информационные и прогностические характеристики качества двух моделей: линейной и нелинейно модели регрессии. Какая из двух моделей является лучшей. По каким характеристикам это явно видно.

Таблица 72 - Сопоставление результатов оценки информационной и прогностической пригодности регрессионных моделей.

 

 

 

 

Информационные характеристики

Прогностические

 

Модель в явном виде

 

качества модели

характеристики

 

s

R2

РАСЧ

Kt

 

 

 

 

 

 

 

 

0,54

 

 

 

2,17575

0,618074

 

0,9694

443,83

0,02438

0,317

0,57

0,9768

427,73

0,1113

1,447

 

,

,

 

 

 

 

 

А.

Информационные характеристики качества

Б.

Прогностические характеристики качества

В.

Лучше модель

2,17575

0,618074

Г.

Лучше модель

,

,

Решение

На основании представленных характеристик качества информационные характеристики практически идентичны. Так как прогностические характеристики качества должны стремиться к нулю, то лучшей является нелинейная модель регрессии.

Ответ: Б, Г.

5.5. Решение варианта контрольной работы №2 по теме 5

Задача 1. Контрольная работа 2 по темам 4,5.

По результатам исследования выборки из 52 автомобилей построены две конкурирующиемоделидляпрогнозированиярекомендованнойрозничнойцены

(млн руб.) при различных факторах (таблица 73).

 

 

 

 

Известны диагональные элементы расширенных матриц

:

Модель №1

0,755;

0,000007;

0,0004;

.

Модель №2

 

0,000008

А) Проверьте

28,99;

0,00008;

0,000001;

 

0,000006.

 

каждую модель на значимость в целом, оцените значимость

оценок параметров.

98

Б) Рассчитайте все известные характеристики качества аппроксимации моделей и заполните таблицу 74. Укажите, какая модель наиболее точно объясняет ретроспективу.

Таблица73 – Исходные данные к задаче 1. Контрольная работа 2 по темам 4,5.

 

Вид

 

| |

 

 

|

|

 

 

 

 

 

 

 

 

 

1

 

2,96

0,009 1

0

22,46

18,18

12,4

24,49

 

64,83

 

 

 

 

0,046 2

 

 

 

 

 

 

 

 

2

 

8,78

0,0001 3

 

 

 

 

 

 

 

 

 

0,01 4

0

20,36

15,79

9,15

20,47

 

67,22

 

 

 

 

0,002 5

 

 

 

 

 

 

 

 

 

 

 

0,002 6

 

 

 

 

 

 

 

 

Таблица 74 – Форма для оценки качества аппроксимации моделей

№ модели

Характеристики качества аппроксимации

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

2

 

 

 

 

 

 

 

Решение

 

 

 

 

 

 

 

 

 

 

 

 

 

А) Проверим модели на значимость в целом.

 

 

H0: в генеральной совокупности все коэффициенты модели равны нулю,

H

 

: в

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

, т.е. модель в целом незначима.

 

 

 

 

1

 

генеральнойсовокупностихотябыодинкоэффициентнеравен нулю,

Гипотеза

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

, т.е. модель в целом значима.

 

 

 

 

 

 

 

 

проверяется по критерию Фишера Таблица А2 Приложения

АОшибка! Источник ссылки.

не найден. с критической границей КРИТ

 

; По

;

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

данным таблицы 73 рассчитаем F-статистики для каждой модели.

Модель №1:

 

 

 

 

 

 

64,83

 

18,18

 

 

модель

 

:

 

:

21,61: 0,38

 

РАСЧ

 

 

 

3

 

52

3 1

3

52 3 1

 

Модель №2:

56,87.

 

 

 

 

 

 

 

 

 

99

модель

 

 

 

:

 

67,22

:

 

15,79

22,41: 0,33

РАСЧ

 

3

 

 

52

3 1

3

52 3 1

 

 

полученные значения с табличным значением

 

Сравним

67,91.

 

 

 

 

 

 

 

вероятностью 95%. Оценки

.

 

 

 

. Обе модели значимы с

 

 

 

 

 

0,05; 3; 48

параметров в целом не равны нулю.

 

 

 

 

 

 

2,8

 

КРИТ

 

 

 

 

 

 

 

 

 

 

Проверим значимость отдельных параметров модели.

Рассчитаем значение t-статистики каждой оценки коэффициента в модели, чтобы проверить гипотезы о возможности исключения отдельных переменных. Расчётные значения критерия найдём по формуле (32).

 

Модель №1:

 

 

0,046;

 

 

0,0001;

 

 

 

 

 

 

 

 

 

 

2,96;

 

0,009;

 

 

0,000008;

 

 

 

 

 

 

 

0,755;

 

 

 

0,000007;

 

 

 

0,0004;

 

 

 

 

 

 

 

 

 

 

18,18

0,38;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

48

 

 

0,38 0,000007

 

0,000003,

 

 

 

 

 

0,38 0,755

0,287,

 

 

 

 

 

 

 

 

 

0,38 0,0004

 

0,0002,

 

 

0,38 0,000008

 

0,000003;

 

 

 

 

0,536,

 

0,0017,

 

0,014,

 

0,0017.

 

 

 

 

 

 

2,96

5,52,

 

 

0,009

 

 

5,29,

 

 

 

0,046

 

3,29,

 

 

 

0,536

0,0001

 

0,0017

 

 

 

 

 

 

0,014

 

 

 

 

 

 

 

 

 

 

0,0017

0,06.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Модель №2:

 

 

0,002;

 

0,002.

 

 

 

 

 

 

 

 

 

 

8,78;

 

0,01;

 

0,000006.

 

 

 

 

 

 

28,99;

 

 

 

0,00008;

 

 

0,000001;

 

 

 

 

 

 

Сравним полученное значение с табличным значением t-статистики с

2,84,

 

 

 

1,95,

 

 

 

 

 

3,48,

 

 

 

1,42.

 

 

 

 

 

числом степеней свободы

 

 

 

 

значения

t-статистик

 

. Получаем

 

 

 

 

 

 

 

 

 

. В модели

№1

48

 

 

КРИТ

 

 

0,05; 48 .

 

 

1 52

3

1

 

 

 

 

Оценки параметров

 

 

 

 

– статистически значимы и не равны

2,01

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

не

нулю в генеральной совокупности. Оценка параметра

 

статистически

 

КРИТ

 

 

 

 

 

 

 

 

 

 

 

 

,

,

 

 

 

 

 

 

 

 

 

 

3

значима. Значит, в модели №1 допущена ошибка спецификации, т.к. фактор

может быть исключен.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В

модели №2

значения

t-статистик

 

 

 

 

 

 

 

 

 

 

.

Оценки параметров

 

 

статистически значимы. Оценки параметров

 

 

 

 

 

 

 

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

100