Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

0721_Hairullina_Ekonometrika_ProdUroven_Praktik_2021

.pdf
Скачиваний:
0
Добавлен:
01.01.2024
Размер:
3.63 Mб
Скачать

-выполнить корреляционный анализ, сделать вывод о тесноте и направлении связи между Y и X;

-вычислить коэффициент детерминации. Сделать вывод.

-выполнить дисперсионный анализ. Протестировать статистическую гипотезу о достоверности уравнения регрессии при уровнях значимости а=0,05;

-протестировать статистические гипотезы о достоверности коэффициента корреляции r и коэффициентов регрессии a0, а1 при уровне значимости а=0,05;

-построить доверительные интервалы для статистически значимых параметров;

-вычислить среднюю ошибку аппроксимации.

Задание 2.2.10

Исходные данные. Имеется официальная статистическая информация о среднемесячной номинальной начисленной заработной плате работников и об инвестициях в основной капитал, таблица 10.

 

 

Таблица 10

 

Данные для расчета

 

 

 

 

 

 

Год

Среднемесячная номинальная начисленная

Инвестиции в основной

 

 

заработная плата работников, тыс. руб. (У)

капитал, трлн руб. (Х)

 

2009

18,64

7,98

 

2010

20,95

9,15

 

2011

23,37

11,04

 

2012

26,63

12,59

 

2013

29,79

13,45

 

2014

32,50

13,90

 

2015

34,03

13,90

 

2016

36,71

14,75

 

2017

39,17

16,03

 

2018

43,72

17,78

 

Справочно. Многие экономические зависимости не являются линейными по своей сути, поэтому использование для их изучения линейных моделей может привести к неадекватным

21

результатам. Для преобразования нелинейной модели к линейному виду необходимо линеаризовать модель, обычно с помощью преобразований переменных нелинейную модель представляют в виде линейного соотношения между преобразованными переменными. Далее оценивают коэффициенты этого соотношения и затем с помощью обратного преобразования находят оценки параметров исходной нелинейной модели. Однако, в ряде случаев невозможно подобрать подходящее преобразование. В этом случае приходится использовать методы нелинейной оптимизации.

Выделяются следующие модели:

-нелинейные по переменным (но линейные относительно параметров);

-модели нелинейные по оцениваемым параметрам. Оценка параметров моделей, нелинейных по объясняю-

щим переменным, но линейных по оцениваемым параметрам, не представляет особой сложности: в этом случае обычно используют замену переменных для сведения модели к линейной и оценки параметров с помощью обычного МНК (примененного к модели с замененными переменными), рисунок 3.

Рисунок 3. Преобразование нелинейных зависимостей к линейному виду Y = а0 + a1X + ε.

22

Требуется:

-построить следующие уравнения регрессии с одной объясняющей переменной: линейное, гиперболическое, логарифмическое;

-дать экономическую интерпретацию коэффициентам регрессий;

-вычислить коэффициент детерминации. Сделать вывод;

-вычислить среднюю относительную ошибку аппроксимации;

-сделать вывод о возможности использования регрессионной модели для прогнозирования;

-выбрать наилучшую модель для прогнозирования, используя для ранжирования моделей два критерия: коэффициент детерминации и среднюю относительную ошибку аппроксимации.

Задание 2.2.11

Исходные данные. Имеется официальная статистическая информация о среднемесячной номинальной начисленной заработной плате работников и об инвестициях в основной капитал, таблица 10 (задание 2.2.10). На основе использования программы Gretl были построены четыре модели, результаты которых представлены в таблицах 11-18.

Таблица 11

Результат расчёта по модели 1 (основные показатели)

Переменная

Коэффици-

Ст. ошибка

t-стати-

P-значение

Значи-

 

ент

 

стика

 

мость

const

−4427,64

2466,42

−1,795

0,1104

 

INV

2,67913

0,184581

14,51

<0,0001

***

Таблица 12

Результат расчёта по модели 1 (дополнительные показатели)

Показатель

Значение

Показатель

Значение

Среднее зав. перемен

30550,52

Ст. откл. зав. перемен

8186,473

Сумма кв. остатков

22066141

Ст. ошибка модели

1660,803

R-квадрат

0,963416

Испр. R-квадрат

0,958843

F(1, 8)

210,6753

Р-значение (F)

4,97e-07

Лог. правдоподобие

−87,22423

Крит. Акаике

178,4485

Крит. Шварца

179,0536

Крит. Хеннана-Куинна

177,7846

23

Таблица 13

Результат расчёта по модели 2 (основные показатели)

 

Коэффициент

Ст. ошибка

t-статистика

P-значение

 

const

−269193

30813,9

−8,736

<0,0001

***

l_INV

31716,1

3259,44

9,731

<0,0001

***

Таблица 14

Результат расчёта по модели 2 (дополнительные показатели)

Показатель

Значение

Показатель

Значение

Среднее зав. перемен

30550,52

Ст. откл. зав. перемен

8186,473

Сумма кв. остатков

46992162

Ст. ошибка модели

2423,638

R-квадрат

0,922091

Испр. R-квадрат

0,912352

F(1, 8)

94,68351

Р-значение (F)

0,000010

Лог. правдоподобие

−91,00392

Крит. Акаике

186,0078

Крит. Шварца

186,6130

Крит. Хеннана-Куинна

185,3440

Таблица 15

Результат расчёта по модели 3 (основные показатели)

 

Коэффициент

Ст. ошибка

t-статистика

P-значение

 

const

−0,178530

0,735049

−0,2429

0,8142

 

l_INV

1,10800

0,077752

14,25

<0,0001

***

Таблица 16

Результат расчёта по модели 3 (дополнительные показатели)

Показатель

Значение

 

Показатель

 

 

Значение

Среднее зав. перемен

10,29297

Ст. откл. зав. перемен

 

0,279984

Сумма кв. остатков

0,026740

Ст. ошибка модели

 

 

0,057815

R-квадрат

0,962099

Испр. R-квадрат

 

 

0,957361

F(1, 8)

 

 

203,0741

Р-значение (F)

 

 

5,73e-07

Лог. правдоподобие

15,43148

Крит. Акаике

 

 

−26,86296

Крит. Шварца

−26,25779

Крит. Хеннана-Куинна

 

−27,52683

 

 

 

 

 

 

 

 

Таблица 17

Результат расчёта по модели 4 (основные показатели)

 

Коэффициент

 

Ст. ошибка

 

t-статистика

 

P-значение

 

const

11731,0

 

1182,95

 

9,917

 

<0,0001

***

sq_INV

0,000105402

 

6,13610e-06

 

17,18

 

<0,0001

***

 

 

 

 

 

 

 

 

Таблица 18

Результат расчёта по модели 4 (дополнительные показатели)

Показатель

Значение

Показатель

Значение

Среднее зав. перемен

30550,52

Ст. откл. зав. перемен

8186,473

Сумма кв. остатков

15921916

Ст. ошибка модели

1410,758

R-квадрат

0,973603

Испр. R-квадрат

0,970303

F(1, 8)

295,0615

Р-значение (F)

1,34e-07

Лог. правдоподобие

−85,59250

Крит. Акаике

175,1850

Крит. Шварца

175,7902

Крит. Хеннана-Куинна

174,5211

24

Требуется: заполнить таблицу 19 и сделать вывод о наиболее подходящей модели для практического применения.

Таблица 19

Основные характеристики моделей для анализа

Модель

Уравнение

R2

Скор R2

AIC

BIC

1

 

 

 

 

 

2

 

 

 

 

 

3

 

 

 

 

 

4

 

 

 

 

 

Задание 2.2.12

Исходные данные. Имеется официальная статистическая информация о среднемесячной номинальной начисленной заработной плате работников и об инвестициях в основной капитал (задание 10). На основе использования программы Gretl была построена вспомогательная регрессия и проведен тест Рамсея, таблицы 20-23.

Таблица 20

Результат теста Рамсея по модели 1

 

Коэффициент

Ст. ошибка t-статистика

P-значение

 

 

 

 

 

 

const

80656,3

35130,7

2,296

0,0614

*

 

 

 

 

 

 

INV

−13,5024

6,89999

−1,957

0,0981

*

yhat^2

0,000195411

8,81472e-05

2,217

0,0685

*

 

 

 

 

 

 

yhat^3

−2,00340e-09

9,62768e-010

−2,081

0,0826

*

Тестовая статистика: F = 4,255639,

р-значение = P(F(2,6) > 4,25564) = 0,0707

Таблица 21

Результат теста Рамсея по модели 2

 

Коэффициент

Ст. ошибка t-статистика

P-значение

 

 

 

 

 

const

931746

776078

1,201

0,2752

 

 

 

 

 

l_INV

−104490

88569,6

−1,180

0,2828

 

 

 

 

 

yhat^2

0,000121977

0,000100255

1,217

0,2694

yhat^3

−1,02912e-09

1,14909e-09

−0,8956

0,4050

Тестовая статистика: F = 9,307849,

р-значение = P(F(2,6) > 9,30785) = 0,0145

25

Таблица 22

Результат теста Рамсея по модели 3

Коэффициент

Ст. ошибка

t-статистика P-значение

 

 

 

 

 

 

const

−1865,56

5699,32

−0,3273

0,7545

 

 

 

 

 

 

sq_INV

−0,000496918

0,000274107

−1,813

0,1198

 

 

 

 

 

 

 

yhat^2

0,000192814

8,51637e-05

2,264

 

0,0642

*

 

 

 

 

 

 

 

yhat^3

−2,06509e-09

8,90719e-010

−2,318

 

0,0596

*

Тестовая статистика: F = 3,005859,

р-значение = P(F(2,6) > 3,00586) = 0,125

Таблица 23

Результат теста Рамсея по модели 4

 

Коэффициент Ст. ошибка

t-статистика P-значение

 

 

 

 

 

const

1406,15

1000,27

1,406

0,2094

 

 

 

 

 

l_INV

−428,166

308,836

−1,386

0,2149

yhat^2

37,3919

27,2340

1,373

0,2189

 

 

 

 

 

yhat^3

−1,20209

0,886609

−1,356

0,2240

ВНИМАНИЕ: матрица данных близка к сингулярной!

Тестовая статистика: F = 3,471503,

р-значение = P(F(2,6) > 3,4715) = 0,0996

Требуется: сформулировать вывод о наиболее подходящей модели для практического применения и обосновать.

Задание 2.2.13

Исходные данные: имеется официальная статистическая информация о среднемесячной номинальной начисленной заработной плате работников и об инвестициях в основной капитал (задание 2.2.10). На основе использования программы Gretl была построена вспомогательная регрессия и проведен тест на гетероскедастичность (тест Вайта), таблицы 24-27.

Таблица 24 – Результат теста Вайта по модели 1

 

Коэффициент

Ст. ошибка t-статистика

P-значение

 

 

 

 

 

const

−8,91178e+06

1,15943e+07

−0,7686

0,4672

 

 

 

 

 

INV

2102,25

1872,73

1,123

0,2986

 

 

 

 

 

sq_INV

−0,0914486

0,0732902

−1,248

0,2522

Неисправленный R-квадрат = 0,258656

Тестовая статистика: TR^2 = 2,586559,

р-значение = P(Хи-квадрат(2) > 2,586559) = 0,274369

26

 

 

 

 

Таблица 25

 

Результат теста Вайта по модели 2

 

 

 

 

 

 

Коэффициент

Ст. ошибка t-статистика

P-значение

 

 

 

 

 

const

1,22481e+08

2,28404e+09

0,05362

0,9587

 

 

 

 

 

l_INV

−2,15750e+07

4,87546e+08

−0,04425

0,9659

 

 

 

 

 

sq_l_INV

963596

2,60039e+07

0,03706

0,9715

Неисправленный R-квадрат = 0,043333

Тестовая статистика: TR^2 = 0,433331,

р-значение = P(Хи-квадрат(2) > 0,433331) = 0,805199

 

 

 

 

Таблица 26

 

Результат теста Вайта по модели 3

 

 

 

 

 

 

Коэффициент

Ст. ошибка t-статистика

P-значение

 

 

 

 

 

const

−2,33593e+06

2,68850e+06

−0,8689

0,4137

 

 

 

 

 

sq_INV

0,0428933

0,0308583

1,390

0,2071

 

 

 

 

sq_sq_INV −1,00373e-010

8,16523e-011

−1,229

0,2587

Неисправленный R-квадрат = 0,242887

Тестовая статистика: TR^2 = 2,428875,

р-значение = P(Хи-квадрат(2) > 2,428875) = 0,296877

Таблица 27

Результат теста Вайта по модели 4

 

Коэффициент

Ст. ошибка

t-статистика

P-значение

 

 

 

 

 

const

−1,78836

1,27144

−1,407

0,2024

 

 

 

 

 

l_INV

0,385205

0,271398

1,419

0,1988

sq_l_INV

−0,0206938

0,0144754

−1,430

0,1959

Неисправленный R-квадрат = 0,276034

Тестовая статистика: TR^2 = 2,760337,

р-значение = P(Хи-квадрат(2) > 2,760337) = 0,251536

Требуется: сформулировать вывод о наличии гетероскедастичности моделей.

Задание 2.2.14

Исходные данные. Имеются следующие данные, представленные в таблице 28.

27

 

 

 

Таблица 28

 

Исходные данные

 

 

 

 

 

Наблюдения

 

У

Х

 

 

 

 

1

 

199,49

310,26

2

 

234,15

400,10

3

 

242,79

220,43

4

 

253,23

373,35

5

 

256,90

340,47

6

 

235,45

349,50

7

 

304,74

353,11

8

 

273,29

343,51

9

 

384,70

401,62

10

 

440,27

408,31

11

 

448,57

405,25

12

 

322,65

417,52

13

 

533,07

515,34

14

 

563,24

510,77

15

 

550,44

519,34

16

 

530,46

498,03

17

 

636,86

461,52

18

 

626,61

642,07

19

 

647,75

488,62

20

 

636,04

638,97

Требуется:

-проверить гипотезу о наличии гетероскесдастичности в линейной регрессии с помощью теста Спирмена на уровне значимости 0,05 и 0,01;

-построить график зависимости остатков от фактора Х;

-проверить гипотезу о наличии гетероскесдастичности в линейной регрессии с помощью теста Гольдфельда-Квандта на уровне значимости 0,05 и 0,01.

Задание 2.2.15

Исходные данные. Имеются данные о дисперсионном анализе выборки (всего наблюдений 20), представленном в таблице 29.

28

Таблица 29

Дисперсионный анализ по верхней выборке

Показатель

 

df

SS

MS

 

Верхняя выборка

 

Регрессия

 

2

1157,837

578,9187

Остаток

 

4

357,5073

89,37682

Итого

 

6

1515,345

 

 

Нижняя выборка

 

Регрессия

 

2

1884,397

942,1986

Остаток

 

4

1824,397

456,0992

Итого

 

6

3708,794

 

Имеются также данные по регрессионной статистике, таблица 30.

Таблица 30

Результаты регрессионной статистики по выборкам

Переменные

Коэффициенты

Стандартная ошибка

t-статистика

 

P-Значение

Нижние 95%

Верхние 95%

 

Нижние 95,0%

Верхние 95,0%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Верхняя выборка

 

 

 

 

Y-пе-

-34,303

44,710

-0,767

0,486

-158,437

89,831

 

158,437

89,831

ресе-

 

 

 

 

 

 

 

 

 

 

че-

 

 

 

 

 

 

 

 

 

 

ние

 

 

 

 

 

 

 

 

 

 

X1

0,641

0,202

3,177

0,034

0,081

1,202

 

0,081

1,202

X2

1132,054

340,824

3,322

0,029

185,775

2078,334

 

185,775

2078,334

 

 

 

Нижняя выборка

 

 

 

 

Y-пе-

213,602

78,308

2,728

0,053

-3,817

431,021

 

-3,817

431,021

ресе-

 

 

 

 

 

 

 

 

 

 

че-

 

 

 

 

 

 

 

 

 

 

ние

 

 

 

 

 

 

 

 

 

 

X1

0,577

0,296

1,952

0,123

-0,244

1,398

 

-0,244

1,398

X2

-1106,870

842,418

-1,314

0,259

-3445,800

1232,055

445,800

1232,055

Требуется:

1.Определить по каким уравнениям линейной регрессии осуществляется дисперсионный анализ.

2.Проверить гипотезу о наличии гетероскесдастичности в линейной регрессии с помощью теста ГольдфельдаКвандта на уровне значимости 0,05.

29

3. Модели множественной регрессии и корреляции

Цель практического занятия: получить навыки построе-

ния множественных уравнений регрессии и корреляции.

3.1.Изучаемые вопросы

1.Классический метод наименьших квадратов (МНК).

2.Основная характеристика качества модели, ее прогностической силы.

3.Коэффициент детерминации и расчетное или наблюдаемое значение F –статистики.

4.Экономическая интерпретация оценки множественной регрессии.

5.Значимость коэффициентов регрессии.

6.Проверка гипотез о значимости уравнения множественной регрессии и построение доверительных интервалов.

7.Коэффициент детерминации и F-критерий Фишера.

8.Полная коллинеарность и мультиколлинеарность факторов. Признаки мультиколлинеарности.

9.Фиктивные переменные.

10.Тесты на гетероскедастичность и тесты на спецификацию модели.

3.2.Практические задания

Задание 3.2.1

Исходные данные. Уравнение регрессии с одной объясняющей переменной уравнение вида:

Y = f (Х1, Х2, Х3…, Хm) + ε,

где Y – зависимая, объясняемая, результирующая, эндогенная переменная (показатель). Y-случайная (стохастичная) величина;

30