Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Пособие_Часть_2_корр1.doc
Скачиваний:
52
Добавлен:
06.12.2018
Размер:
7.01 Mб
Скачать

3. Обобщенный регрессионный анализ

Пример 5. В табл. 23 представлены данные о потребительских расходах (у, у.е.) и располагаемом доходе (х, у.е.) тридцати семей. Проверьте эти данные на наличие гетероскедастичности, используя: 1) критерий Уайта; 2) критерий Бреуша – Пагана.

Т а б л и ц а 23

№ п.п.

у

х

 № п.п.

у

х

 № п.п.

у

х

1.

10700

12000

11.

10900

12000

21.

11200

12000

2.

11400

13000

12.

11700

13000

22.

12100

13000

3.

12300

14000

13.

12600

14000

23.

13200

14000

4.

13000

15000

14.

13300

15000

24.

13600

15000

5.

13800

16000

15.

14000

16000

25.

14200

16000

6.

14400

17000

16.

14900

17000

26.

15300

17000

7.

15000

18000

17.

15700

18000

27.

16400

18000

8.

15900

19000

18.

16500

19000

28.

16900

19000

9.

16900

20000

19.

17500

20000

29.

18100

20000

10.

17200

21000

20.

17800

21000

30.

18500

21000

Решение с помощью табличного процессора Excel

  1. Ввод исходных данных.

  2. Построение регрессионного уравнения с помощью пакета анализа (см. Вывод итогов 6)

ВЫВОД ИТОГОВ 6

Регрессионная статистика

Множественный R

0,984083

R-квадрат

0,968419

Нормированный R-квадрат

0,967291

Стандартная ошибка

420,4049

Наблюдения

30

Дисперсионный анализ

 

df

SS

MS

F

Значимость F

Регрессия

1

1,52E+08

1,52E+08

858,6118

1,49E-22

Остаток

28

4948727

176740,3

Итого

29

1,57E+08

 

 

 

 

Коэффи-циенты

Стандартная ошибка

t-статис-тика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

1580

447,5552

3,530291

0,001457

663,2238

2496,776

Переменная X 1

0,78303

0,026723

29,30208

1,49E-22

0,728291

0,837769

  1. Получение расчетных значений и вычисление остатков и , . Оформление результатов расчетов в виде табл. 24.

Т а б л и ц а 24

№ п.п.

№ п.п.

1.

10700

10976,36

76376,86

16.

14900

14891,52

71,99

2.

11400

11759,39

129164,00

17.

15700

15674,55

647,93

3.

12300

12542,42

58769,51

18.

16500

16457,58

1799,82

4.

13000

13325,45

105920,66

19.

17500

17240,61

67285,22

5.

13800

14108,48

95162,90

20.

17800

18023,64

50013,22

6.

14400

14891,52

241587,14

21.

11200

10976,36

50013,22

7.

15000

15674,55

455011,57

22.

12100

11759,39

116012,49

8.

15900

16457,58

310890,73

23.

13200

12542,42

432405,88

9.

16900

17240,61

116012,49

24.

13600

13325,45

75375,21

10.

17200

18023,64

678376,86

25.

14200

14108,48

8375,02

11.

10900

10976,36

5831,40

26.

15300

14891,52

166859,87

12.

11700

11759,39

3527,64

27.

16400

15674,55

526284,30

13.

12600

12542,42

3314,97

28.

16900

16457,58

195739,21

14.

13300

13325,45

647,93

29.

18100

17240,61

738557,94

15.

14000

14108,48

11768,96

30.

18500

18023,64

226922,31

  1. Построение графика квадратов остатков (см. рис. 12). График зависимости квадратов остатков регрессии от независимой переменной имеет вид, вынуждающий предполагать гетероскедастичность.

Р и с. 12. График зависимости квадратов остатков от величины дохода

  1. Проверка данных с помощью теста Уайта.

5.1. Вычисление и построение регрессионного уравнения (см. Вывод итогов 7) .

5.2. Расчет и сравнение этой величины с критическим значением . Результаты сравнения позволяют отвергнуть нуль-гипотезу (отсутствие гетероскедастичности).

ВЫВОД ИТОГОВ 7

Регрессионная статистика

Множественный R

0,440291

R-квадрат

0,193856

Нормированный R-квадрат

0,134142

Стандартная ошибка

190982,8

Наблюдения

30

Дисперсионный анализ

 

df

SS

MS

F

Значимость F

Регрессия

2

2,37E+11

1,18E+11

3,246397

0,054521

Остаток

27

9,85E+11

3,65E+10

Итого

29

1,22E+12

 

 

 

 

Коэффи-циенты

Стандартная ошибка

t-статис-тика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

427676,8

1283048

0,333329

0,741461

-2204919

3060273

Переменная X 1

-64,7853

158,8192

-0,40792

0,68655

-390,655

261,0846

Переменная X 2

0,002874

0,004799

0,598982

0,554178

-0,00697

0,01272

  1. Проверка данных с помощью теста Бреуша – Пагана.

6.1. Вычисление оценки дисперсии

.

6.2. Расчет и построение регрессионного уравнения (см. Вывод итогов 8) .

ВЫВОД ИТОГОВ 8

Регрессионная статистика

Множественный R

0,427954

R-квадрат

0,183144

Нормированный R-квадрат

0,153971

Стандартная ошибка

1,144436

Наблюдения

30

Дисперсионный анализ

 

df

SS

MS

F

Значимость F

Регрессия

1

8,222216

8,222216

6,27778

0,018316

Остаток

28

36,67252

1,309733

Итого

29

44,89474

 

 

 

 

Коэффи-циенты

Стандартная ошибка

t-статис-тика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

-2,0074

1,218345

-1,64764

0,110604

-4,50307

0,488272

Переменная X 1

0,000182

7,27E-05

2,50555

0,018316

3,33E-05

0,000331

6.3. Вычисление среднего, расчетных значений, квадратов отклонений расчетных значений от среднего и RSS как суммы квадратов этих отклонений. Оформление результатов расчетов в виде табл. 25.

Т а б л и ц а 25

№ п.п.

№ п.п.

1.

10700

0,4630

0,1798

0,6727

16.

14900

0,0004

1,0911

0,0083

2.

11400

0,7830

0,3621

0,4070

17.

15700

0,0039

1,2734

0,0747

3.

12300

0,3563

0,5443

0,2076

18.

16500

0,0109

1,4557

0,2076

4.

13000

0,6421

0,7266

0,0747

19.

17500

0,4079

1,6379

0,4070

5.

13800

0,5769

0,9089

0,0083

20.

17800

0,3032

1,8202

0,6727

6.

14400

1,4645

1,0911

0,0083

21.

11200

0,3032

0,1798

0,6727

7.

15000

2,7584

1,2734

0,0747

22.

12100

0,7033

0,3621

0,4070

8.

15900

1,8847

1,4557

0,2076

23.

13200

2,6213

0,5443

0,2076

9.

16900

0,7033

1,6379

0,4070

24.

13600

0,4569

0,7266

0,0747

10.

17200

4,1124

1,8202

0,6727

25.

14200

0,0508

0,9089

0,0083

11.

10900

0,0354

0,1798

0,6727

26.

15300

1,0115

1,0911

0,0083

12.

11700

0,0214

0,3621

0,4070

27.

16400

3,1904

1,2734

0,0747

13.

12600

0,0201

0,5443

0,2076

28.

16900

1,1866

1,4557

0,2076

14.

13300

0,0039

0,7266

0,0747

29.

18100

4,4773

1,6379

0,4070

15.

14000

0,0713

0,9089

0,0083

30.

18500

1,3756

1,8202

0,6727

  

СРЗНАЧ

RSS

1,0000

8,2222

6.4. Вычисление статистики RSS/2 = 8,22/2 = 4,11. При нулевой гипотезе отсутствия гетероскедастичности эта статистика имеет распределение , 95%-критическое значение которой равно 3,84. Поскольку 4,11 > 3,84, гипотеза о гомоскедастичности отвергается.

Пример 6. По данным табл. 26 постройте линейную регрессионную модель, характеризующую зависимость показателя от факторов и .

Т а б л и ц а 26

1.

13

43

79

11.

58

161

207

2.

28

56

110

12.

23

108

152

3.

33

24

97

13.

69

86

199

4.

42

98

171

14.

8

143

144

5.

12

176

204

15.

60

42

140

6.

44

124

174

16.

11

199

183

7.

36

130

184

17.

26

145

178

8.

33

291

311

18.

61

115

185

9.

34

141

206

19.

18

111

152

10.

21

95

128

20.

30

192

204

Построение модели следует начать с тестирования на гетероскедастичность. Считая наиболее вероятной ситуацию с двухуровневой дисперсией, используйте для проверки тест Голдфельда – Куандта. Если проверкой будет установлена неоднородность данных, то при построении модели примените многоэтапную процедуру оценивания ее коэффициентов с помощью доступного МНК. Получите прогнозную оценку на следующий период при условии, что , .

Решение с помощью MS Excel

  1. Ввод исходных данных.

  2. Проверка данных с помощью теста Голдфельда – Куандта.

2.1. Упорядочивание исходных данных по переменной в предположении, что уровень дисперсии зависит от этой переменной, и удаление шести наблюдений, оказавшихся в середине выборки. Представление результатов в виде табл. 27.

Т а б л и ц а 27

1.

33

291

311

14.

42

98

171

2.

11

199

183

15.

21

95

128

3.

30

192

204

16.

69

86

199

4.

12

176

204

17.

28

56

110

5.

58

161

207

18.

13

43

79

6.

26

145

178

19.

60

42

140

7.

8

143

144

20.

33

24

97

2.2. Построение по упорядоченным данным двух регрессионных уравнений по первым семи наблюдениям (первое регрессионное уравнение, см. Вывод итогов 9) и по последним семи наблюдениям (второе регрессионное уравнение, см. Вывод итогов 10).

ВЫВОД ИТОГОВ 9

Регрессионная статистика

Множественный R

0,965091

R-квадрат

0,931401

Нормированный R-квадрат

0,897101

Стандартная ошибка

16,65463

Наблюдения

7

Дисперсионный анализ

 

 

 

 

 

 

df

SS

MS

F

Значимость F

Регрессия

2

15064,2081

7532,104

27,1548

0,0047059

Остаток

4

1109,50616

277,3765

Итого

6

16173,7143

 

 

 

 

 

 

 

 

 

 

Коэффициенты

Стандартная ошибка

t-статис-

тика

P-Значение

Нижние 95%

Верхние

95%

Y-пересечение

13,86422

26,6435024

0,52036

0,630286

-60,11015

87,838598

Переменная X 1

0,889493

0,39236032

2,267031

0,086009

-0,199876

1,978862

Переменная X 2

0,89948

0,13496104

6,66474

0,002633

0,5247676

1,274193

ВЫВОД ИТОГОВ 10

Регрессионная статистика

Множественный R

0,99412

R-квадрат

0,988274

Нормированный R-квадрат

0,982411

Стандартная ошибка

5,576546

Наблюдения

7

Дисперсионный анализ

 

 

 

 

 

 

df

SS

MS

F

Значимость F

Регрессия

2

10483,6085

5241,804

168,5583

0,000138

Остаток

4

124,391476

31,09787

Итого

6

10608

 

 

 

 

Коэффициенты

Стандартная ошибка

t-статис-тика

P-Значение

Нижние 95%

Верхние

95%

Y-пересечение

23,49446

6,3630766

3,692312

0,020976

5,827693

41,161232

Переменная X 1

1,476582

0,11317714

13,04665

0,000199

1,162351

1,7908128

Переменная X 2

0,826054

0,07856709

10,51399

0,000463

0,607916

1,0441916

2.3. Получение расчетных значений и вычисление остатков и , с помощью которых составляется статистика . Оформление результатов в виде табл. 28.

Т а б л и ц а 28

1.

33

291

311

304,97

36,41

2.

11

199

183

202,65

385,93

3.

30

192

204

213,25

85,55

4.

12

176

204

182,85

447,46

5.

58

161

207

210,27

10,70

6.

26

145

178

167,42

112,03

7.

8

143

144

149,61

31,43

 

 

 

 

 =1109,51

14.

42

98

171

166,46

20,57

15.

21

95

128

132,98

24,78

16.

69

86

199

196,42

6,66

17.

28

56

110

111,10

1,21

18.

13

43

79

78,21

0,62

19.

60

42

140

146,78

46,02

20.

33

24

97

92,05

24,53

 

 

 

 

 =124,39

; .

Так как , то гипотеза отвергается и, следовательно, в данных наблюдается гетероскедастичность с двухуровневой дисперсией. Поэтому для построения регрессии по данным табл. 36 необходимо применить многоэтапную процедуру доступного МНК.

  1. Построение регрессии с помощью доступного взвешенного МНК.

3.1. Построение регрессии обычным МНК по данным табл. 27 (см. Вывод итогов 11).

ВЫВОД ИТОГОВ 11

Регрессионная статистика

Множественный R

0,968969836

R-квадрат

0,938902544

Нормированный R-квадрат

0,931714608

Стандартная ошибка

13,07464604

Наблюдения

20

Дисперсионный анализ

 

 

 

 

 

 

df

SS

MS

F

Значимость F

Регрессия

2

44658,7117

22329,36

130,622

4,8E-11

Остаток

17

2906,08827

170,9464

Итого

19

47564,8

 

 

 

 

Коэффициенты

Стандартная ошибка

t-статис-тика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

36,78068243

9,43676522

3,897594

0,001158

16,87082

56,690545

Переменная X 1

1,191842832

0,16975113

7,021119

2,06E-06

0,833699

1,5499869

Переменная X 2

0,760391162

0,04869436

15,61559

1,63E-11

0,657655

0,8631274

3.2. Получение расчетных оценок и вычисление абсолютных значений отклонений. Оформление результатов в виде табл. 29.

Т а б л и ц а 29

1

2

3

4

5

6

7

1.

13

43

79

84,971

-5,971

5,971

2.

28

56

110

112,734

-2,734

2,734

3.

33

24

97

94,361

2,639

2,639

4.

42

98

171

161,356

9,644

9,644

5.

12

176

204

184,912

19,088

19,088

6.

44

124

174

183,510

-9,510

9,510

7.

36

130

184

178,538

5,462

5,462

8.

33

291

311

297,385

13,615

13,615

9.

34

141

206

184,518

21,482

21,482

10.

21

95

128

134,047

-6,047

6,047

11.

58

161

207

228,331

-21,331

21,331

12.

23

108

152

146,315

5,685

5,685

Окончание табл. 29

1

2

3

4

5

6

7

13.

69

86

199

184,411

14,589

14,589

14.

8

143

144

155,051

-11,051

11,051

15.

60

42

140

140,228

-0,228

0,228

16.

11

199

183

201,209

-18,209

18,209

17.

26

145

178

178,025

-0,025

0,025

18.

61

115

185

196,928

-11,928

11,928

19.

18

111

152

142,637

9,363

9,363

20.

30

192

204

218,531

-14,531

14,531

3.3. Деление наблюдений с помощью Автофильтра на две группы и со значениями остатков, по абсолютной величине превосходящих и не превосходящих заданный уровень. (Анализ последнего столбца табл. 29 позволил в качестве такого уровня выбрать 7.)

3.4. Расчет среднеквадратических ошибок по остаткам, не превосходящих заданный уровень, и среднеквадратических ошибок по остаткам, превосходящих заданный уровень.

; .

3.5. Преобразование исходных данных путем деления зависимой и независимых переменных каждого наблюдения первой группы на , а второй группы – на и оформление результатов в виде табл. 30.

Т а б л и ц а 30

 

1.

13

43

79

3,014

9,968

18,314

2.

28

56

110

6,491

12,982

25,500

3.

33

24

97

7,650

5,564

22,487

4.

42

98

171

2,771

6,465

11,281

5.

12

176

204

0,792

11,611

13,458

6.

44

124

174

2,903

8,180

11,479

7.

36

130

184

8,346

30,137

42,655

8.

33

291

311

2,177

19,198

20,517

9.

34

141

206

2,243

9,302

13,590

10.

21

95

128

4,868

22,023

29,673

11.

58

161

207

3,826

10,621

13,656

12.

23

108

152

5,332

25,037

35,237

13.

69

86

199

4,552

5,674

13,128

14.

8

143

144

0,528

9,434

9,500

15.

60

42

140

13,909

9,736

32,455

16.

11

199

183

0,726

13,128

12,073

17.

26

145

178

6,027

33,614

41,264

18.

61

115

185

4,024

7,587

12,205

19.

18

111

152

1,187

7,323

10,028

20.

30

192

204

1,979

12,666

13,458

3.6. Построение регрессионной модели по преобразованным данным табл. 30. Использование преобразованных данных для построения регрессионной модели эквивалентно применению взвешенного МНК к исходным данным (см. Вывод итогов 12).

ВЫВОД ИТОГОВ 12

Регрессионная статистика

Множественный R

0,985102

R-квадрат

0,970425

Нормированный R-квадрат

0,966946

Стандартная ошибка

1,948194

Наблюдения

20

Дисперсионный анализ

 

 

 

 

 

 

df

SS

MS

F

Значимость F

Регрессия

2

2117,1754

1058,588

278,9088

1,01E-13

Остаток

17

64,5228463

3,795462

Итого

19

2181,69825

 

 

 

 

Коэффициенты

Стандартная ошибка

t-статис-тика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

0,148364

0,95183574

0,155871

0,877971

-1,85984

2,1565644

Переменная X 1

1,818385

0,14250896

12,75979

3,91E-10

1,517717

2,1190528

Переменная X 2

0,915585

0,05632975

16,25403

8,6E-12

0,79674

1,034431

Таким образом, уравнение регрессии, построенное с учетом гетероскедастичности, имеет вид

.

3.7. Получение прогнозной оценки моделируемого показателя

.

Задание 5. Проверьте данные, представленные в табл. 31, на наличие гетероскедастичности, используя тест: 1) Уайта; 2) Бреуша – Пагана.

Т а б л и ц а 31

 № п.п.

 № п.п.

1.

10,00

110,00

11.

15,00

111,64

2.

10,50

110,66

12.

15,50

119,65

3.

11,00

110,06

13.

16,00

126,36

4.

11,50

112,83

14.

16,50

125,12

5.

12,00

112,92

15.

17,00

121,76

6.

12,50

113,17

16.

17,50

125,98

7.

13,00

108,35

17.

18,00

122,87

8.

13,50

120,18

18.

18,50

117,34

9.

14,00

115,07

19.

19,00

109,94

10.

14,50

117,08

20.

19,50

120,50

Задание 6. В табл. 32 приведены числовые данные о государственных расходах на образование (y, млрд. у.е.) и валовом внутреннем продукте (х, млрд. у.е.) для 34 стран. Проверьте эти данные на наличие гетероскедастичности, используя критерий Гольдфельда – Куандта. В случае подтверждения гипотезы о присутствии гетероскедастичности примените для построения модели, отражающей зависимость расходов на образование от ВВП, взвешенный метод наименьших квадратов.

Т а б л и ц а 32

у

х

у

х

1.

0,34

5,67

18.

5,31

101,65

2.

0,22

10,13

19.

6,40

115,97

3.

0,32

11,34

20.

7,15

119,49

4.

1,23

18,88

21.

11,22

124,15

5.

1,81

20,94

22.

8,66

140,98

6.

1,02

22,16

23.

5,56

153,85

7.

1,27

23,83

24.

13,41

169,38

8.

1,07

24,67

25.

5,46

186,33

9.

0,67

27,56

26.

4,79

211,78

10.

1,25

27,57

27.

8,92

249,72

11.

0,75

40,15

28.

18,90

261,41

12.

2,80

51,62

29.

15,95

395,52

13.

4,90

57,71

30.

29,90

534,97

14.

3,50

63,03

31.

33,59

655,29

15.

4,45

66,32

32.

38,62

815,00

16.

1,60

66,97

33.

61,61

1040,45

17.

4,26

76,88

34.

181,30

2586,40