Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Упражнения и задачи.doc
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
2.38 Mб
Скачать

Вариант №3

В табл. 3.4 представлены следующие данные: доход на душу населения , доля рабочей силы, занятой в сельском хозяйстве, , и средний уровень образования граждан в возрасте старше 25 лет (т.е. среднее число лет, проведенных в учебных заведениях) для 15 стран за один год.

Таблица 3.4

Исходные данные

Страна

Доход на душу населения,

Y ( тыс. у. е.)

Доля рабочей силы, занятой в сельском хозяйстве, (%)

Средний уровень образования,

(лет)

1

7

8

9

2

9

9

13

3

9

7

11

4

8

6

11

5

8

10

12

6

14

4

16

7

9

5

11

8

8

5

11

9

10

6

12

10

11

7

14

11

11

6

14

12

12

4

15

13

9

8

15

14

10

5

10

15

11

8

13

  1. С помощью коэффициентов корреляции оцените тесноту связи между переменными и , и , а также между переменными и . Результаты занесите в следующую таблицу:

Какая из объясняющих переменных наиболее тесно связана с объясняемой переменной? Наблюдается ли по данным выборки сильная корреляция между переменными и ?

  1. Оцените парную линейную регрессионную модель . Результаты сведите в следующую таблицу:

а) Проверьте гипотезы о статистической близости к нулю МНК-оценок и при 7%-ом уровне значимости.

б) Проверьте качество построенного уравнения с помощью F-критерия при 11%-ом уровне значимости.

в) Найдите скорректированный коэффициент детерминации.

г) Постройте 93%-ую интервальную оценку для прогнозируемого дохода на душу населения, при условии, что доля рабочей силы, занятой в сельском хозяйстве, составит 6,5%.

д) Постройте 93%-ую интервальную оценку для среднего дохода на душу населения, при условии, что доля рабочей силы, занятой в сельском хозяйстве, составит 6,5%.

е) Предположим, что доля рабочей силы, занятой в сельском хозяйстве, уменьшилась в стране на 2%. Оцените, как в стране изменится доход, приходящийся на душу населения.

  1. Оцените парную линейную регрессионную модель . Результаты сведите в следующую таблицу:

а) Проверьте гипотезы о статистической значимости эмпирических коэффициентов регрессии и при 7%-ом уровне значимости.

б) Проверьте качество построенного уравнения с помощью F-критерия при 11%-ом уровне значимости.

в) Найдите скорректированный коэффициент детерминации.

г) Постройте 93%-ую интервальную оценку для прогнозируемого дохода на душу населения, при условии, что средний уровень образования составит 12,5 лет.

д) Постройте 93%-ую интервальную оценку для среднего дохода на душу населения, при условии, что средний уровень образования составит 12,5 лет.

е) Предположим, что средний уровень образования вырос на 1,5 года. Оцените, как в среднем изменится в стране доход на душу населения.

  1. Оцените двухфакторную линейную регрессионную модель с помощью встроенной статистической функции MS Excel ЛИНЕЙН. Результаты сведите в следующую таблицу:

а) Проверьте гипотезы о статистической близости к нулю эмпирических коэффициентов регрессии , где j=0,1,2, при 6%-ом уровне значимости.

б) Проверьте качество построенного уравнения с помощью F-критерия при 11%-ом уровне значимости.

в) Проверьте, привело ли увеличение числа объясняюших переменных к значимому улучшению объясняющей способности модели при 7%-ом уровне значимости.

г) Найдите скорректированный коэффициент детерминации.

д) Постройте 93%-ую интервальную оценку для прогнозируемого дохода на душу населения при условии, что ее доля занятых в сельском хозяйстве составит 12,5 %, а средний уровень образования – 10,5 лет.

е) Предположим, что доля занятых в сельском хозяйстве снизилась на 2,5%, а средний уровень образования не изменился. Оцените, как в среднем изменится доход на душу населения.

ж) Предположим, что средний уровень образования увеличился на 2 года, а доля занятых в сельском хозяйстве не изменилась. Оцените, как в среднем изменится доход на душу населения.

  1. Для какой из трех построенных моделей коэффициент детерминации максимален?

Как изменялась величина при увеличении числа факторов, включаемых в модель?

Для какой модели скорректированный коэффициент детерминации максимален?

Как изменялась величина при увеличении числа факторов, включаемых в модель?

Как согласуется наблюдаемое по выборке поведение и с положениями теории?

  1. Выберите из трех построенных моделей ту, которая по Вашему мнению наиболее адекватно описывает данные наблюдений. Обоснуйте Ваш выбор. Дайте экономическую интерпретацию МНК-оценкам параметров выбранной модели.

  2. Для выбранной модели:

а) найдите 94%-ые доверительные интервалы для истинных коэффициентов регрессии;

б) постройте 94%-ую интервальную оценку для прогнозируемого дохода на душу населения при условии, что объясняющие переменные примут средние по выборке значения;

в) постройте 94%-ую интервальную оценку для среднего дохода на душу населения при условии, что объясняющие переменные примут средние по выборке значения.

ИНДИВИДУАЛЬНЫЕ ЗАДАНИЯ К теме "некоторые аспекты построения моделей множественной регрессии"

ЗАДАНИЕ№1

Обнаружение признаков мультиколлинеарности в модели.

Устранение мультиколлинеарности

Вариант № 1

По 24 регионам изучалась зависимость объема произведенной за год промышленной продукции – Y (млн р.) от оборота розничной торговли– Х1 (млн р.), инвестиций в основной капитал – Х2 (млн р.), среднегодовой численности занятых в экономике – Х3 (тыс. чел.), уровня рентабельности реализованной продукции организаций промышленности – Х4 (%) и валового регионального продукта за предыдущий год – Х5 (млн р.). Исходные данные приведены в табл. 4.6.

Таблица 4.6

Исходные данные

Наименование региона

Y

Х1

Х2

Х3

Х4

Х5

1

Белгородская область

61603

24713

11215

771,4

11,3

53707

2

Брянская область

22018

19796

9119

800,1

3,1

32004,7

3

Владимирская область

50844

16801

16578

720,3

5,5

44878,7

4

Воронежская область

54374

43512

26888

1091,8

6,9

63217,2

5

Ивановская область

21314

12053

6775

383,2

1,8

22078,8

6

Калужская область

35043

17599

7137

480

10,1

33958,5

7

Костромская область

18282

10430

5465

229,7

4,5

23649,7

8

Курская область

36874

18700

14772

605,9

7,3

38258,7

9

Липецкая область

89287

22584

13248

472,8

35

51162,1

10

Московская область

237912

153803

73134

2489,1

12,3

266999

11

Орловская область

19836

15655

7723

419

8,5

30667

12

Рязанская область

55274

19322

7652

451,7

6,3

44011,4

13

Смоленская область

40363

23110

10481

470

6,5

38559,4

14

Тамбовская область

17365

20004

9914

295,3

6,1

33367,2

15

Тверская область

44314

22410

12909

568,3

6,9

51113

16

Тульская область

74346

23740

14058

572,9

7,2

55385,4

17

Ярославская область

69375

21727

13184

575,7

13,7

71025,1

18

Республика Карелия

34477

17339

7917

342,9

6,4

34041,4

19

Республика Коми

62947

36721

27313

1110,4

11

88508,5

20

Архангельская область

54967

29412

20554

617,7

9,1

68040

21

Вологодская область

104263

22225

9251

407

21,5

69862

22

Калининградская область

26663

17703

12512

512,5

17

31327,3

23

Ленинградская область

95385

26653

19919

706,3

19,3

80510,6

24

Мурманская область

58807

29172

51330

436,8

12,7

58936,8

Требуется:

1) построить регрессию объясняемой переменной Y на все объясняющие переменные по МНК, проверить, имеются ли признаки мультиколлинеарности в полученной модели;

2) при обнаружении признаков мультиколлинеарности в модели, устранить мультиколлинеарность, используя:

а) алгоритм отбора переменных в модель на основе анализа матрицы парных коэффициентов корреляции;

б) процедуру пошагового отбора наиболее информативных переменных;

3) построить интервальную оценку для прогнозного значения объема промышленной продукции, отвечающего средним значениям объясняющих переменных, найденным по данным для Белгородской, Московской, Вологодской и Ленинградской областей (использовать для получения оценки каждую из трех построенных в пунктах 1-2 моделей);

4) сравнить полученные интервальные оценки; какую из них Вы бы использовали на практике?