Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Эконометрика / glava5_mn_regr.doc
Скачиваний:
101
Добавлен:
15.05.2015
Размер:
438.27 Кб
Скачать

5.7. Задание к лабораторной работе № 4 «Отбор факторов во множественную линейную регрессию»

Требуется построить статистическую зависимость стоимости квартиры от факторов в виде множественной регрессии. Количество факторов в модели ограничено тремя или четырьмя факторами. Лучшую модель выберите с помощью коэффициента детерминации R2 и с помощью t-критерия Стьюдента, оценивающего значимость каждого коэффициента множественной регрессии.

Таблица 2.

№ изм.

Стоимость квартиры, тыс. долл., У

Число комнат в квартире, Х1

Район города (1 - центр., 0 - периферийные), Х2

Общая площадь, м2, X3

Жилая площадь квартиры, м2, Х4

Площадь кухни, м2, Х5

Тип дома (1 -кирпичный, 0 -другой), Х6

Расстояние до метро, мин., пешком, Х7

1

13

1

1

37

21,5

6,5

0

20

2

16,5

1

1

60

27

22,4

0

10

3

17

1

1

60

30

15

0

10

4

15

1

1

53

26,2

13

0

15

5

14,2

1

1

35

19

9

0

8

6

10,5

1

1

30,3

17,5

5,6

1

15

7

23

1

1

43

25,5

8,5

0

5

8

12

1

1

30

17,8

5,5

1

10

9

15,6

1

1

35

18

5,3

1

3

10

12,5

1

1

32

17

6

1

5

11

11,3

1

0

31

18

5,5

1

10

12

13

1

0

33

19,6

7

0

5

13

21

1

0

53

26

16

1

5

14

12

1

0

32,2

18

6,3

0

20

15

11

1

0

31

17,3

5,5

1

15

16

11

1

0

36

19

8

1

5

17

22,5

2

1

48

29

8

1

15

18

26

2

1

55,5

35

8

0

10

19

18,5

2

1

48

28

8

0

10

20

13,2

2

1

44,1

30

6

1

25

21

25,8

2

1

80

51

13

0

10

22

17

2

1

60

38

10

0

12

23

18

2

0

50

30

8,7

1

15

24

21

2

0

54,6

32

10

1

20

25

14,5

2

0

43

27

5,5

1

10

26

23

2

0

66

39

12

1

5

27

19,5

2

0

53,5

29,5

7

1

15

28

14,2

2

0

45

29

6

1

12

29

13,3

2

0

45

30

5,5

0

5

30

16

3

0

80

54

8

0

3

31

22

3

0

62

37

10,2

1

5

32

23

3

0

69,7

42

10,8

0

15

33

19,5

3

0

79

50,3

9,1

1

25

34

34

3

0

96,4

58

12,6

1

5

35

24,5

4

1

90

64

15

0

5

36

27,3

4

1

102

66

11,8

0

7

37

41

4

1

87

56,5

12,5

0

10

38

31

4

1

114,8

74

25,6

0

10

39

35,6

4

1

114,3

74,7

12

1

5

40

46

4

1

90

62

8

1

5

41

35

4

1

116

81

16,5

0

10

42

42,7

4

1

107

75,5

9,5

0

10

43

27

4

0

93

66

10

0

15

44

75

4

0

176

129

15

0

10

45

38

4

0

96

69,4

9

0

8

46

23,5

4

0

92

72,5

9,5

0

10

47

65

4

0

176

110

33

1

20

48

23

4

0

74

49

6,5

0

15

49

45,5

4

0

106

73,7

9

0

10

50

34

4

0

88

61,7

9

0

3

51

23

4

0

74

45,8

9

0

10

52

26,5

4

0

74,7

50,8

8,2

1

10

53

37

4

0

115

76

8,5

0

5

54

30

4

0

92

62

9

0

15

55

43

4

0

110

79,5

10

0

5

Шаг 1. Скопируйте таблицу на лист MS EXCEL. Вначале включите все семь факторов в модель. Постройте модель линейной регрессии вторым способом с помощью Сервис, Анализ данных, Регрессия. Найдите R2 на листе результатов регрессии, значения коэффициентов регрессии, а также под столбцом, озаглавленном Р-значения, числа, являющиеся уровнями значимости этих коэффициентов, вычисленные на основе t-критерия Стьюдента для отдельных коэффициентов.

Шаг 2. Добавьте на этом листе столбец, озаглавленный 1-(Р-значения), в котором отнимите от единицы Р-значения, соответствующие каждому значению коэффициентов регрессии. Это будет столбец, в котором будут вычислены вероятности доверия (1-) к этим значениям. В экономических задачах принято, чтобы эти вероятности доверия были не меньше 0,95, т.е. мы могли бы доверять этим значениям коэффициентов не меньше, чем на 95%. А в реальных задачах, что получится, то и получится. Модель может оказаться не самой лучшей.

Шаг 3. Опять включив все семь факторов, вычислите для них матрицу парных корреляций с помощью команд: Сервис, Анализ данных, Корреляция (укажите адреса ячеек блока, в котором находятся на листе Excel все семь факторов). Не забудьте, что эта процедура выдаёт нижнюю треугольную матрицу в надежде, что пользователь помнит о том, любая матрица парных корреляций симметрична. Придётся, пользуясь врождённым вам чувством симметрии, восстановить всю матрицу. Обозначим её через К = (((kij), i = 1,7), j = 1,7).

Шаг 4. После восстановления всей матрицы на этом или на другом листе образуйте такую же матрицу 7х7, состоящую из абсолютных величин матрицы парных корреляций. Самое простое – это на чистой клетке ввести знак равенства и формулу =abs(b2). Здесь b2 – это адрес ячейки стоящего в левом верхнем углу элемента k11 матрицы парных корреляций. Затем растащите формулу за черный крестик в правом нижнем уголке этой клетки вниз, чтобы было семь строк и направо, чтобы было семь столбцов. Теперь получена матрица абсолютных величин элементов матрицы парных корреляций. Под каждым её столбцом вычислите сумму. Это будет сумма модулей элементов матрицы парных корреляций К, соответствующих каждому фактору. Из них выберем максимальную сумму модулей. Она выявит номер такого фактора, который наиболее коррелирует с остальными факторами (зависим от остальных факторов).

Шаг 4. Выбрасываем из модели этот наиболее зависимый фактор. С оставшимися шестью факторами опять строим регрессию с помощью команд: Сервис, Анализ данных, Регрессия. Потом опять матрицу парных корреляций с помощью команд: Сервис, Анализ данных, Корреляция. И так далее пока не останется 3–4 фактора.

Замечание 1. Конечно, выбрасывать факторы (и данные) нужно очень осмотрительно. Данных обычно бывает маловато.

Соседние файлы в папке Эконометрика