- •Глава 9. Фиктивные переменные в уравнении множественной регрессии
- •9.1. Необходимость использования фиктивных переменных
- •9.2. Задание для лабораторной работы №9 «Использование фиктивных переменных при построении множественной регрессии»
- •9.3. Критерий г. Чоу
- •9.4. Задание для лабораторной работы №10 «Использование критерия г. Чоу для оценки однородности двух регрессий»
9.2. Задание для лабораторной работы №9 «Использование фиктивных переменных при построении множественной регрессии»
Задача 1. На предприятии используются станки трех фирм (А, В, С). Исследуется надежность этих станков. При этом учитываются возраст станка (М, в мес.) и время (Н, в час.) безаварийной работы до последней поломки. Выборка из 40 станков дала результаты представленные в таблице 3.
Таблица 3
|
№ измерения |
Возраст станка в месяцах |
Время работы станка без ремонта в часах |
Фирма-производитель |
|
1 |
23 |
280 |
A |
|
2 |
30 |
230 |
B |
|
3 |
65 |
112 |
C |
|
4 |
69 |
176 |
A |
|
5 |
75 |
90 |
C |
|
6 |
63 |
176 |
A |
|
7 |
25 |
216 |
B |
|
8 |
75 |
110 |
C |
|
9 |
75 |
45 |
B |
|
10 |
52 |
200 |
A |
|
11 |
20 |
265 |
B |
|
12 |
70 |
148 |
C |
|
13 |
62 |
150 |
C |
|
14 |
40 |
176 |
B |
|
15 |
66 |
123 |
A |
|
16 |
20 |
245 |
A |
|
17 |
39 |
176 |
C |
|
18 |
25 |
260 |
B |
|
19 |
48 |
236 |
A |
|
20 |
59 |
205 |
A |
|
21 |
25 |
240 |
A |
|
22 |
69 |
65 |
B |
|
23 |
71 |
115 |
A |
|
24 |
26 |
200 |
C |
|
25 |
45 |
126 |
B |
|
26 |
40 |
225 |
A |
|
27 |
30 |
210 |
C |
|
28 |
69 |
45 |
B |
|
29 |
30 |
260 |
A |
|
30 |
22 |
220 |
B |
|
31 |
33 |
194 |
B |
|
32 |
48 |
156 |
C |
|
33 |
75 |
100 |
A |
|
34 |
21 |
240 |
B |
|
35 |
56 |
170 |
A |
|
36 |
58 |
116 |
C |
|
37 |
50 |
120 |
B |
|
38 |
37 |
140 |
A |
|
39 |
56 |
88 |
B |
|
40 |
67 |
120 |
A |
Шаг 1. Оцените уравнение регрессии без учета различия станков разных фирм.
Шаг 2. Оцените уравнение регрессии, учитывающее различие качества станков разных фирм. Как выглядит это уравнение?
Шаг 3. Сравните качества построенных моделей.
Шаг 4. Постройте корреляционное поле и нанесите на него графики функций.
Шаг 5. Сделайте выводы о необходимости использования фиктивных переменных в этом случае.
Замечание 1. На шаге 2 для преобразования текстовых значений в числовые, а затем в фиктивные бинарные значения используйте оператор условного перехода =ЕСЛИ(условие; значение1; значение2).
Замечание 2. На шаге 3 для сравнения качества наряду с t-критерием для оценки значимости отдельных коэффициентов используйте скорректированный коэффициент детерминации.
.
Задача 2 [14].
В таблице 4 представлены данные о рынке строящегося жилья в Санкт-Петербурге (по состоянию на декабрь 1996 г.).
Принятые в таблице обозначения:
Yi – цена квартиры, тыс. долл.;
x1i – число комнат в квартире;
x2i – район города (1 – Приморский, Шувалово-Озерки, 2 – Гражданка, 3 – Юго-Запад, 4 – Красносельский);
x3i – общая площадь квартиры (м2);
x4i – жилая площадь квартиры (м2);
x5i – площадь кухни (м2);
x6i – тип дома (1 – кирпичный, 0 – другой);
x7i – наличие балкона (1 – есть, 0 –нет);
x8i – число месяцев до окончания срока строительства.
Задание.
1. Скопируйте данные этой таблицы на лист MS Excel. Определите факторы, формировавшие цену квартир в строящихся домах в Санкт-Петербурге в 1996 г. Сгенерируйте фиктивную переменную z, отражающую местоположение квартиры и позволяющую разделить всю совокупность квартир на две группы: квартиры на севере города (Приморский район, Шувалово-Озерки, Гражданка) и на юге города (Юго-Запад, Красносельский район).
2. Составьте матрицу парных коэффициентов корреляции:
а) исходных переменных;
б) логарифмов исходных переменных (кроме фиктивных переменных). Вместо переменной х2 используйте фиктивную переменную z.
3. Постройте уравнение регрессии, характеризующее зависимость цены от всех факторов, в линейной и степенной форме. Установите, какие факторы мультиколлинеарны. В какой модели мультиколлинеарность проявляется сильнее?
4. Постройте модель у = f (х1, х2, x3, х5, х8) в линейной и степенной форме. Какие факторы значимо воздействуют на формирование цены квартиры в этой модели?
5. Существует ли разница в ценах квартир, расположенных в северной и южной частях Санкт-Петербурга? Является ли наличие балкона или лоджии преимуществом квартиры на рынке? Как вы объясните этот факт?
Таблица 4
|
№ изм. |
x1i |
x2i |
x3i |
x4i |
x5i |
x6i |
x7i |
x8i |
Yi |
|
1 |
1 |
1 |
39,00 |
20,00 |
8,20 |
0 |
1 |
0 |
15,90 |
|
2 |
3 |
1 |
68,40 |
40,50 |
10,70 |
0 |
1 |
0 |
27,00 |
|
3 |
1 |
1 |
34,80 |
16,00 |
10,70 |
0 |
1 |
12 |
13,50 |
|
4 |
1 |
1 |
39,00 |
20,00 |
8,50 |
0 |
1 |
12 |
15,10 |
|
5 |
2 |
1 |
54,70 |
28,00 |
10,70 |
0 |
1 |
12 |
21,10 |
|
6 |
3 |
1 |
74,70 |
46,30 |
10,70 |
0 |
1 |
12 |
28,70 |
|
7 |
3 |
1 |
71,70 |
45,90 |
10,70 |
0 |
0 |
0 |
27,20 |
|
8 |
3 |
1 |
74,50 |
47,50 |
10,40 |
0 |
0 |
0 |
28,30 |
|
9 |
4 |
1 |
137,70 |
87,20 |
14,60 |
0 |
1 |
0 |
52,30 |
|
10 |
1 |
1 |
40,00 |
17,70 |
11,00 |
1 |
1 |
8 |
22,00 |
|
11 |
2 |
1 |
53,00 |
31,10 |
10,00 |
1 |
1 |
8 |
28,00 |
|
12 |
3 |
1 |
86,00 |
48,70 |
14,00 |
1 |
1 |
8 |
45,00 |
|
13 |
4 |
1 |
98,00 |
65,80 |
13,00 |
1 |
1 |
8 |
51,00 |
|
14 |
2 |
1 |
62,60 |
21,40 |
11,00 |
1 |
1 |
0 |
34,40 |
|
15 |
1 |
1 |
45,30 |
20,60 |
10,40 |
1 |
1 |
8 |
24,70 |
|
16 |
2 |
1 |
56,40 |
29,70 |
9,40 |
1 |
1 |
8 |
30,80 |
|
17 |
1 |
1 |
37,00 |
17,80 |
8,30 |
0 |
1 |
0 |
15,90 |
|
18 |
3 |
1 |
67,50 |
43,50 |
8,30 |
0 |
1 |
0 |
29,00 |
|
19 |
1 |
1 |
37,00 |
17,80 |
8,30 |
0 |
1 |
3 |
15,40 |
|
20 |
3 |
1 |
69,00 |
42,40 |
8,30 |
0 |
1 |
3 |
28,60 |
|
21 |
1 |
1 |
40,00 |
20,00 |
8,30 |
0 |
0 |
0 |
15,60 |
|
22 |
3 |
1 |
69,10 |
41,30 |
8,30 |
0 |
1 |
0 |
27,70 |
|
23 |
2 |
1 |
68,10 |
35,40 |
13,00 |
1 |
1 |
20 |
34,10 |
|
24 |
2 |
1 |
75,30 |
41,40 |
12,10 |
1 |
1 |
20 |
37,70 |
|
25 |
3 |
1 |
83,70 |
48,50 |
12,10 |
1 |
1 |
20 |
41,90 |
|
26 |
1 |
1 |
48,70 |
22,30 |
12,40 |
1 |
1 |
20 |
24,40 |
|
27 |
1 |
1 |
39,90 |
18,00 |
8,10 |
1 |
0 |
0 |
21,30 |
|
28 |
2 |
1 |
68,60 |
35,50 |
17,00 |
1 |
1 |
12 |
36,70 |
|
29 |
1 |
1 |
39,00 |
20,00 |
9,20 |
1 |
0 |
0 |
21,50 |
|
30 |
2 |
1 |
48,60 |
31,00 |
8,00 |
1 |
0 |
0 |
26,40 |
|
31 |
3 |
1 |
98,00 |
56,00 |
22,00 |
1 |
0 |
0 |
53,90 |
|
32 |
2 |
1 |
68,50 |
30,70 |
8,30 |
1 |
1 |
6 |
34,20 |
|
33 |
2 |
1 |
71,10 |
36,20 |
13,30 |
1 |
1 |
6 |
35,60 |
|
34 |
3 |
1 |
68,00 |
41,00 |
8,00 |
1 |
1 |
12 |
34,00 |
|
35 |
1 |
1 |
38,00 |
19,00 |
7,40 |
1 |
1 |
12 |
19,00 |
|
36 |
2 |
1 |
93,20 |
49,50 |
14,00 |
1 |
1 |
12 |
46,60 |
|
37 |
3 |
1 |
117,00 |
55,20 |
25,00 |
1 |
1 |
12 |
58,50 |
|
38 |
1 |
2 |
42,00 |
21,00 |
10,20 |
1 |
0 |
12 |
24,20 |
|
39 |
2 |
2 |
62,00 |
35,00 |
11,00 |
1 |
0 |
12 |
35,70 |
|
40 |
3 |
2 |
89,00 |
52,30 |
11,50 |
1 |
1 |
12 |
53,20 |
|
41 |
4 |
2 |
132,00 |
89,60 |
11,00 |
1 |
1 |
12 |
75,90 |
|
42 |
1 |
2 |
40,80 |
19,20 |
10,10 |
1 |
1 |
6 |
21,20 |
|
43 |
2 |
2 |
59,20 |
31,90 |
11,20 |
1 |
1 |
6 |
30,80 |
|
44 |
3 |
2 |
65,40 |
38,90 |
9,30 |
1 |
1 |
6 |
34,00 |
|
45 |
2 |
2 |
60,20 |
36,30 |
10,90 |
1 |
1 |
12 |
31,90 |
|
46 |
3 |
2 |
82,20 |
49,70 |
13,80 |
1 |
1 |
12 |
43,60 |
|
47 |
3 |
2 |
98,40 |
52,30 |
15,30 |
1 |
1 |
12 |
52,20 |
|
48 |
3 |
3 |
76,70 |
44,70 |
8,00 |
1 |
1 |
0 |
43,10 |
|
49 |
1 |
3 |
38,70 |
20,00 |
10,20 |
1 |
1 |
6 |
25,00 |
|
50 |
2 |
3 |
56,40 |
32,70 |
10,10 |
1 |
1 |
6 |
35,20 |
|
51 |
3 |
3 |
76,70 |
44,70 |
8,00 |
1 |
1 |
6 |
40,80 |
|
52 |
1 |
3 |
38,70 |
20,00 |
10,20 |
1 |
0 |
0 |
18,20 |
|
53 |
1 |
3 |
41,50 |
20,00 |
10,20 |
1 |
1 |
0 |
20,10 |
|
54 |
2 |
3 |
48,80 |
28,50 |
8,00 |
1 |
0 |
0 |
22,70 |
|
55 |
2 |
3 |
57,40 |
33,50 |
10,10 |
1 |
1 |
0 |
27,60 |
|
56 |
3 |
3 |
76,70 |
44,70 |
8,00 |
1 |
1 |
0 |
36,00 |
|
57 |
1 |
4 |
37,00 |
17,50 |
8,30 |
0 |
1 |
7 |
17,80 |
|
58 |
2 |
4 |
54,00 |
30,50 |
8,30 |
0 |
1 |
7 |
25,90 |
|
59 |
3 |
4 |
68,00 |
42,50 |
8,30 |
0 |
1 |
7 |
32,60 |
|
60 |
1 |
4 |
40,50 |
16,00 |
11,00 |
0 |
1 |
3 |
19,80 |
|
61 |
2 |
4 |
61,00 |
31,00 |
11,00 |
0 |
1 |
3 |
29,90 |
|
62 |
3 |
4 |
80,00 |
45,60 |
11,00 |
0 |
1 |
3 |
39,20 |
|
63 |
1 |
3 |
52,00 |
21,20 |
11,20 |
1 |
1 |
18 |
22,40 |
|
64 |
2 |
3 |
78,10 |
40,00 |
11,60 |
1 |
1 |
18 |
35,20 |
|
65 |
3 |
3 |
91,60 |
53,80 |
16,00 |
1 |
0 |
18 |
41,20 |
|
66 |
1 |
4 |
39,90 |
19,30 |
8,40 |
0 |
1 |
6 |
17,80 |
|
67 |
2 |
4 |
56,20 |
31,40 |
11,10 |
0 |
1 |
6 |
25,00 |
|
68 |
3 |
4 |
79,10 |
42,40 |
15,50 |
0 |
1 |
6 |
35,20 |
|
69 |
4 |
4 |
91,60 |
55,20 |
9,40 |
0 |
1 |
6 |
40,80 |
Задача 3. Рассмотрим продолжение задачи, приведенной в п. 7.1, про учебу студентов, добавив еще один столбец об уровне интеллекта опрашиваемого студента.
Таблица 5
|
i – номер измерения (опрошенного студента) |
Количество дней подготовки к экзам., x1i, чел.-дн. |
x2i –уровень интеллекта IQ |
Средняя оценка за сессию, Yi |
|
1 |
10 |
5 |
5 |
|
2 |
8 |
3 |
4 |
|
3 |
3 |
2 |
2 |
|
4 |
6 |
2 |
3 |
|
5 |
2 |
1 |
1 |
Считая, что переменная x2 – качественная переменная, ввести необходимое количество фиктивных бинарных переменных, построить множественную регрессию.
