- •«Финансовый университет при Правительстве Российской Федерации» Кировский филиал
- •Киров 2012г. (2013г.) Содержание
- •Исходные данные Задача 1. Эконометрическое моделирование стоимости квартир в Московской области
- •Задача 2. Исследовать динамику экономического показателя на основе анализа одномерного временного ряда
- •Решение Задача 1.1. Матрица парных коэффициентов корреляции
- •Задача 1.2. Поле корреляции результативного признака
- •Задача 1.3. Параметры линейной парной регрессии
- •Задача 1.4. Оценка качества моделей
- •Задача 1.5. Прогнозирование среднего значения
- •Задача 1.6. Пошаговая множественная регрессия
- •Задача 1.7. Оценка качества многофакторной модели
- •Задача 2.1. Проверка наличия аномальных наблюдений
- •Задача 2.2. Построение линейной модели
- •Задача 2.3. Оценка адекватности модели
- •Задача 2.4. Оценка точности модели
- •Задача 2.5. Осуществление прогноза
- •Задача 2.6. Графическое представление результатов моделирования и прогнозирования
- •Список литературы
Задача 1.4. Оценка качества моделей
Оцените качество каждой модели через коэффициент детерминации, среднюю ошибку аппроксимации и F – критерий Фишера. Выберите лучшую модель.
Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции , называемый коэффициентом детерминации. Коэффициентом детерминации характеризует долю вариации результативного признакаY, учтенную в модели, и обусловленную влиянием фактора X.
4.1. Коэффициент детерминации определяется по формуле:
где - сумма квадратов отклонений, объясненная регрессией, и общая сумма квадратов отклонений соответственно.
Коэффициенты детерминации R-квадрат определены для каждой модели инструментом «Регрессия» пакета «Анализ данных» в Excel (таблица «Регрессионная статистика»):
Модель (1): 0,0001
Модель (2): 0,564
Модель (3): 0,764
Таким образом, вариация цены квартиры Y на 76,4% объясняется по уравнению (3) изменением жилой площади квартиры Х4; на 56,4% по уравнению (2) изменением общей площади квартиры Х2; на 0,01% по уравнению (1) вариацией города области Х1, т.е. наиболее адекватной моделью уравнения регрессии является зависимость цены квартиры от жилой площади квартиры Y = f(Х4).
4.2. Для вычисления средней относительной ошибки аппроксимации рассмотрим остатки модели , содержащиеся в столбце «Остатки» таблицы «Вывод остатка». Дополним таблицу столбцом относительных погрешностей, которые вычислим по формулес помощью функцииABS в Excel.
Выполнение расчетов для модели (1):
Наблюдение |
Y |
Предсказанное Y |
Остатки |
Отн. погрешность |
41 |
38 |
100,5333333 |
-62,53333333 |
164,5614035 |
42 |
62,2 |
100,5333333 |
-38,33333333 |
61,62915327 |
43 |
125 |
101,8136364 |
23,18636364 |
18,54909091 |
44 |
61,1 |
100,5333333 |
-39,43333333 |
64,53900709 |
45 |
67 |
101,8136364 |
-34,81363636 |
51,96065129 |
46 |
93 |
101,8136364 |
-8,813636364 |
9,477028348 |
47 |
118 |
100,5333333 |
17,46666667 |
14,80225989 |
48 |
132 |
101,8136364 |
30,18636364 |
22,8684573 |
49 |
92,5 |
101,8136364 |
-9,313636364 |
10,06879607 |
50 |
105 |
100,5333333 |
4,466666667 |
4,253968254 |
51 |
42 |
100,5333333 |
-58,53333333 |
139,3650794 |
52 |
125 |
100,5333333 |
24,46666667 |
19,57333333 |
53 |
170 |
101,8136364 |
68,18636364 |
40,10962567 |
54 |
38 |
101,8136364 |
-63,81363636 |
167,930622 |
55 |
130,5 |
101,8136364 |
28,68636364 |
21,98188784 |
56 |
85 |
101,8136364 |
-16,81363636 |
19,78074866 |
57 |
98 |
101,8136364 |
-3,813636364 |
3,891465677 |
58 |
128 |
101,8136364 |
26,18636364 |
20,45809659 |
59 |
85 |
101,8136364 |
-16,81363636 |
19,78074866 |
60 |
160 |
100,5333333 |
59,46666667 |
37,16666667 |
61 |
60 |
101,8136364 |
-41,81363636 |
69,68939394 |
62 |
41 |
100,5333333 |
-59,53333333 |
145,203252 |
63 |
90 |
100,5333333 |
-10,53333333 |
11,7037037 |
64 |
83 |
101,8136364 |
-18,81363636 |
22,66703176 |
65 |
45 |
101,8136364 |
-56,81363636 |
126,2525253 |
66 |
39 |
101,8136364 |
-62,81363636 |
161,0606061 |
67 |
86,9 |
101,8136364 |
-14,91363636 |
17,16183701 |
68 |
40 |
101,8136364 |
-61,81363636 |
154,5340909 |
69 |
80 |
101,8136364 |
-21,81363636 |
27,26704545 |
70 |
227 |
101,8136364 |
125,1863636 |
55,14817781 |
71 |
235 |
101,8136364 |
133,1863636 |
56,67504836 |
72 |
40 |
100,5333333 |
-60,53333333 |
151,3333333 |
73 |
67 |
100,5333333 |
-33,53333333 |
50,04975124 |
74 |
123 |
100,5333333 |
22,46666667 |
18,26558266 |
75 |
100 |
101,8136364 |
-1,813636364 |
1,813636364 |
76 |
105 |
100,5333333 |
4,466666667 |
4,253968254 |
77 |
70,3 |
100,5333333 |
-30,23333333 |
43,00616406 |
78 |
82 |
100,5333333 |
-18,53333333 |
22,60162602 |
79 |
280 |
100,5333333 |
179,4666667 |
64,0952381 |
80 |
200 |
100,5333333 |
99,46666667 |
49,73333333 |
Среднее |
101,2375 |
101,2375 |
|
54,1315859 |
По столбцу относительных погрешностей найдем среднее значение (с помощью функции СРЗНАЧExcel).
Выполнение расчетов для модели (2):
Наблюдение |
Y |
Предсказанное Y |
Остатки |
Отн. погрешность |
41 |
38 |
43,57706835 |
-5,577068345 |
14,67649565 |
42 |
62,2 |
79,61483813 |
-17,41483813 |
27,99813204 |
43 |
125 |
115,6526079 |
9,347392086 |
7,477913669 |
44 |
61,1 |
79,61483813 |
-18,51483813 |
30,3025174 |
45 |
67 |
43,57706835 |
23,42293165 |
34,95959948 |
46 |
93 |
79,61483813 |
13,38516187 |
14,39264717 |
47 |
118 |
115,6526079 |
2,347392086 |
1,989315327 |
48 |
132 |
115,6526079 |
16,34739209 |
12,38438794 |
49 |
92,5 |
115,6526079 |
-23,15260791 |
25,02984639 |
50 |
105 |
151,6903777 |
-46,6903777 |
44,46702638 |
51 |
42 |
43,57706835 |
-1,577068345 |
3,754924632 |
52 |
125 |
115,6526079 |
9,347392086 |
7,477913669 |
53 |
170 |
151,6903777 |
18,3096223 |
10,77036606 |
54 |
38 |
43,57706835 |
-5,577068345 |
14,67649565 |
55 |
130,5 |
151,6903777 |
-21,1903777 |
16,23783732 |
56 |
85 |
79,61483813 |
5,385161871 |
6,335484554 |
57 |
98 |
151,6903777 |
-53,6903777 |
54,78609969 |
58 |
128 |
151,6903777 |
-23,6903777 |
18,50810758 |
59 |
85 |
115,6526079 |
-30,65260791 |
36,06189166 |
60 |
160 |
115,6526079 |
44,34739209 |
27,71712005 |
61 |
60 |
43,57706835 |
16,42293165 |
27,37155276 |
62 |
41 |
43,57706835 |
-2,577068345 |
6,28553255 |
63 |
90 |
151,6903777 |
-61,6903777 |
68,54486411 |
64 |
83 |
151,6903777 |
-68,6903777 |
82,7594912 |
65 |
45 |
43,57706835 |
1,422931655 |
3,162070344 |
66 |
39 |
43,57706835 |
-4,577068345 |
11,73607268 |
67 |
86,9 |
115,6526079 |
-28,75260791 |
33,08700565 |
68 |
40 |
43,57706835 |
-3,577068345 |
8,942670863 |
69 |
80 |
79,61483813 |
0,385161871 |
0,481452338 |
70 |
227 |
151,6903777 |
75,3096223 |
33,17604507 |
71 |
235 |
151,6903777 |
83,3096223 |
35,45090311 |
72 |
40 |
43,57706835 |
-3,577068345 |
8,942670863 |
73 |
67 |
43,57706835 |
23,42293165 |
34,95959948 |
74 |
123 |
151,6903777 |
-28,6903777 |
23,32551032 |
75 |
100 |
115,6526079 |
-15,65260791 |
15,65260791 |
76 |
105 |
115,6526079 |
-10,65260791 |
10,14534087 |
77 |
70,3 |
79,61483813 |
-9,314838129 |
13,25012536 |
78 |
82 |
115,6526079 |
-33,65260791 |
41,03976575 |
79 |
280 |
151,6903777 |
128,3096223 |
45,82486511 |
80 |
200 |
151,6903777 |
48,3096223 |
24,15481115 |
Среднее |
101,2375 |
101,2375 |
|
23,457427 |
По столбцу относительных погрешностей найдем среднее значение (с помощью функции СРЗНАЧExcel).
Выполнение расчетов для модели (3):
Наблюдение |
Y |
Предсказанное Y |
Остатки |
Отн. погрешность |
41 |
38 |
44,17866562 |
-6,178665622 |
16,25964637 |
42 |
62,2 |
86,27023362 |
-24,07023362 |
38,69812478 |
43 |
125 |
98,65010656 |
26,34989344 |
21,07991476 |
44 |
61,1 |
83,29906411 |
-22,19906411 |
36,33234715 |
45 |
67 |
43,43587325 |
23,56412675 |
35,17033844 |
46 |
93 |
65,71964454 |
27,28035546 |
29,33371555 |
47 |
118 |
143,2176491 |
-25,21764914 |
21,3708891 |
48 |
132 |
106,0780303 |
25,92196968 |
19,63785582 |
49 |
92,5 |
135,7897254 |
-43,28972537 |
46,79970311 |
50 |
105 |
113,5059541 |
-8,505954083 |
8,10090865 |
51 |
42 |
41,70269103 |
0,297308966 |
0,70787849 |
52 |
125 |
106,0780303 |
18,92196968 |
15,13757574 |
53 |
170 |
135,7897254 |
34,21027463 |
20,12369096 |
54 |
38 |
36,75074186 |
1,249258142 |
3,287521425 |
55 |
130,5 |
160,5494713 |
-30,04947125 |
23,02641475 |
56 |
85 |
81,31828444 |
3,68171556 |
4,33143007 |
57 |
98 |
103,6020557 |
-5,602055731 |
5,716383399 |
58 |
128 |
143,7128441 |
-15,71284406 |
12,27565942 |
59 |
85 |
120,9338778 |
-35,93387785 |
42,27515041 |
60 |
160 |
101,1260811 |
58,87391886 |
36,79619929 |
61 |
60 |
46,65464021 |
13,34535979 |
22,24226632 |
62 |
41 |
31,79879268 |
9,201207317 |
22,44196907 |
63 |
90 |
113,5059541 |
-23,50595408 |
26,11772676 |
64 |
83 |
119,6958906 |
-36,69589055 |
44,21191633 |
65 |
45 |
43,93106816 |
1,068931837 |
2,375404081 |
66 |
39 |
41,70269103 |
-2,702691034 |
6,929977011 |
67 |
86,9 |
142,4748568 |
-55,57485676 |
63,9526545 |
68 |
40 |
51,60658939 |
-11,60658939 |
29,01647346 |
69 |
80 |
96,17413197 |
-16,17413197 |
20,21766496 |
70 |
227 |
222,448836 |
4,55116405 |
2,004918084 |
71 |
235 |
219,9728614 |
15,02713864 |
6,39452708 |
72 |
40 |
34,27476727 |
5,725232729 |
14,31308182 |
73 |
67 |
42,94067833 |
24,05932167 |
35,90943533 |
74 |
123 |
133,3137508 |
-10,31375079 |
8,385163241 |
75 |
100 |
88,7462082 |
11,2537918 |
11,2537918 |
76 |
105 |
115,9819287 |
-10,98192867 |
10,45897969 |
77 |
70,3 |
83,29906411 |
-12,99906411 |
18,49084511 |
78 |
82 |
115,9819287 |
-33,98192867 |
41,44137643 |
79 |
280 |
207,5929884 |
72,40701158 |
25,85964699 |
80 |
200 |
145,6936237 |
54,30637627 |
27,15318814 |
Среднее |
101,2375 |
101,2375 |
|
21,89080885 |
По столбцу относительных погрешностей найдем среднее значение (с помощью функции СРЗНАЧExcel).
, это свидетельствует о том, что качество модели не удовлетворительное. Ближе всех к 7% значение .
Ни одну из моделей по данному критерию оценки считать приемлемой нельзя. Лучшей моделью является зависимость цены квартиры от жилой площади квартиры Y = f(Х4).
4.3. Проверим значимость полученных уравнений с помощью F – критерия Фишера.
,
k – количество факторов, включенных в модель.
F – статистики определены инструментом «Регрессия» пакета «Анализ данных» в Excel (таблицы «Дисперсионный анализ»):
F1 = 0,0048179 F2 = 49,17440478 F3 = 122,9467831
С помощью функции РАСПОБР Excel или по таблице найдем значение Fкр=4.098 для уровня значимости α=5%, и чисел степеней свободы k1=1, k2=38.
F2>Fкр, F3>Fкр следовательно, уравнения модели (2) и (3) являются значимыми, их использование целесообразно, зависимая переменная Y достаточно хорошо описывается включенными в модели (2) и (3) факторными переменными Х2 и Х4.
F1<Fкр, следовательно уравнение модели (1) не является значимым и использование этой модели нецелесообразно.
Вывод: на основании оценки качества моделей по коэффициенту детерминации, средней ошибке аппроксимации и критерию Фишера наилучшей является модель (3) зависимости цены квартиры от ее жилой площади: .