- •Национальный Исследовательский Университет Высшая Школа Экономики Факультет мировой экономики и мировой политики
- •Введение
- •Построение регрессионной модели
- •Линейная модель:
- •Логарифмическая модель:
- •Полулогарифмическая модель (1):
- •Полулогарифмическая модель (2):
- •Выбор модели с наилучшей объясняющей способностью:
- •Сравнение линейной и полулогарифмической (1) моделей.
- •Полулогарифмическая модель с включением переменной d_priceperm_hat Таблица 9
- •Линейная модель с включением переменной d_lnpriceperm_hat Таблица 10
- •Сравнение линейной и логарифмической моделей.
- •Среднее геометрическое priceperm Таблица 11
- •Линейная модель с включением переменной priceperm_star Таблица 12
- •Логарифмическая модель с включением переменной lgpriceperm_star Таблица 13
- •Сравнение логарифмической и полулогарифмической(1) моделей
- •Сравнение полулогарифмической (1) и полулогарифмической (2) моделей
- •Тестирование модели
- •Тестирование модели на мультиколлинеарность
- •Тестирование модели на гетероскедастичность
- •Полулогарифмическая модель с введёнными робастными поправками Таблица 16
- •Тестирование модели на наличие пропущенных переменных
- •Тестирование модели на возможные изменения при введении квадрата одной из переменных
- •Полулогарифмическая модель с введением переменной sq_kitsp Таблица 17
- •Проверка гипотез
- •Гипотеза 1: этаж, на котором расположена квартира, и количество этажей в доме одинаково влияют на цену квадратного метра.
- •Полулогарифмическая модель с введением переменной f13 и робастными поправками
- •Этаж, на котором расположена квартира, и количество этажей в доме одинаково влияют на цену квадратного метра.
- •Расположение квартиры на 13-м этаже отрицательно влияет на цену квадратного метра и снижает её на 4,8%.
- •Влияние несчастливого числа 13 (в качестве номера дома) и счастливых чисел 7 и 3 (в качестве номеров домов и этажей) на цену квадратного метра не выявлено.
Построение регрессионной модели
Для оценки влияния определенных факторов на стоимость квадратного метра квартиры нам необходимо построить регрессионную модель. Для этого построим несколько видов моделей: линейную, логарифмическую, полулогарифмическую по зависимой переменной и полулогарифмическую по факторам:
Линейная модель:
Оценка линейной модели Таблица 4
Source | SS df MS Number of obs = 763
-------------+---------------- ------------- F( 16, 746) = 45.02
Model | 280918767 16 17557423 Prob > F = 0.0000
Residual | 290939912 746 389999.882 R-squared = 0.4912
-------------+------------------------------ Adj R-squared = 0.4803
Total | 571858679 762 750470.708 Root MSE = 624.5
priceperm |
Coef. |
Std. Err. t |
P>t |
[95% Conf. |
Interval] |
totsp |
-23.83594 |
8.222067 -2.90 |
0.004 |
-39.97708 |
-7.694796 |
livesp |
2.229188 |
11.62848 0.19 |
0.848 |
-20.59924 |
25.05762 |
kitsp |
120.9425 |
22.36393 5.41 |
0.000 |
77.03878 |
164.8462 |
dist |
-114.3117 |
6.939782 -16.47 |
0.000 |
-127.9356 |
-100.6879 |
metrdist |
-31.75717 |
5.466021 -5.81 |
0.000 |
-42.48779 |
-21.02656 |
walk |
512.4305 |
50.0966 10.23 |
0.000 |
414.0834 |
610.7776 |
brick |
241.3125 |
56.45363 4.27 |
0.000 |
130.4856 |
352.1394 |
tel |
131.6624 |
64.80613 2.03 |
0.043 |
4.438296 |
258.8865 |
bal |
-58.10572 |
68.42888 -0.85 |
0.396 |
-192.4418 |
76.23037 |
floor |
504.257 |
89.0837 5.66 |
0.000 |
329.3724 |
679.1416 |
new |
-382.2859 |
157.241 -2.43 |
0.015 |
-690.9735 |
-73.59829 |
floors |
43.17511 |
6.588258 6.55 |
0.000 |
30.24137 |
56.10884 |
nfloor |
21.12263 |
6.87479 3.07 |
0.002 |
7.626393 |
34.61887 |
floor1 |
(omitted) |
|
|
|
|
floor2 |
193.6415 |
121.1757 1.60 |
0.110 |
-44.24439 |
431.5274 |
sw |
220.4716 |
69.50931 3.17 |
0.002 |
84.01449 |
356.9288 |
w |
-15.53594 |
69.18949 -0.22 |
0.822 |
-151.3652 |
120.2933 |
nw |
(omitted) |
|
|
|
|
_cons |
5688.65 |
239.3413 23.77 |
0.000 |
5218.787 |
6158.513 |
В результате оценки методом МНК линейной модели переменные livesp, bal, floor2,w оказались незначимы, а переменные floor1 и nw пропущены из-за совершенной коллинеарности. В связи с разной степенью незначимости данных переменных они убирались из модели пошагово для, того, чтобы проследить возможные изменения в значимости остальных переменных.
Убираем из модели незначимые переменные:
Оценка линейной модели без незначимых переменных Таблица 5
Source |
SS |
df MS |
Number of obs |
= 763 |
|
|
|
|
F( 12, 750) |
= 59.91 |
|
|
|
Model |
279884922 |
12 23323743.5 |
Prob > F |
= 0.0000 |
|
|
Residual |
291973758 |
750 389298.343 |
R-squared |
= 0.4894 |
|
|
|
|
Adj R-squared |
= 0.4813 |
|
|
|
Total |
571858679 |
762 750470.708 |
Root MSE |
= 623.94 |
|
|
priceperm |
Coef. |
Std. Err. t |
P>t |
[95% Conf. |
Interval] |
|
totsp |
-22.14878 |
5.295816 -4.18 |
0.000 |
-32.54517 |
-11.7524 |
|
kitsp |
117.0832 |
21.66818 5.40 |
0.000 |
74.54572 |
159.6207 |
|
dist |
-112.9848 |
6.692801 -16.88 |
0.000 |
-126.1237 |
-99.84598 |
|
metrdist |
-31.68811 |
5.454763 -5.81 |
0.000 |
-42.39653 |
-20.97969 |
|
walk |
512.5983 |
50.00532 10.25 |
0.000 |
414.4313 |
610.7654 |
|
brick |
244.0884 |
55.68869 4.38 |
0.000 |
134.7642 |
353.4127 |
|
tel |
131.2453 |
64.63957 2.03 |
0.043 |
4.349287 |
258.1413 |
|
floor |
391.6417 |
54.75053 7.15 |
0.000 |
284.1592 |
499.1242 |
|
new |
-403.7455 |
155.9716 -2.59 |
0.010 |
-709.9384 |
-97.55256 |
|
floors |
40.00396 |
6.244949 6.41 |
0.000 |
27.7443 |
52.26362 |
|
nfloor |
25.84808 |
5.794812 4.46 |
0.000 |
14.4721 |
37.22406 |
|
sw |
234.2453 |
47.93815 4.89 |
0.000 |
140.1364 |
328.3543 |
|
_cons |
5744.119 |
203.9011 28.17 |
0.000 |
5343.834 |
6144.404 |
|
В последней модели представлены только значимые факторы, влияющие на цену квадратного метра. Удаление незначимых переменных не оказало существенного влияния на значимость остальных факторов.
