
- •Ход исследования.
- •Модель 1: мнк, использованы наблюдения 1-222 Зависимая переменная: l_Price__rub_
- •Исключено пропущенных или неполных наблюдений: 68 Зависимая переменная: l_Price__rub_
- •Исключено пропущенных или неполных наблюдений: 78 Зависимая переменная: l_Price__rub_
- •Модель 2: мнк, использованы наблюдения 1-222 Зависимая переменная: sq_e
- •Модель 3: мнк, использованы наблюдения 1-222 Зависимая переменная: sq_e
- •Модель 3: мнк, использованы наблюдения 1-222 Зависимая переменная: l_Price_new
- •Модель 4: мнк, использованы наблюдения 1-222 Зависимая переменная: l_Price_new
- •Модель 5: мнк, использованы наблюдения 1-222 Зависимая переменная: l_Price_new
- •Заключение.
- •Вклад участников во время выполнения проекта.
Модель 3: мнк, использованы наблюдения 1-222 Зависимая переменная: sq_e
|
Коэффициент |
Ст. ошибка |
t-статистика |
P-значение |
|
const |
0,0425032 |
0,0050173 |
8,4713 |
<0,00001 |
*** |
Germany |
0,251997 |
0,0470664 |
5,3541 |
<0,00001 |
*** |
Fiat |
0,0693126 |
0,0385386 |
1,7985 |
0,07352 |
* |
Porshe |
-0,289383 |
0,0530642 |
-5,4534 |
<0,00001 |
*** |
Rolls_royce |
0,16605 |
0,0470664 |
3,5280 |
0,00051 |
*** |
Smart |
-0,194121 |
0,0810569 |
-2,3949 |
0,01750 |
** |
Volkswagen |
-0,290829 |
0,0553724 |
-5,2522 |
<0,00001 |
*** |
Audi |
-0,272889 |
0,0491997 |
-5,5466 |
<0,00001 |
*** |
Lamborghini |
0,334263 |
0,0385386 |
8,6735 |
<0,00001 |
*** |
Maybach |
0,70625 |
0,0661827 |
10,6712 |
<0,00001 |
*** |
Mercedes_Benz |
-0,273509 |
0,0573159 |
-4,7720 |
<0,00001 |
*** |
Среднее зав. перемен |
0,056388 |
|
Ст. откл. зав. перемен |
0,121835 |
Сумма кв. остатков |
0,924211 |
|
Ст. ошибка модели |
0,066183 |
R-квадрат |
0,718268 |
|
Испр. R-квадрат |
0,704916 |
F(10, 211) |
53,79396 |
|
Р-значение (F) |
1,39e-52 |
Лог. правдоподобие |
293,4413 |
|
Крит. Акаике |
-564,8826 |
Крит. Шварца |
-527,4532 |
|
Крит. Хеннана-Куинна |
-549,7709 |
Как видно, конечный вариант модели достаточно качественный, поскольку все переменные значимы, а R-квадрат достаточно высок.
Из полученного уравнения получаем предсказанные значения квадрата остатков, которые, по сути, являются оценками дисперсий случайных ошибок (создадим из них отдельную переменную, сохранив расчетные значения из последней модели). Попробуем теперь изменить нашу Модель 1 с помощью взвешенного МНК, используя в качестве весов нашу новую переменную (назовем ее y).
В результате получаем следующую модель:
Модель 3: мнк, использованы наблюдения 1-222 Зависимая переменная: l_Price_new
|
Коэффициент |
Ст. ошибка |
t-статистика |
P-значение |
|
const_new |
8,97831 |
0,860765 |
10,4306 |
<0,00001 |
*** |
l_Vehicle_new |
1,10064 |
0,0319669 |
34,4306 |
<0,00001 |
*** |
l_Max_speed_new |
0,9353 |
0,137433 |
6,8055 |
<0,00001 |
*** |
l_Accel_new |
-0,349178 |
0,069754 |
-5,0058 |
<0,00001 |
*** |
Italy_new |
0,261095 |
0,0743767 |
3,5104 |
0,00055 |
*** |
China_new |
-0,380154 |
0,0754421 |
-5,0390 |
<0,00001 |
*** |
Germany_new |
0,229997 |
0,0232776 |
9,8806 |
<0,00001 |
*** |
UK_new |
0,5681 |
0,108756 |
5,2236 |
<0,00001 |
*** |
Среднее зав. перемен |
504,9901 |
|
Ст. откл. зав. перемен |
677,5775 |
Сумма кв. остатков |
6807,796 |
|
Ст. ошибка модели |
5,640224 |
R-квадрат |
0,999957 |
|
Испр. R-квадрат |
0,999956 |
F(8, 214) |
621107,9 |
|
Р-значение (F) |
0,000000 |
Лог. правдоподобие |
-694,9736 |
|
Крит. Акаике |
1405,947 |
Крит. Шварца |
1433,169 |
|
Крит. Хеннана-Куинна |
1416,938 |
В ней все переменные значимы, однако наблюдается очень сильная гетероскедастичность:
Метод инфляционных факторов
Минимальное возможное значение = 1.0
Значения > 10.0 могут указывать на наличие мультиколлинеарности
const_new 11760,268
l_Vehicle_new 11,827
l_Max_speed_new 8602,792
l_Accel_new 377,617
Italy_new 1,039
China_new 1,035
Germany_new 48,735
UK_new 1,019
VIF(j) = 1/(1 - R(j)^2), где R(j) - это коэффициент множественной корреляции между переменной j и другими независимыми переменными
Более того, избавиться от гетероскедастичности таким образом также не удалось (ниже приведены результаты тестов Вайта и Бреуша-Пагана):
Тест Вайта (White) на гетероскедастичность -
Нулевая гипотеза: гетероскедастичность отсутствует
Тестовая статистика: LM = 146,08
р-значение = P(Хи-квадрат (31) > 146,08) = 7,41673e-017
Тест Бриша-Пэгана (Breusch-Pagan) на гетероскедастичность -
Нулевая гипотеза: гетероскедастичность отсутствует
Тестовая статистика: LM = 142,677
р-значение = P(Хи-квадрат (7) > 142,677) = 1,39686e-027
К сожалению, дальнейшее усовершенствование данной модели не привели нас к качественной модели. Однако в ходе работы нам все же случайно удалось добиться хорошей спецификации.
Вернемся к полученной нами переменной y. Создадим новую переменную, взяв экспоненту от y. Подобные действия требуются, если модель, отражающая зависимость дисперсии от тех или иных переменных, логарифмическая. В нашем случае взвешивание по новой переменной (W=exp(y)) не является взвешенным МНК, но, тем не менее, приводит нас к удачному решению проблемы. Итак, получаем следующую модель: