
Исследование на гетероскедастичность
Проверим нашу модель на гетероскедастичность. Для этого мы проведем тесты Уайта и Бреуша-Пагана, для выявления гетерокедастичности по уравнению в целом, а также тест Голдфелда-Квандта, проверяющий гетероскедастичность по одной конкретной переменной.
Тест Уайта
Проведем тест с перекрестными эффектами:
МНК, использованы наблюдения 1-200
Зависимая переменная: uhat^2
Пропущены из-за совершенной коллинеарности: sq_creepkills
Коэффициент Ст. ошибка t-статистика P-значение
-----------------------------------------------------------------------
const -1475,94 748,068 -1,973 0,0501 *
kills -24,5856 247,905 -0,09917 0,9211
deaths 212,583 281,326 0,7556 0,4509
assists 694,324 238,211 2,915 0,0040 ***
pro_account -419,934 281,522 -1,492 0,1376
sq_creepkills -3,17801 3,22337 -0,9859 0,3255
creepkills 102,037 71,7902 1,421 0,1570
sq_kills 18,1486 19,2202 0,9442 0,3464
X2_X3 -6,92742 71,2350 -0,09725 0,9226
X2_X4 7,09824 30,7159 0,2311 0,8175
X2_X5 44,3632 36,3063 1,222 0,2234
X2_X6 -0,0128939 0,345885 -0,03728 0,9703
X2_X7 -2,29176 16,9970 -0,1348 0,8929
sq_deaths 77,6877 86,1336 0,9019 0,3683
X3_X4 -91,2554 74,2674 -1,229 0,2208
X3_X5 73,2901 66,4285 1,103 0,2714
X3_X6 0,359778 0,440138 0,8174 0,4148
X3_X7 -19,5090 20,9402 -0,9317 0,3528
sq_assists -30,3873 18,8718 -1,610 0,1092
X4_X5 -54,5428 46,5835 -1,171 0,2433
X4_X6 0,415060 0,223126 1,860 0,0645 *
X4_X7 -26,3911 12,2868 -2,148 0,0331 **
X5_X6 -0,480976 0,333499 -1,442 0,1510
X5_X7 27,0030 17,8818 1,510 0,1328
sq_sq_creepki -0,000570341 0,000935713 -0,6095 0,5430
X6_X7 0,0597594 0,0868291 0,6882 0,4922
ВНИМАНИЕ: матрица данных близка к сингулярной!
Неисправленный R-квадрат = 0,149560
Тестовая статистика: TR^2 = 29,911980,
р-значение = P(Хи-квадрат(25) > 29,911980) = 0,227602
Тестовое значение выше критического, но на 22% уровне значимости. Принимаем нулевую гипотезу о гомоскедастичности.
Теперь тот же тест, но без перекрестных эффектов:
МНК, использованы наблюдения 1-200
Зависимая переменная: uhat^2
Пропущены из-за совершенной коллинеарности: sq_creepkills
Коэффициент Ст. ошибка t-статистика P-значение
----------------------------------------------------------------------
const 112,100 159,707 0,7019 0,4836
kills -103,787 61,3302 -1,692 0,0922 *
deaths -57,6476 197,882 -0,2913 0,7711
assists 60,1368 51,0516 1,178 0,2403
pro_account 8,42447 14,0958 0,5977 0,5508
sq_creepkills 0,131566 0,257318 0,5113 0,6097
creepkills -3,93003 8,22946 -0,4776 0,6335
sq_kills 26,6812 12,1901 2,189 0,0298 **
sq_deaths 13,6753 69,3669 0,1971 0,8439
sq_assists -7,48755 7,79832 -0,9601 0,3382
sq_sq_creepki -4,67023e-05 6,15240e-05 -0,7591 0,4487
ВНИМАНИЕ: матрица данных близка к сингулярной!
Неисправленный R-квадрат = 0,073708
Тестовая статистика: TR^2 = 14,741698,
р-значение = P(Хи-квадрат(10) > 14,741698) = 0,141767
Расчетный хи-квадрат вновь немного выше критического значения, но при уровне значимости 0,1417 – мы принимаем нулевую гипотезу о гомоскедастичности.
Тест Бреуша-Пагана
МНК, использованы наблюдения 1-200
Зависимая переменная: Масштабированное uhat^2
Коэффициент Ст. ошибка t-статистика P-значение
----------------------------------------------------------------
const -0,158126 2,01158 -0,07861 0,9374
kills 0,725169 0,352597 2,057 0,0411 **
deaths -0,388661 0,660096 -0,5888 0,5567
assists 0,194489 0,317492 0,6126 0,5409
pro_account 0,295569 0,354627 0,8335 0,4056
sq_creepkills -0,00112971 0,00202529 -0,5578 0,5776
creepkills 0,00674015 0,105502 0,06389 0,9491
Объясненная сумма квадратов = 45,8721
Тестовая статистика: LM = 22,936026,
р-значение = P(Хи-квадрат(6) > 22,936026) = 0,000818
Столь низкое значение p-value говорит нам, что в модели наблюдается гетероскедастичность.
Тест Голдфелда-Квандта
Возможно, гетероскедастичность вызвана регрессором creepkills – большой неоднородный разброс был заметен еще на этапе сбора данных.
Разобьем нашу выборку на 3 части и отсортируем наши наблюдения. Внизу приведены результаты для первых и последних 67 наблюдений:
МНК, использованы наблюдения 1-67
Зависимая переменная: winrate___
|
Коэффициент |
Ст. ошибка |
t-статистика |
P-значение |
|
const |
60,9983 |
9,71902 |
6,2762 |
<0,00001 |
*** |
kills |
9,25056 |
1,92888 |
4,7958 |
0,00001 |
*** |
deaths |
-12,3304 |
3,10284 |
-3,9739 |
0,00019 |
*** |
assists |
3,567 |
1,95191 |
1,8274 |
0,07261 |
* |
pro_account |
7,05962 |
2,03929 |
3,4618 |
0,00100 |
*** |
sq_creepkills |
0,0121537 |
0,0360042 |
0,3376 |
0,73687 |
|
creepkills |
-0,946877 |
1,01022 |
-0,9373 |
0,35236 |
|
Среднее зав. перемен |
60,39015 |
|
Ст. откл. зав. перемен |
11,15347 |
Сумма кв. остатков |
2883,302 |
|
Ст. ошибка модели |
6,932174 |
R-квадрат |
0,648823 |
|
Испр. R-квадрат |
0,613705 |
F(6, 60) |
18,47564 |
|
Р-значение (F) |
5,02e-12 |
Лог. правдоподобие |
-221,0958 |
|
Крит. Акаике |
456,1917 |
Крит. Шварца |
471,6245 |
|
Крит. Хеннана-Куинна |
462,2985 |
МНК, использованы наблюдения 134-200 (n = 67)
Зависимая переменная: winrate___
|
Коэффициент |
Ст. ошибка |
t-статистика |
P-значение |
|
const |
113,913 |
44,4029 |
2,5654 |
0,01282 |
** |
kills |
4,65771 |
1,83751 |
2,5348 |
0,01388 |
** |
deaths |
-4,33669 |
4,1676 |
-1,0406 |
0,30225 |
|
assists |
3,31179 |
1,62761 |
2,0348 |
0,04630 |
** |
pro_account |
6,64152 |
2,04052 |
3,2548 |
0,00187 |
*** |
sq_creepkills |
0,063116 |
0,0345611 |
1,8262 |
0,07279 |
* |
creepkills |
-4,16461 |
2,4302 |
-1,7137 |
0,09175 |
* |
Среднее зав. перемен |
65,67776 |
|
Ст. откл. зав. перемен |
9,936781 |
Сумма кв. остатков |
3194,765 |
|
Ст. ошибка модели |
7,296991 |
R-квадрат |
0,509766 |
|
Испр. R-квадрат |
0,460742 |
F(6, 60) |
10,39842 |
|
Р-значение (F) |
7,07e-08 |
Лог. правдоподобие |
-224,5322 |
|
Крит. Акаике |
463,0644 |
Крит. Шварца |
478,4972 |
|
Крит. Хеннана-Куинна |
469,1712 |
Следовательно, гетероскедастичность в модели не зависит от показателя убитых крипов.
Проверим другой регрессор – kills.
МНК, использованы наблюдения 1-67
Зависимая переменная: winrate___
|
Коэффициент |
Ст. ошибка |
t-статистика |
P-значение |
|
const |
47,3515 |
11,2051 |
4,2259 |
0,00008 |
*** |
kills |
3,94766 |
4,32446 |
0,9129 |
0,36497 |
|
deaths |
-9,31067 |
2,81396 |
-3,3087 |
0,00159 |
*** |
assists |
2,07155 |
2,0725 |
0,9995 |
0,32155 |
|
pro_account |
4,98242 |
1,64529 |
3,0283 |
0,00362 |
*** |
sq_creepkills |
-0,0209821 |
0,0273088 |
-0,7683 |
0,44531 |
|
creepkills |
0,876569 |
1,25152 |
0,7004 |
0,48638 |
|
Среднее зав. перемен |
55,55194 |
|
Ст. откл. зав. перемен |
6,511314 |
Сумма кв. остатков |
1853,619 |
|
Ст. ошибка модели |
5,558205 |
R-квадрат |
0,337571 |
|
Испр. R-квадрат |
0,271328 |
F(6, 60) |
5,095961 |
|
Р-значение (F) |
0,000276 |
Лог. правдоподобие |
-206,2957 |
|
Крит. Акаике |
426,5913 |
Крит. Шварца |
442,0242 |
|
Крит. Хеннана-Куинна |
432,6981 |
МНК, использованы наблюдения 134-200 (n = 67)
Зависимая переменная: winrate___
|
Коэффициент |
Ст. ошибка |
t-статистика |
P-значение |
|
const |
62,1789 |
14,1466 |
4,3953 |
0,00005 |
*** |
kills |
5,37972 |
2,41419 |
2,2284 |
0,02961 |
** |
deaths |
-7,34035 |
4,19879 |
-1,7482 |
0,08554 |
* |
assists |
4,60614 |
1,31193 |
3,5110 |
0,00085 |
*** |
pro_account |
5,20682 |
2,08379 |
2,4987 |
0,01522 |
** |
sq_creepkills |
0,0173048 |
0,00901466 |
1,9196 |
0,05966 |
* |
creepkills |
-1,04221 |
0,530025 |
-1,9663 |
0,05389 |
* |
Среднее зав. перемен |
68,16821 |
|
Ст. откл. зав. перемен |
9,743883 |
Сумма кв. остатков |
3085,728 |
|
Ст. ошибка модели |
7,171388 |
R-квадрат |
0,507564 |
|
Испр. R-квадрат |
0,458321 |
F(6, 60) |
10,30722 |
|
Р-значение (F) |
8,02e-08 |
Лог. правдоподобие |
-223,3689 |
|
Крит. Акаике |
460,7377 |
Крит. Шварца |
476,1706 |
|
Крит. Хеннана-Куинна |
466,8446 |
Оказывается, гетероскедастичность в модели была скрыта в регрессоре kills. Уровень значимости – 5%.