- •Пример проверки предпосылок мнк.
- •Проверяем случайный характер остатков.
- •А) Вычисляем среднюю величину остатков;
- •Проверяем наличие (отсутствие) гомоскедастичности для дисперсии ряда остатков.
- •Проверяем наличие (отсутствие) автокорреляции ряда остатков.
- •Проверяем, подчиняется ли ряд остатков нормальному распределению.
Проверяем случайный характер остатков.
Для этого строим график зависимости остатков от теоретических значений результата (Рисунок 1).
Рисунок 1.
Будем считать, что на графике получена горизонтальная полоса. Таким образом, I предпосылка выполняется, и теоретические значения результата хорошо аппроксимируют фактические значения.
А) Вычисляем среднюю величину остатков;
Б) Проверяем независимость ряда остатков от значений фактора.
А)
,
что означает: средняя величина остатков
очень мало отличается от 0 и пункт А)
выполним.
Б) Строим график зависимости остатков от значений факторного признака (Рисунок 2).
Будем считать, что на графике получена горизонтальная полоса.
Таким образом, II предпосылка выполняется, и остатки независимы от значений факторного признака.
Проверяем наличие (отсутствие) гомоскедастичности для дисперсии ряда остатков.
Применим метод Гольдфельда-Квандта.
( ! Обратите внимание, на сложные моменты в применении метода).
Упорядочиваем n наблюдений по мере возрастания переменной x:
X Y
1 1 30
2 2 70 I
3 3 100
4 3 100
Исключили центральное наблюдение.
5 4 150
6 4 150 II
7 5 170
Исключаем из рассмотрения с центральных наблюдений (см. п. 2):
(n – c): 2 > p, где p – число оцениваемых параметров.
Для модели задачи 1: p = 2, n = 7, c = 1. (7 – 1): 2 = 3 > 2
Авторы метода предлагают:
При n
= 30, c = 8; При n
= 60 , c = 16; При n
= 20, c = 4. (В литературе
встречается замечание, что с
примерно составляет
общего количества наблюдений).
Разделяем совокупность из (n – c) наблюдений на две группы и определяем по каждой из групп уравнение регрессии: А и Б.
I)
|
y |
x |
yx |
x2 |
|
|
|
30 |
1 |
30 |
1 |
31,63 |
2,657 |
|
70 |
2 |
140 |
4 |
66,666 |
11,116 |
|
100 |
3 |
300 |
9 |
101,702 |
2,897 |
|
200 |
6 |
470 |
14 |
|
16,67 |
Ср. |
66,666 |
2 |
156,666 |
4,666 |
|
|
А:
x
= a1
+ b1x,
b1
=
,
a1 =66,666
– 35,036
2
= - 3,406,
x = -3,406 + 35,036 x.
II)
|
y |
x |
yx |
x2 |
|
|
|
150 |
4 |
600 |
16 |
150,04 |
0,0002 |
|
150 |
4 |
600 |
16 |
150,014 |
0,0002 |
|
170 |
5 |
850 |
25 |
169,992 |
0,0001 |
|
470 |
13 |
2050 |
57 |
|
0,0005 |
Ср. |
156,667 |
4,333 |
683,333 |
19 |
|
|
Б: x = a2 + b2x,
b2
=
,
a2 =
156,667 – 19,978
4,333
= 70,102,
x
= 70,102 + 19,978 x.
4. Рассчитываем показатель R и применяем F-статистику Фишера для определения наличия или отсутствия гомоскедастичности дисперсии остатков.
R
=
.
Важно! В числитель показателя R
всегда записывается
из сумм
и
.
В данном случае
=16,67,
=0,0005.
F
табл. = 161,45 находим в таблице
Фишера – Снедекора, учитывая, по
договоренности, уровень значимости
и df =
.
В данном случае df = ( 7 – 1 – 2*2) : 2 = 2 : 2 = 1.
R > Fтабл., следовательно, Hо о наличии гомоскедастичности отклоняется и принимается гетероскедостичность дисперсии ряда остатков.
Таким образом, III предпосылка не выполняется.
