i 1 r 1
Крок 4. Обчислюється параметр
де n — загальна сукупність спостережень; nr — кількість спостережень r-ї групи.
Крок 5. Обчислюється критерій:
2 ln , |
(7.5) |
який наближено відповідатиме розподілу 2 |
при ступені свободи |
k 1 , коли дисперсія всіх спостережень однорідна. Тобто якщо значення не менше за табличне значення 2 за вибраного рів-
ня довіри і ступені свободи k 1, то спостерігається гетероскедастичність.
Приклад 7.2. Для даних, які наведено у прикладі 7.1, перевіримо наявність гетероскедастичності згідно з критерієм .
Розв’язання
Крок 1. Розіб’ємо дані залежної змінної, які наведені в таблиці 7.1, на три групи, по шість спостережень у кожній.
Група I |
Група II |
Група III |
|
|
|
0,36 |
0,41 |
0,82 |
|
|
|
0,20 |
0,50 |
1,04 |
|
|
|
0,08 |
0,43 |
1,53 |
|
|
|
0,20 |
0,59 |
1,94 |
|
|
|
0,10 |
0,90 |
1,75 |
|
|
|
0,12 |
0,95 |
1,99 |
|
|
|
Крок 2. Обчислимо суму квадратів відхилень індивідуальних значень кожної групи від свого середнього значення:
2.1. yI |
0,1767; yII |
0,6300; yIII 1,5117. |
|
|
|
2.2. S1 |
6 |
( yiI yI )2 |
0,053133 ; |
S2 |
6 |
( yiII yII )2 |
0,2822 ; |
|
|
|
i 1 |
|
|
|
i 1 |
|
|
6
S3 ( yiIII yIII )2 1,170283 .
i 1
Крок 3. Знайдемо суму квадратів відхилень за всіма трьома групами:
3
Sr =S1+S2+S3=0,05313++ 0,2822+1,1703=1,5056.
r 1
Крок 4. Обчислимо параметр
|
|
0,053 |
3 |
0,282 |
3 |
1,170 |
3 |
|
|
|
6 |
|
|
6 |
|
|
6 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0,00265. |
|
|
|
1,5056 |
9 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
18 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Крок 5. Знайдемо критерій
2 ln 11,848.
Цей критерій наближено задовольняє розподіл 2 з k–1=2 ступенями свободи. Порівняємо значення критерію з табличним значенням критерію 2 з k–1=2 ступенями свободи за рівня дові-
ри 0,99, кр2 = 9,21. Оскільки > кр2 , то дисперсія залишків буде
змінюватись, тобто для даних табл. 7.1 спостерігається гетероскедастичність.
7.3.2. Параметричний тест Гольдфельда— Квандта. У випадку, коли сукупність спостережень невелика, розглянутий вище метод застосовувати недоцільно.
7
У такому разі Гольдфельд і Квандт запропонували розглянути випадок, коли M (uu ) u2 xij2 , тобто дисперсія залишків зростає
пропорційно до квадрата однієї з незалежних змінних моделі:
Y=XA+u.
Для виявлення наявності гетероскедастичності згадані вчені склали параметричний тест, в якому потрібно виконати такі кроки.
Крок 1. Упорядкувати спостереження відповідно до величини елементів вектора Xj.
Крок 2. Відкинути c спостережень, які містяться в центрі вектора. Ця процедура дасть змогу порівняти дисперсії залишків для найменших та найбільших значень пояснювальної змінної. Згідно з експериментальними розрахунками автори знайшли оптимальні співвідношення між параметрами c і n для 30—60 спостережень, де n — кількість елементів вектора X j :
nc 154 .
Крок 3. Побудувати дві економетричні моделі на основі 1МНК за двома утвореними сукупностями спостережень обсягом
n |
|
n c |
, n |
2 |
|
n c |
|
за умови, що обсяг n |
і n |
2 |
перевищує кіль- |
|
|
1 |
2 |
|
2 |
|
1 |
|
|
кість змінних m. Якщо n1 n2 , то відкидається перше або останнє |
спостереження сукупності. |
|
|
|
|
Крок 4. Знайти суму квадратів залишків за першою (1) і дру- |
гою (2) моделями S1 |
і S2 : |
|
|
|
S1 u1u1 ,
де u1 — залишки за моделлю (1);
S2 u2u2 ,
де u2 |
— залишки за моделлю (2). |
|
|
|
Крок 5. Обчислити критерій |
|
|
|
|
R* |
S2 |
, |
(7.6) |
|
S |
|
|
|
|
|
|
1 |
|
|
який у разі виконання гіпотези про гомоскедастичність відповідатиме F-розподілу з (n c 2m)2 , (n c 2m)2 ступенями сво-
боди. Це означає, що обчислене значення R* порівнюється з таб-
личним значенням F-критерію для ступенів свободи (n c 2m)2
і (n c 2m) 2 і вибраним рівнем значущості . Якщо |
R* F , |
то гетероскедастичність відсутня. |
табл |
|
Приклад 7.3. У табл. 7.3 наведено дані про загальні витрати та витрати на харчування сімей. Для цих даних перевірити гіпотезу про наявність гетероскедастичності.
Таблиця 7.3
Номер спосте- |
Витрати на харчу- |
Загальні ви- |
€ |
u |
u2 |
реження |
вання, ум.од. |
трати, ум.од. |
Y |
|
|
1 |
2,30 |
15 |
2,16 |
0,14 |
0,020 |
2 |
2,20 |
15 |
2,16 |
0,04 |
0,002 |
3 |
2,08 |
16 |
2,20 |
–0,12 |
0,015 |
4 |
2,20 |
17 |
2,25 |
–0,05 |
0,002 |
5 |
2,10 |
17 |
2,25 |
–0,15 |
0,022 |
6 |
2,32 |
18 |
2,29 |
0,26 |
0,0007 |
7 |
2,45 |
19 |
2,34 |
0,11 |
0,012 |
8 |
2,50 |
20 |
|
|
|
9 |
2,20 |
20 |
|
|
|
10 |
2,50 |
22 |
|
|
|
11 |
3,10 |
64 |
|
|
|
12 |
2,50 |
68 |
2,37 |
0,13 |
0,016 |
13 |
2,82 |
72 |
2,52 |
0,29 |
0,085 |
14 |
3,04 |
80 |
2,68 |
0,36 |
0,128 |
15 |
2,70 |
85 |
2,99 |
–0,29 |
0,084 |
16 |
3,94 |
90 |
3,18 |
0,76 |
0,573 |
17 |
3,10 |
95 |
3,38 |
–0,28 |
0,076 |
18 |
3,99 |
100 |
3,57 |
0,42 |
0,178 |
Розв’язання.
1. Ідентифікуємо змінні:
Y — вектор витрат на харчування, залежна змінна;
X — вектор загальних витрат, незалежна змінна.
Y=f(X, u).
2.Для перевірки гіпотези про наявність гетероскедастичності застосуємо параметричний тест Гольдфельда—Квандта.
2.1.Упорядкуємо значення незалежної змінної від меншого до більшого і відкинемо c значень, які містяться всередині впорядкованого ряду:
nc 154 , c 4.
У результаті матимемо дві сукупності спостережень:
n |
n c |
18 4 7, |
n |
2 |
n c |
18 4 7. |
1 |
2 |
2 |
|
2 |
2 |
2.2.Побудуємо дві економетричні моделі на основі двох новостворених сукупностей спостережень.
2.3.Визначимо залишки за цими двома моделями:
€ |
; |
€ |
u YI YI |
u YII YII . |
Залишки та квадрати залишків наведено в табл. 7.3.
2.4. Обчислимо дисперсії залишків та знайдемо їх співвідношення:
|
R* |
S2 |
|
1,14 |
15,41 . |
|
S |
0,074 |
|
|
|
|
|
|
1 |
|
|
|
2.5. Порівняємо критерій R* з критичним значенням F- критерію при 1=5 і 2=5 ступенях свободи і значущості =0,01
F( =0,01) = 11. Оскільки R* > Fкр , то вихідні дані з імовірністю 0,99 мають гетероскедастичність.
7.3.3. Непараметричний тест Гольдфельда— Квандта. Гольдфельд і Квандт для оцінювання наявності гетероскедастичності запропонували також непараметричний тест. Цей тест базується на числі піків у динаміці величини залишків
після впорядкування спостережень за xij .
Закономірність зміни величини залишків, коли дисперсія є сталою, — явище гомоскедастичності ілюструє рис. 7.1, а на рис.7.2 спостерігається явище гетероскедастичності.
Цей тест, звичайно, не такий надійний, як параметричний, але він досить простий.
0 |
xij |
|
|
0 |
xij |
|
Рис. 7.1 |
Рис. 7.2 |
Зауважимо, що на рис.7.1 зображено, як змінюються залишки, що мають сталу дисперсію, а на рис.7.2 — залишки, дисперсія яких змінюється для різних груп спостережень.
Приклад 7.4. Дослідимо залежність залишків від кожної із пояснювальних змінних, за якими побудовано економетричну модель прибутку (див. приклад 4.2).
Подамо цю залежність графічно.
5 |
|
|
|
|
|
|
0 |
|
|
|
|
|
|
0 |
20 |
40 |
60 |
80 |
100 |
120 |
– 5 |
|
|
Змінна X1 |
|
|
|
|
|
|
|
Рис. 7.3. Коливання залишків на основі змінної X1
Рис. 7.4. Коливання залишків на основі змінної X2
Рис. 7.5. Коливання залишків на основі змінної X3
На кожному з рис. 7.3—7.5 наведено коливання залишків навколо нуля, тобто свого математичного сподівання. Як видно з цих рисунків, залишки «розсіяні» навколо нуля без певної тенденції. А це означає, що залишки не є гетероскедастичними щодо цих змінних.
7.3.4. Тест Глейзера. Ще один тест для перевірки гетероскедастичності запропонував Глейзер. Він розглядає регресію
модуля залишків ui , що відповідають регресії найменших квадратів, як певну функцію від X j , де X j — та незалежна змінна,
яка відповідає зміні дисперсії u2 . Для цього використовуються такі види функцій:
1) |
|
|
|
u |
|
|
|
a |
0 |
a x |
i j |
|
i |
; |
|
2) |
|
|
|
u |
|
|
|
a |
0 |
a x 1 |
|
i |
; |
|
|
|
|
|
|
|
|
|
i |
|
|
|
|
1 |
|
|
|
|
|
|
|
i |
|
|
|
|
1 |
i j |
|
|
|
3) |
|
u |
|
a |
0 |
a x 1 2 |
; |
4) |
|
u |
|
a |
0 |
a x 2 |
|
i |
. |
|
|
|
|
|
|
|
|
i |
|
|
|
1 |
i j |
|
|
i |
|
|
|
|
|
i |
|
|
|
1 |
i j |
|
|
У цих рівняннях i — стохастична складова. |
|
|
|
|
|
Рішення про відсутність гетероскедастичності залишків при-
ймається на підставі статистичної значущості коефіцієнтів a0 і a1. Переваги цього тесту визначаються можливістю розрізняти випадок чистої і мішаної гетероскедастичності.
Можливі чотири випадки: |
|
|
|
1) a€0 |
, a€1 є статистично значущими; |
|
|
2) a€0 |
— статистично |
значуща, |
a€1 |
— статистично |
незначуща |
оцінка; |
|
|
|
|
|
3) a€1 — статистично |
значуща, |
a€0 |
— статистично |
незначуща |
оцінка; |
|
|
|
|
|
4) a€0 , a€1 — статистично незначущі. |
|
|
У першому випадку залишки гетероскедастичні, причому існує чиста і мішана гетероскедастичність. У другому випадку залишки мають мішану гетероскедастичність. Третій випадок свідчить про наявність чистої гетероскедастичності. У четвертому випадку гетероскедастичність відсутня.
Приклад 7.4. Нехай потрібно перевірити наявність гетероскедастичності для побудови економетричної моделі, яка описуватиме залежність між рівнем заощаджень і доходом. Вихідні дані наведено в табл. 7.4.
|
|
|
|
|
Таблиця 7.4 |
|
|
|
|
|
|
Місяць |
Дохід, гр.од. |
Заощадження, |
Місяць |
Дохід, гр.од. |
Заощадження, |
|
|
гр.од. |
|
|
гр.од. |
1 |
10,8 |
2,36 |
10 |
17,5 |
2,59 |
|
|
|
|
|
2,90 |
2 |
11,4 |
2,20 |
11 |
18,7 |
|
|
|
|
|
2,95 |
3 |
12,0 |
2,08 |
12 |
19,7 |
|
|
|
|
|
2,82 |
4 |
12,6 |
2,20 |
13 |
20,6 |
|
|
|
|
|
3,04 |
5 |
13,0 |
2,10 |
14 |
21,7 |
|
|
|
|
|
3,53 |
6 |
13,9 |
2,12 |
15 |
23,1 |
|
|
|
|
|
3,44 |
7 |
14,7 |
2,41 |
16 |
24,8 |
|
|
|
|
|
3,75 |
8 |
15,5 |
2,50 |
17 |
25,9 |
|
|
|
|
|
3,99 |
9 |
16,3 |
2,43 |
18 |
27,2 |
|
|
|
|
|
|
Використаємо параметричний тест Гольдфельда—Квандта для встановлення гетероскедастичності у визначенні залежності між наведеними показниками.
Розв’язання. Ідентифікуємо змінні: Y — заощадження — залежна змінна;
X — дохід — пояснююча змінна, Y f ( X , u).
Крок 1. Вихідна сукупність спостережень упорядковується відповідно до величини елементів вектора Х, який може впливати
на зміну величини дисперсії залишків. Оскільки в табл.7.3 дані про дохід упорядковані, то переходимо до наступного кроку.
Крок 2. Відкинемо c спостережень, які розташовано в центрі
векторів Х і Y, де c 4n 4 18 4 , і поділимо сукупність спосте-
15 15
режень на дві частини, кожна з яких містить n c |
18 4 7 |
спостережень. |
|
2 |
2 |
|
|
|
Крок 3. Побудуємо економетричну модель за першою сукуп- |
ністю, яка містить спостереження від першого по сьомий місяць |
€ |
€ |
€ |
|
включно: Y |
a0 |
a1 X . Система нормальних рівнянь для визна- |
чення параметрів цієї моделі запишеться так: |
|
13
7a€0 88,4a€1 15,47;
88,4a€0 1127,66a€1 195,443.
Звідси a€0 =2,122; a€1 =0,007.
Економетрична модель має вигляд
€ |
2,122 0,007 X . |
|
|
|
I: Y |
|
|
|
Крок 4. Побудуємо економетричну модель виду |
€ |
€ |
€ |
Y |
a0 |
a1 X |
за другою сукупністю спостережень, починаючи від дванадцятого до вісімнадцятого місяця.
Система нормальних рівнянь для визначення параметрів цієї моделі запишеться так:
7a€0 163a€1 24,02;
163a€0 3842,64a€1 567,083.
Звідси a€0 = – 0,408; a€1 = 0,165.
Економетрична модель має вигляд: II: Y 0,408 0,165X .
Крок 5. Знайдемо розрахункові значення залежної змінної мо-
делі € — розміру заощадження за кожною з двох моделей, і ви-
Y
значимо відхилення фактичних значень заощаджень від розрахункових.
Таблиця 7.5
Місяць |
Y |
Y |
u |
u2 |
1 |
2,36 |
2,00 |
0,36 |
0,1296 |
2 |
2,20 |
2,06 |
0,14 |
0,0196 |
3 |
2,08 |
2,13 |
–0,05 |
0,0025 |
4 |
2,20 |
2,19 |
0,01 |
0,0001 |
5 |
2,10 |
2,24 |
–0,14 |
0,0196 |
6 |
2,12 |
2,34 |
–0,22 |
0,0484 |
7 |
2,41 |
2,43 |
–0,02 |
0,0004 |
Разом |
|
|
|
0,2202 |
Таблиця 7.6
Місяць |
Y |
Y |
u |
u2 |
12 |
2,95 |
2,99 |
–0,04 |
0,0016 |
13 |
2,82 |
3,09 |
–0,27 |
0,0729 |
14 |
3,04 |
3,21 |
–0,17 |
0,0289 |
15 |
3,53 |
3,37 |
0,16 |
0,0256 |
16 |
3,94 |
3,56 |
0,38 |
0,1444 |
17 |
3,75 |
3,68 |
0,07 |
0,0049 |
18 |
3,99 |
3,83 |
0,16 |
0,0256 |
Разом |
|
|
|
0,3039 |
У табл.7.5 наведено результати обчислення суми квадратів залишків за першою моделлю S1=0,2202.
У табл.7.6 наведено обчислення суми квадратів залишків за другою моделлю S2=0,3039.
Крок 6. Обчислимо критерій R* , який наближено відповідає F-розподілу:
R* S2 0,3039 1,33 .
S1 0,2202
Порівняємо його значення з табличним значенням F-критерію за вибраного рівня довіри Р=0,99 і ступенях свободи 1=5 і 2=5. Fтабл=11. Звідси R*<Fтабл, що свідчить про відсутність гетероскедастичності.
7.3.5. Тест рангової кореляції Спірмена. Наявність чис-
тої гетероскедастичності в сукупності спостережень можна виявити, розрахувавши рангові коефіцієнти кореляції Спірмена. На базі коефіцієнта Спірмена побудовано відповідний тест, алгоритм якого полягає в реалізації таких кроків:
Крок 1. Побудова простих економетричних моделей 1МНК залежної змінної (Y) з кожною з пояснювальних змінних (Хj).
Крок 2. Визначення вектора залишків для кожної з побудованих моделей (uj).
Крок 3. Ранжування вектора кожної пояснювальної змінної (Хj) і кожного з векторів u j від меншого до більшого та заміна
компонентів цих векторів їхніми рангами.
Крок 4. Визначення коефіцієнта рангової кореляції Спірмена за формулою:
|
rx ju j |
|
dij2 |
|
|
|
(7.7) |
|
1 6 n(n2 1) , |
|
|
|
i |
|
|
|
|
|
|
|
де dij — різниця між рангами xij та u j |
i |
|
; |
j |
|
; |
|
1, n |
|
1, m 1 |
n—кількість спостережень; m–1—кількість пояснювальних змінних.
Крок 5. Розраховується t-статистика для визначення рівня статистичної значущості кореляції Спірмена за формулою:
15