2.2 Аналіз моделі на наявність мультиколінеарності
Знаходження кореляційної матриці r.
Знайдемо кореляційну матрицю r, для чого скористаємося вбудованою функцією КОРРЕЛ. Отримаємо наступну матрицю парних коефіцієнтів кореляції:
1,00 |
0,96 |
0,98 |
0,96 |
1,00 |
0,98 |
0,98 |
0,98 |
1,00 |
r =
Визначення критерію Пірсона.
Для відповіді на питання: чи є цей зв’язок наслідком мультиколінеарності чи ні скористаємося спочатку критерієм χ2. Для цього обчислимо визначник матриці r:
|r| = 0,001254
Обчислимо критерій Пірсона за формулою:
(2.3.)
Отримуємо:
-26,2491
таб = 7,8147 |
Так як , то в масиві пояснюючих змінних існує мультиколінеарність.
Визначення матриці C= r-1.
Визначимо матрицю С, обернену до матриці парних коефіцієнтів кореляції (скористаємося вбудованою функцією МОБР) і отримаємо:
28,22 |
3,61 |
-31,24 |
3,61 |
28,72 |
-31,75 |
-31,24 |
-31,75 |
62,86 |
С=
Обчислення F-критеріїв.
Обчислимо значення F-критеріїв для кожної пояснюючої змінної за формулою:
(2.4.)
де сіі - діагональні елементи матриці С.
Отримаємо:
F1=99,789 |
F2=101,6466 |
F3=226,821 |
Обчислимо табличне значення критерію Фішера та порівняємо його зі знайденими F-критеріями:
Fтаб= 3,5874
Так як F1>Fтаб, F2>Fтаб, F3>Fтаб, то це значить, що кожна з пояснюючих змінних мультиколінеарна з іншими.
Знайдемо частинні коефіцієнти детермінації для кожної змінної. Для чого скористаємося формулою:
(2.5.)
R²(x1)=0,964558 |
R²(x2)=0,965183 |
R²(x3)=0,984092 |
Знайдемо множинний коефіцієнт кореляції, для чого скористаємося формулою:
(2.6.)
де: t – табличне значення критерію Стьюдента на рівні значимості та степенями вільності .
rкр=0,508888
Знаходження частинних коефіцієнтів кореляції.
Визначимо частинні коефіцієнти кореляції, які показують на тісноту зв’язку між змінними хі та хj при умові, що всі інші змінні не впливають на цей зв’язок. Для цього скористаємося формулою:
(2.7.)
r12= -0,4199
r13= 2,39826
r23= 2,414558
Знайдені коефіцієнти порівнюємо з критичним значенням r. Отже, так як r12< r кр, то між змінними не існує тісного зв’язку; так як r13>r кр, то між змінними існує тісний зв’язок; так як r23>r кр, то між змінними існує тісний зв’язок.
Порівнюючи дані частинних коефіцієнти кореляції ми тільки показуємо тісноту зв’язку між двома незалежними змінними за умови , що третя не впливає на зв'язок. Так частинні коефіцієнти кореляції не свідчать про наявність або відсутність мультиколінеарності.
Обчислення t-критеріїв.
Знайдемо, чи зв’язані мультиколінеарно фактори х1 і х2, х1 і х3 та х2 і х3 відповідно. Для цього обчислимо t-критерії за формулою:
(2.8.)
t12= -0,4199
t13= 2,39826
t23= 2,414558
Обчислимо табличне значення t-критерію.
tтаб= 2,200985
Фактичні значення t порівнюємо із табличним значенням.
Отже, так як t12< t(tab),то між змінними х1 і х2 мультиколінеарість не існує. Так як t13 >t(tab), то між змінними х1 і х3 мультиколінеарність існує.
Так як t23 >t(tab), то між змінними х2 і х3 мультиколінеарність існує.
Для включення факторів у модель потрібно, щоб вони були слабо зв’язані між собою та зв’язані з результуючим фактором. Таким чином, розглянемо дві моделі:
Y= a0+a1*x1+a2*x2
x1 |
x2 |
y |
yp |
2,53 |
3,22 |
12,11 |
11,26774 |
3,54 |
3,87 |
12,3 |
12,8271 |
3,84 |
4,95 |
13,82 |
14,20418 |
3,84 |
5,1 |
14,84 |
14,35875 |
4,22 |
5,98 |
15,86 |
15,60021 |
4,81 |
7,28 |
16,41 |
17,45941 |
6,53 |
6,9 |
17,8 |
18,58279 |
5,82 |
7,54 |
18,61 |
18,6169 |
6,43 |
7,91 |
19,57 |
19,53543 |
7,73 |
8,4 |
21,26 |
21,18534 |
8,19 |
8,14 |
21,08 |
21,32259 |
7,65 |
8,76 |
22,99 |
21,48583 |
9,31 |
9,67 |
23,43 |
23,8856 |
9,26 |
10,28 |
24,63 |
24,47012 |
9,86 |
10,59 |
25,41 |
25,31801 |
11 |
12 |
|
|
Та другу модель
Y=a0+a3*x3
x3 |
y |
yp |
2,16 |
12,11 |
11,89894 |
2,65 |
12,3 |
12,87563 |
3,49 |
13,82 |
14,54996 |
3,16 |
14,84 |
13,89219 |
3,85 |
15,86 |
15,26753 |
4,58 |
16,41 |
16,72261 |
5,33 |
17,8 |
18,21755 |
5,89 |
18,61 |
19,33377 |
6,2 |
19,57 |
19,95168 |
6,39 |
21,26 |
20,33039 |
6,95 |
21,08 |
21,44662 |
7,25 |
22,99 |
22,04459 |
7,8 |
23,43 |
23,14088 |
8,47 |
24,63 |
24,47636 |
9,22 |
25,41 |
25,9713 |
10 |
|
|
Обчислимо їх характеристики та виберемо кращу з моделей. Застосуємо до обох функцію ЛИНЕЙН. Отримаємо:
1)для першої моделі:
1,030417444 |
0,880776 |
5,721437 |
0,292967193 |
0,277204 |
0,693072 |
0,978913936 |
0,690273 |
#Н/Д |
278,5481326 |
12 |
#Н/Д |
265,4434516 |
5,717722 |
#Н/Д |
2)для другої моделі:
1,993252 |
7,5935131 |
0,078909 |
0,46926393 |
0,980033 |
0,64535705 |
638,0695 |
13 |
265,7469 |
5,41431446 |
Вид моделі |
Е |
R2 |
F |
Fтаб |
Y=5,721437+0,880776*x1+1,0304174*x2 |
0,690273 |
0,978914 |
278,5481 |
3,88529383 |
Y=7,5935131+1,9933*x3 |
0,645357 |
0,980033 |
638,0695 |
4,74722535 |
2.3 Оцінка достовірності моделі за критерієм Фішера та достовірності коефіцієнтів моделі за критерієм Стьюдента
Для обчислення табличного значення критерію Фішера скористаємося вбудованою в MS Excel функцією FРАСПОБР, де:
Одержимо табличне значення критерію Фішера:
Перша модель:
Fтаб=3.88529383
F= 278.5481
Друга модель:
Fтаб=4.74722535
F= 638.0695
Розрахункове значення.
Fр отримаємо з таблиці де використовується функція ЛИНЕЙН.
Для першої та другої моделі.
Так як Fр>Fтаб, то отримана економетрична модель достовірна, згідно критерію Фішера, отримана модель достовірна.
Оцінимо значущість коефіцієнтів моделі згідно t-критерію Стьюдента.
За означенням t-критерії для коефіцієнтів а1 ; а0; а2;
Для першої моделі:
= 8,255182 = 3,177358 3,517177
Для другої моделі:
= 16,1817533 = 25,2600385
Порівняємо одержані t-критерії для коефіцієнтів моделі з табличним значенням критерію Стьюдента. Для обчислення табличного значення скористаємося вбудованою функцією СТЬЮДРАСПОБР:
Для першої моделі:
t(a0)= |
8,255182 |
t(a1)= |
3,177358 |
t(a2)= |
3,517177 |
t(tab)= |
-1,78229 |
Для другої моделі:
t(a0)= |
16,1817533 |
t(a3)= |
25,2600385 |
t(tab)= |
-1,7709334 |
Для першої та другої моделі: Так як ta3; ta2; ta1; ta0>tтаб, то модель достовірна.