МВ Економетрія 2008 Доля
.pdfВони, в свою чергу, використовуються для розрахунку дисперсій змінних за формулою (4.4), наприклад
Dр = 92,9871 – 89,1684 = 3,8187.
Крок 6. Для розрахунку коефіцієнтів кореляції необхідно попередньо виконати розрахунок середніх добутків змінних (табл. 4.5),
Таблиця 4.5 – Розрахунок середніх добутків змінних
j |
РФ |
РК |
ФК |
|
|
|
|
|
|
1 |
10,05 |
308,2 |
69,0 |
|
2 |
|
|
|
|
… |
|
|
|
|
15 |
|
|
|
|
Сума |
654,39 |
8191,0 |
4026,9 |
|
Середній |
46,7421 |
585,0714 |
287,6357 |
|
добуток |
||||
|
|
|
після чого виконати розрахунок коефіцієнтів кореляції за формулою для варіанта Р=f (Ф, К):
rpxi = ( |
Р |
|
Х |
i – |
Р |
× |
Х |
i ) / σ p σ xi . |
(4.7) |
Наприклад, за даними табл. 4.4 і |
4.5 знаходимо |
|
|||||||
rрф = (46,7421 – 9,4429 × 4,5500) |
/ 1,9541 × 2,1973 = |
0,8796. |
Аналогічно rрк = 0,8178 і rрф = 0,5533.
Коефіцієнти кореляції показують напрямок і силу впливу факторів на рентабельність («+» – доданий, «–» – від’ємний). Слід мати на увазі, що −1 ≤ rpхі ≤ +1 . За наслідками розрахунків зробіть висновки щодо
сили (тісноти) кореляційних зв’язків.
Крок 7. Тестування факторів на значущість (невипадковість)
їх впливу на рентабельність проводять за t– статистикою Стьюдента. Розраховують спочатку вибіркові значення tі за формулою (для варі-
анта Р = f(Ф, К)). |
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
tф = |
|
rрф |
|
|
п − 2 |
, |
(4.8) |
||
|
|
||||||||
|
|
|
1− r |
2 |
|||||
|
|
і |
|
|
|
|
|
||
|
|
|
|
|
|
||||
|
|
|
|
|
|
рф |
|
|
|
|
|
|
|
|
|
і |
|
|
|
і потім порівнюють їх з критеріальним (tкрит). tкрит визначають за додатком 3 (див. [4], с. 87) залежно від n.
З ймовірністю 0,95 зробіть Ваші висновки щодо значущості факторів. При відсутності посібника можна прийняти tкрит = 2,179. У нашому прикладі за формулою (4.8)
21
tф = 0,8796 |
|
|
14 − 2 |
|
= 6,405 |
|
− 0,87962 |
||||
1 |
|
|
і відповідно tк = 4,923. Отже вплив факторів на рентабельність є неви-
падковим, оскільки 6,405 > 2,179 і 4,923 > 2,179.
Крок 8. Наявність і сила мультиколінеарності факторів, тобто взаємозв'язку між ними оцінюється за повною матрицею коефіцієнтів кореляції
(Ф) 1 (К) rкф
(Р) rрф
(Ф) (К) (Р)
r |
|
r |
|
|
|
1 |
0,5533 |
0,8796 |
|
фк |
|
рф |
|
|
|
|
|
||
|
1 |
rрк |
= 0,5533 |
1 |
0,8178 |
|
|||
r |
рк |
|
1 |
|
|
0,8796 |
0,8178 |
1 |
|
|
|
|
|
|
|
|
|
|
за наступною шкалою оцінок (за модулями коефіцієнтів кореляції для загального випадку y = f ( X1, X 2 ) :
r12 = 0 – відсутня,
0 < r12 |
< ryxi min |
– слабка, |
ryxi min |
< r12 < ryxi max – помірна, |
|
ryxi max |
< r12 < 1 |
– сильна, |
r12 = 1 |
– абсолютна, коли з двох факторів один є зайвим. |
Крок 9. β-коефіцієнти, які визначають напрямок і силу впливу факторів на рентабельність за умови вилучення мультиколінеарності, розраховують за формулою
|
|
|
|
|
|
|
|
|
|
|
|
βi |
|
= i / 0 , |
|
|
(4.9) |
||||
де о |
– |
визначник (детермінант) матриці взаємної кореляції |
|||||||||||||||||||
|
|
(мультиколінеарності), |
|
|
|
|
|
||||||||||||||
і |
– |
те ж із заміною в ній і-го стовпця стовпцем коефіцієнтів |
|||||||||||||||||||
|
|
кореляції |
rpx . |
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
||
Наприклад (див. крок 8): |
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
rрф |
rфк |
|
|
|
|
|
0,8796 |
0,5533 |
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
β |
|
= |
|
|
|
rрк |
1 |
|
|
|
|
= |
|
|
0,8178 |
1 |
|
|
|
= 0,6155 |
|
ф |
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
1 |
rфк |
|
|
|
|
|
|
1 |
0,5533 |
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
rкф |
1 |
|
|
|
|
|
|
|
|
0,5533 |
1 |
|
|
|
|
22
Аналогічно βк = 0,4772.
Крок 10. Оцінка незалежності (автономності) впливу факторів
на рентабельність визначається за допомогою γ-критерія
0 < γi < 1 ,
де γ i – рівень автономності, що розраховується за формулою |
|
γ i = βi / rpxi . |
(4.10) |
Якщо γi > 0, фактор хi має певну автономність впливу на рентабельність; γi = 0 – ніякої автономності він не має і його вплив на рентабельність завдяки мультиколінеарності проявляється через інші фактори, якщо γ i < 0 – і-й фактор вилучається з подальшого процесу розробки рівняння регресії, бо знаки βi і rpxi протилежні, чого у належно специ-
фікованих моделях не може бути.
Крок 11. Розрахунок коефіцієнта множинної кореляції необхідний для визначення сили впливу на рентабельність обох факторів разом, він розраховується за формулою Боярського:
R р.фк = |
|
−1α |
|
|
||
* |
, |
(4.11) |
||||
0 |
||||||
|
|
|
|
|
де α – порядок повної матриці коефіцієнтів кореляції; * – визначник повної матриці коефіцієнтів кореляції із за-
міною нижнього правого елемента нулем.
У нашому прикладі формула Боярського застосовується так:
|
|
|
1 |
0,5533 |
0,8796 |
|
|
|
|
|
|
|
|||
|
|
−13 |
0,5533 |
|
1 |
0,8178 |
|
|
|
|
|
|
|
||
R рфк |
= |
|
0,8796 |
0,8178 |
0 |
= |
− 1 |
|
(−0,6465) |
= . |
|||||
|
|
|
|
|
3 |
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
1 |
|
0,5533 |
|
|
|
|
0,6939 |
|
|
|||
|
|
|
0,5533 |
1 |
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
=0,9317 = 0,9652.
Зметою контролю правильності розрахунків рекомендується цей коефіцієнт визначати також за такою формулою:
R рфк = |
rрф βф + rрк βк |
. |
(4.12) |
23
У прикладі (див. крок 9).
R рфк = 0,8796 ´ 0,6155 + 0,8178 ´ 0,4772 = 0,5414 + 0,3903 =
= 0,9317 = 0,9652.
Отже коефіцієнт множинної детермінації і апроксимації 0,9317 показує, що варіація рентабельності у різних підприємств пояснюється впливом різних рівнів фондоозброєності праці на 54,14%, різного рівня кооперування виробництва на 39,03% та іншими не врахованими факто-
рами – 6,83% (100 – 83,17).
Крок 12. Вагомість вкладу факторів у варіацію рентабельності оцінюється на основі коефіцієнтів множинної кореляції за ρ-критерієм
ρi ³ 1,96,
де |
|
|
|
|
|
|
|
|
|
ρi |
|
|
|
|
|
|
|
||
= 0,742 |
|
|
R |
2 |
- r |
2 |
( i, j =1,2; i ¹ j ) |
(4.13) |
|
n |
|
||||||||
|
|
|
|
|
рх1х2 |
|
рхj |
|
|
У нашому прикладі формула (4.13) для визначення ρф і ρк набуває такого вигляду:
ρф = 0,742n R 2рфк - rрк2 ;
ρк = 0,742n R2рфк - rрф2 .
Якщо ρі ³ 1,96, то з ймовірністю 0,95 і більше можна стверджувати, що вплив фактора хі достатньо значущий, вагомий для включення його у рівняння регресії (див. [4], додаток 1, с. 85).
Крок 13. Для прийняття рішення щодо включення факторів у рівняння регресії складається зведення результатів, одержаних на кро-
ках 7, 10, 12 (табл. 4.6).
Таблиця 4.6. – Зведення оцінок невипадковості автономності й значущості вкладу факторів
Фактори |
tі ³ 2.179 |
0 < γi < 1 |
ρI ³ 1,96 |
Рішення |
|
|
|
|
|
Ф |
6,405 |
0,6997 |
1,423 |
Включається |
|
|
|
|
|
К |
4,923 |
0,5835 |
1,104 |
Включається |
|
|
|
|
|
24
Поради щодо прийняття рішень такі:
· якщо γ i < 0 , хi вилучається з матриці (див. крок 10);
·значення ρі дуже залежать від обсягу вибірки (див. формулу 4.13), тому рішення приймається з огляду на порушення вимоги n /(m +1) ³ 8 .
Отже якщо критерії ρі виконуються не в повній мірі, обидва фактори треба включати до рівняння регресії, принаймні з ймовірністю дещо менше 0,95.
Крок 14. Для обґрунтування аналітичної форми рівняння регресії
необхідно скористатися раніше сформульованими щодо цього висновками з теоретичного обґрунтування (див. крок 1), а також із візуального аналізу полів кореляції (див. крок 4). Ці аргументи вибору аналітичної форми рівняння регресії (пряма, гіпербола, парабола тощо) достатньо надійні й ними можна обмежитися.
Не буде великої помилки, якщо форма регресії буде прийнята лінійною і модель рівняння регресії матиме такий вигляд (для нашого прикладу):
|
|
|
Р = а0 |
+ а1Ф +а2 К , |
(4.14) |
де а0 , а1, а2 – коефіцієнти регресії.
Коефіцієнт а0 показує частину Р , що не залежить від факторів Ф і К ; а1 визначає, на скільки копійок змінюється Р за рахунок зміни Ф на одну тисячу гривень; а2 визначає зміну Р в копійках при зміні К на один відсоток.
Крок 15. Для розрахунку коефіцієнтів регресії а0 , а1 та а2 методом
найменших квадратів (МНК) слід скласти систему нормальних рівнянь і вирішити її. У нашому прикладі в разі вибору лінійної форми регресії ця система така:
∑Р = n × a0 + a1 ∑Ф + а2 ∑К |
|
|
|
|||||
|
|
|
||||||
∑РФ = a0 |
∑Ф + a1 |
∑Ф2 + а2 ∑ |
КФ . |
(4.15) |
||||
∑ |
РК = a0 |
∑ |
К + a1 |
∑ |
ФК + а2 |
∑ |
2 |
|
|
|
|||||||
|
|
|
|
К |
|
Числові значення коефіцієнтів цієї системи беруть із табл. 4.4 (крок 5), та 4.5 (крок 6). У нашому прикладі система набуває вигляду
132,2 = 14а0 + 63,7а1 + 837а2, 654,39 = 63,7а0 + 357,43а1 + 4026,9а2, 8191,0 = 837а0 + 4026,9а1 + 52349а2.
25
Спосіб Гаусса полягає у послідовному вилученні невідомих а0, а1, та а2. Діленням системи на числові коефіцієнти при а0 отримаємо
9,4429 = а0 + 4,5500а1 + 59,7857а2,
10,2730 = а0 + 5,6115а1 + 63,2166а2,
9,7861 = а0 + 4,8111а1 + 62,5436а2.
Віднімемо 1-е рівняння із 2-го і 3-го, після чого маємо
0,8301 = 1,0615а1 + 3,4304а2,
0,3432 = 0,2611а1 + 2,7579а2.
тобто систему рівнянь без а0. Повторивши, цю саму процедуру ще раз, отримаємо одне рівняння з одним невідомим а2:
0,5324=7,3309а2,
звідки а2 = 0,0726. Далі зворотним шляхом знайдемо а1 = 0,5476 і а0 = 2,6108. Отже
Рˆ = 2,6108 + 0,5476Ф + 0,0726К.
Прокоментуйте сутність знайдених параметрів економетричної моделі рентабельності, тобто 2,6108; 0,5476 та 0,0726.
Крок 16. Для розрахунку коефіцієнтів регресії методом детер-
мінантів попередньо необхідно за системою рівнянь МНК визначити чотири детермінанта (визначника) – ∆А; ∆А0; ∆А1 і ∆А2. Зокрема у нашому прикладі це виглядає так:
|
14 |
63,7 |
837 |
|
|
|
|
|
|
|
= 1513628. |
∆А = 63,7 |
357,43 |
4026 |
|
||
|
837 |
357,43 |
|
|
|
|
52349 |
|
Послідовно замінюючи стовпці матриці А стовпцями вільних членів системи рівнянь за МНК знайдемо
|
|
132,2 |
63,7 |
837 |
|
|
|
||||
∆А0 = |
|
654,39 |
357,43 |
4026,9 |
|
=3951780, |
|||||
|
|
8191,0 |
4026,9 |
52349 |
|
|
|
||||
|
|
|
|
|
14 |
132,2 |
837 |
|
= 828831 , |
||
|
|
|
|
|
|||||||
∆А1 = |
|
|
|
63,7 |
654,39 |
4026,9 |
|
||||
|
|
|
|
|
837 |
8191,0 |
52349 |
|
|
|
|
|
|
|
|
14 |
63,7 |
132,2 |
|
|
|
||
|
|
|
|
|
|
||||||
∆А2= |
|
|
63,7 |
357,43 |
654,39 |
|
=109889. |
||||
|
|
|
|
837 |
4026,9 |
8191,0 |
|
|
|
26
Оскільки розрахунки детермінантів виконуються вручну на калькуляторі, нагадуємо, як їх зручніше і простіше виконувати.
Елементи матриці А поділимо на 100,тобто на 102, що потім обумовить множення результату на 1000000, тобто на 106. Для розрахунку визначника матриці 3-го порядку допишемо до неї ще раз перші два рядки. Знайдемо добутки трьох елементів по кожній нісхідній діагоналі матриці (додатні) і такі ж добутки по висхідним діагоналям (від’ємні). Сумуючи шість добутків знаходимо детермінант. Наприклад
|
0,14 |
0,637 |
8,37 |
|
−250,40437 |
|
|
|
|
|
|||||
|
|
||||||
|
|
− 227,02393 |
|
|
|||
|
0,637 |
3,5743 |
40,269 |
|
|
|
|
|
|
− 212,41600 |
|
|
|||
∆А' = |
8,37 |
40,269 |
523,49 |
= |
|
= 1,513628 . |
|
|
0,14 |
0,637 |
8,37 |
|
+ 261,95544 |
|
|
|
|
+ 214,70182 |
|
|
|||
|
0,637 |
3,5743 |
40,269 |
|
|
|
|
|
|
+ 214,70182 |
|
|
|||
|
|
|
|
|
|
|
З урахуванням наведених раніше зауважень маємо ∆А = 1,513628 × 10 6 = 1513628.
Параметри рівняння регресії способом детермінантів отримуємо за формулою
аi = |
Ai |
, |
(4.16) |
|
A |
||||
|
|
|
тобто
а0 = 3951780 : 1513628 = 2,6108;
а1 = 828831 : 1513628 = 0,5476;
а2 = 109889 : 1513628 = 0,0726.
Значення параметрів ідентичні, як і сподівалось, отриманим способом Гаусса (крок 15).
Крок 17. Найбільш ефективним є розрахунок коефіцієнтів регресії способом оберненої матриці. Цей спосіб вигідний тим, що одночасно вирішує завдання визначення помилок оцінки коефіцієнтів регресії (крок 24) і апроксимації або прогнозу залежної змінної (крок 25), чого неможливо зробити інакше.
Спочатку отримуємо матрицю А-1, обернену до матриці А, тобто
14 |
63,7 |
837 |
|
|
|
А = 63,7 |
357,43 |
4026,9 . |
837 |
4026,9 |
52349 |
27
Попередньо знайдемо мінори і алгебраїчні доповнення до кожного елемента матриці А і складемо матрицю [∆Aij]. Наприклад, алгебраїчне доповнення до елемента 14 складе
|
1+1 |
3,5743 |
40,269 |
4 |
= 2495173 |
|||
∆А11 = 1 |
|
40,269 |
523,49 |
×10 |
||||
до елемента 63,7 – |
|
|
|
|
|
|
|
|
∆А12 = -11+2 |
|
|
0,637 |
40,269 |
|
×104 = 35890. |
||
|
|
|||||||
|
|
|
|
8,37 |
523,49 |
|
|
|
До речі, індикатори знаків мінорів для матриці 3-го порядку такі:
|
|
|
j |
|
|
|
|
|
|
|
+ |
– |
|
+ |
i |
|
|
|
|
– |
+ |
|
– |
|
|
+ |
– |
|
+ |
|
|
|
|
|
На основі матриці алгебраїчних доповнень
|
2495170 |
35890 |
− 42659 |
||
[∆Аij] = |
|
35890 |
32320 |
− 3060 |
|
|
|
||||
|
|
− 42659 |
− 3060 |
946 |
|
|
|
|
|
|
|
за формулою (4.17) розрахуємо обернену матрицю
|
А-1 = |
1 |
[ Aij ], |
(4.17) |
|
|
|||
|
|
A |
|
|
Враховуючи, що ∆А = 1513628 (крок 16), отримуємо |
||||
|
1,648475 |
0,023711 |
− 0,028183 |
|
А-1 = |
0,023711 |
0,021353 |
− 0,002022 . |
|
|
|
|
|
|
|
− 0,028183 |
− 0,002022 |
0,000625 |
Параметри рівняння регресії знаходимо за формулою
а0 |
|
|
|
|
|
|
|
|
|
−1 |
|
∑ |
Р |
|
|
||
|
|
= А |
× |
|
|
|
(4.18) |
|
а1 |
|
∑ |
РФ |
|
||||
|
|
|
|
|
|
|
|
|
а2 |
|
|
|
|
РК |
|
||
|
|
|
|
|
∑ |
|
|
28
Отже маємо
а0 = 1,648475 × 32,2 + 0,023711 × 654,39 − 0,028183 × 8191 = 2,6108 ;
а1 = 0,023711 ×132,2 + 0,021353 × 654,39 − 0,002022 × 8191 = 0,5476 ;
а2 = −0,028183 ×132,2 − 0,002022 × 654,39 + 0,000625 × 8191 = 0,0726,
що ідентично отриманим раніше результатам.
Крок 18. Для контролю правильності розрахунків коефіцієнтів регресії рекомендується ще варіант їх розрахунку через β-коефіцієнти, а саме:
аі = βі |
σ р |
, а0 = |
|
− ∑аі |
|
|
(4.19) |
|
Р |
Хі . |
|||||||
|
||||||||
|
σ х |
|
||||||
|
і |
|
Цей спосіб можливий лише за умови, що обидва фактори включені до рівняння регресії (див. підрозділ 4.5).
Отже за формулами (4.19) отримуємо уже відомі нам значення коефіцієнтів регресії
а |
|
= 0,6155 |
1,9541 |
= 0,5476; |
а |
|
= 0,4772 |
1,9541 |
= 0,0726; |
ф |
|
к |
|
||||||
|
2,1973 |
|
|
12,8407 |
|
||||
|
|
|
|
|
|
а0 = 9,4429 − 0,5476 × 4,5500 − 0,0726 × 59,7857 = 2,6108 .
Крок 19. Розрахунок оцінок рентабельності за рівнянням регресії необхідний для визначення помилок апроксимації. Розрахунки доцільно внести до табл. 4.7.
Таблиця 4.7 – Розрахунок оцінок рентабельності й помилок апроксимації
№ |
|
|
Розрахунок оцінок |
Помилка |
|
|
||
|
|
|
|
|
апроксимації |
|
2 |
|
|
|
|
|
|
|
|||
підпри- |
Рj |
2,61 |
0,548Ф |
0,0726К |
ˆ |
|
e j |
|
ємства |
|
|
|
|
Р j |
е j = Pj − Pj |
|
|
1 |
6,7 |
2,61 |
0,82 |
3,34 |
6,77 |
-0,07 |
|
0,0049 |
|
|
|
|
|
|
|
|
|
2 |
7,3 |
2,61 |
0,93 |
3,56 |
7,10 |
+0,20 |
|
0,0400 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Всього |
132,2 |
× |
× |
× |
132,2 |
0 |
|
3,6164 |
|
|
|
|
|
|
|
|
|
29
За розрахунком ∑е2j = 3,6164. Отже дисперсія залишків De дорівнює
3,6164 / 14 = 0,2603, що складає 6,83% загальної дисперсії 3,8187 (крок 5).
Порівняйте цей результат з результатами кроку 11.
Крок 20. Тестування гомоскедастичності залишків еj, полягає в перевірці того, що De = const. Це одне з основних припущень правомірності застосування МНК.
Використаємо тест рангової кореляції Спірмана:
rs = 1 − |
6 × ∑d 2j |
|
|||
|
|
|
. |
(4.20) |
|
n × (n |
|
|
|||
|
2 |
−1) |
|
Розрахунок ∑d 2 для нашого прикладу фрагментарно наведено
втабл. 4.8.
Таблиця 4.8 – Розрахунок ∑d 2
J |
Pj |
|
Ранг Pj |
|
|
е j |
|
|
|
Ранг |
|
e j |
|
|
|
dj |
|
d2j |
|||
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
1 |
6,7 |
|
2 |
|
|
0,07 |
|
|
1 |
|
|
|
7 |
|
7 |
||||||
… |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
∑ |
132,2 |
|
|
– |
|
|
– |
|
|
|
– |
|
|
- |
|
246 |
|||||
Таким чином, за формулою (4.20) |
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
rs = 1 − |
6 × 246 |
|
|
= 0,4593. |
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
14 × (142 |
− |
1) |
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
Оскільки t-статистика Стьюдента за формулою (4.8) дорівнює |
|
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
t = r |
|
n − 2 |
= 0,4593 |
|
|
|
14 − 2 |
= 1,791 |
|
|
||||||||||
|
|
1 − r 2 |
|
1− 0,45932 |
|
|
|||||||||||||||
|
|
s |
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
s |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
і не перевищує tкрит = 2,179 (див. [4] додаток 3), то з ймовірністю більшою 0,95 можна стверджувати, що залишки еj гомоскедастичні і явище
гетероскедастичності відсутнє.
Крок 21. Тестування відсутності автокореляції залишків еj вико-
нується за тестом DW-Дарбіна-Уотсона:
DW = |
∑(e j − e j −1)2 |
|
∑e |
(4.21) |
|
|
2j |
30