Таблиця 5.6 Розрахунок даних для визначення парного коефіцієнта кореляції
№ ,
п/п ваг.-год.
1 |
120 |
0,40 |
0,12 |
0,0144 |
–379 |
143641 |
–45,00 |
2 |
670 |
0,21 |
–0,07 |
0,0049 |
171 |
29241 |
–11,97 |
3 |
742 |
0,43 |
0,15 |
0,0225 |
243 |
59049 |
36,45 |
4 |
482 |
0,21 |
–0,07 |
0,0049 |
–17 |
289 |
1,19 |
5 |
151 |
0,57 |
0,29 |
0,0845 |
–348 |
121104 |
–100,92 |
6 |
367 |
0,21 |
–0,07 |
0,0049 |
–132 |
17424 |
9,24 |
7 |
714 |
0,37 |
0,09 |
0,0081 |
215 |
46225 |
19,32 |
8 |
505 |
0,16 |
–0,12 |
0,0144 |
6 |
36 |
–0,72 |
9 |
484 |
0,48 |
0,2 |
0,0400 |
–15 |
225 |
–3,00 |
10 |
210 |
0,21 |
–0,07 |
0,0049 |
–289 |
63521 |
20,23 |
11 |
396 |
0,58 |
0,30 |
0,0900 |
–103 |
10609 |
–30,90 |
12 |
498 |
0,35 |
0,07 |
0,0045 |
–1 |
1 |
–0,07 |
13 |
651 |
0,13 |
–0,15 |
0,0225 |
152 |
23104 |
–22,80 |
14 |
420 |
0,38 |
0,10 |
0,0100 |
–79 |
6241 |
–7,90 |
15 |
815 |
0,12 |
–0,16 |
0,0256 |
316 |
99856 |
–50,56 |
16 |
413 |
0,13 |
0,15 |
0,0225 |
–86 |
7396 |
12,90 |
17 |
493 |
0,12 |
–0,16 |
0,0226 |
6 |
36 |
–0,96 |
18 |
567 |
0,15 |
–0,13 |
0,0169 |
68 |
4624 |
–8,84 |
19 |
860 |
0,10 |
–0,18 |
0,0324 |
361 |
130321 |
–64,98 |
20 |
422 |
0,22 |
–0,06 |
0,0036 |
–77 |
5929 |
4,62 |
|
|
|
|
|
|
|
|
|
9980 |
5,53 |
|
0,4567 |
|
768872 |
–244,67 |
Згідно з табл. 5.6 маємо: |
|
|
|
|
|
|
; |
|
; |
|
|
. |
Розрахунок кореляційного відношення. Всі розрахунки виконуємо в кореляційній таблиці (табл. 5.7), яка доповнюється рядками обчислень статистичних характеристик.
Для спрощення цих обчислень здійснюємо заміну змінних з переносом системи координат в точку і за формулами:
Таблиця 5.7
Кореляційна таблиця для обчислення кореляційного відношення
|
|
|
|
|
Інтервали |
|
|
|
|
|
Інтервали |
Середини |
Кодовані |
0–0,1 |
0,1–0,2 |
0,2–0,3 |
0,3–0,4 |
0,4–0,5 |
0,5–0,6 |
|
|
|
|
Середина інтервалів |
|
|
|
|
|
|
інтервалів |
значення |
|
|
|
|
|
|
|
0,05 |
0,15 |
0,25 |
0,35 |
0,45 |
0,55 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Кодовані значення |
|
|
|
|
|
|
|
|
–3 |
–2 |
–1 |
0 |
1 |
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0–150 |
75 |
–3 |
|
|
|
1 |
|
|
1 |
–3 |
9 |
|
|
|
|
|
|
|
|
|
|
|
|
150–300 |
225 |
–2 |
|
|
1 |
|
|
1 |
2 |
–4 |
8 |
|
|
|
|
|
|
|
|
|
|
|
|
300–450 |
375 |
–1 |
|
|
2 |
1 |
|
1 |
5 |
–5 |
5 |
|
|
|
|
|
|
|
|
|
|
|
|
450–600 |
525 |
0 |
|
3 |
1 |
1 |
1 |
|
6 |
0 |
0 |
|
|
|
|
|
|
|
|
|
|
|
|
600–750 |
675 |
1 |
|
1 |
1 |
1 |
1 |
|
4 |
4 |
4 |
|
|
|
|
|
|
|
|
|
|
|
|
750–900 |
825 |
2 |
1 |
1 |
|
|
|
|
2 |
–4 |
8 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Сума по стовпцях |
|
|
|
|
|
|
|
20 |
–4 |
34 |
|
|
|
|
|
|
|
|
|
|
|
|
1. |
|
|
1 |
6 |
5 |
4 |
2 |
2 |
20 |
|
|
2. |
|
|
2 |
0,33 |
–0,6 |
–0,75 |
1,5 |
–1,5 |
0,98 |
Сума по рядках |
3. |
|
|
4 |
0,65 |
1,8 |
2,25 |
4,5 |
4,5 |
17,7 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
За даними табл. 5.7 запишемо:
;
.
.
Емпіричне кореляційне відношення дорівнює
.
Оцінка міри нелінійності кореляційного зв’язку. Результати попередніх розра-
хунків не дають чіткої уяви щодо форми кореляційного зв’язку. Тому у подальшому визначаємо міру відхилення від прямолінійного зв’язку.
З методологічних міркувань оцінку виконаємо декількома методами. При використанні статистики (5.21) маємо:
.
У додатку Д8 значень критерію на рівні значимості та кількості ступе-
нів вільності |
та |
знаходимо критичне значення |
. Так як , то при обраному рівні значимості гіпотеза про лінійність кореляційного зв’язку підтверджується.
За умовою (5.22) обчислюємо різницю
.
Так як , то правомірність лінійності зв’язку слід підтвердити аналізом міри відхилення від лінійності. Аналіз виконуємо двома способами.
Перший спосіб. За формулою (5.24) обчислюємо похибку різниці
.
Розраховуємо параметр за формулою (5.23)
5.3.Множинний кореляційний аналіз
5.3.1.Аналіз статистичних даних з однорідними ознаками. Якщо система включає більше двох випадкових величин, виникають різні рівні кореляції. Для визначення і оцінки багатофакторного статистичного зв’язку вживаються три типи парних коефіцієнтів кореляції:
1) парний коефіцієнт кореляції між результативною ознакою і одним із факторів .
2)парний коефіцієнт кореляції між факторами та : ;
3)частинний коефіцієнт кореляції між результативною ознакою
іодним із факторів, відокремленим від інших: .
Оцінка кореляційного зв’язку виконується за такою схемою.
Побудова і аналіз первинної матриці коефіцієнтів кореля-
ції. Для побудови матриці за формулами (5.10)–(5.13) обчислюємо два типи парних коефіцієнтів кореляції:
1)коефіцієнти , що визначають щільність зв’язку між результативною ознакою і одним із факторів ;
2)коефіцієнти , які показують щільність зв’язку між фактора-
ми і (). При цьому в формулах (5.10)–(5.13) ознака замінюється на ознаку .
Фактор, у якого коефіцієнт кореляції , вважається не-
суттєвим і з подальшого розгляду може бути виключений.
Якщо один із коефіцієнтів буде дорівнювати 1, то це означає, що фактори і функціонально (не імовірнісно) пов’язані між собою і тоді доцільно один із них виключати із подальшого розгляду, причому залишають фактор з більшим значенням коефіцієнту кореляції .
Після обчислення всіх парних коефіцієнтів кореляції і виключення із розгляду того чи іншого фактора можна побудувати первинну квадратну симетричну матрицю коефіцієнтів кореляції (табл. 5.8).
Виявлення наявності мультиколінеарності між фактора-
ми. Наявність мультиколінеарності можна визначати двома способами.
Перший спосіб. Апріорі колінеарними вважають такі фактори та , для яких виконується умова . У цьому випадку один із факторів виключається із розгляду, причому залишають фактор,
який має більш тісний зв’язок з результативною ознакою.
Оцінка стохастичних зв’язків між вхідними та вихідними ознаками 263
Таблиця 5.8
Первинна кореляційна матриця
1
1 |
rx x |
rx x |
rx x |
p |
rx y |
|
2 3 |
2 |
i |
2 |
2 |
|
1 |
|
|
|
|
|
|
|
1 |
|
|
|
|
1
Другий спосіб. Наявність мультиколінеарності встановлюють на підставі F-критерію. Для цього первинна кореляційна матриця (табл. 5.8) перетворюється на обернену матрицю
. (5.26)
Для кожного фактора розраховують значення за формулою
|
, ( |
), |
(5.27) |
де |
– діагональний елемент оберненої матриці. |
|
|
Обчислене значення порівнюється з табличними значеннями роз-
поділу Фішера (додаток Д8) для кількості ступенів вільності |
і |
|
та рівнів значимості |
та |
. |
|
Якщо |
, то при 5% рівні значимості приймаємо гіпотезу |
про відсутність мультиколінеарності |
і-го аргумента-фактора з реш- |
тою в генеральній сукупності. Якщо |
|
, то при 1%-му рівні |
значимості відхиляємо гіпотезу відсутності мультиколінеарності і-го аргумента-фактора з рештою в генеральній сукупності. У цьому випадку включення і-го аргумента-фактора в загальну модель вважається неприпустимим. Висновки про виключення аргумента-фактора супроводжуються економічним аналізом.
Залишивши в сукупності тільки не мультиколінеарні фактори, складаємо нову кореляційну матрицю (табл. 5.8), обернену їй (5.26) і повторюємо перевірку за допомогою (5.27) до повного «очищення» від мультиколінеарності. Після цього складається остаточна (скоригована) матриця парних коефіцієнтів кореляції.
Визначення ступеня впливу на результативний показник кожного фактора окремо. Для цього використовується частинний коефіцієнт кореляції, який відображає «чистий» вплив тільки одного і-го фактора на результативний показник при виключенні із розгляду інших факторів.
При множинній залежності показника від двох факторів та , коефіцієнти частинної кореляції розраховується за формулами:
– між змінними та при виключенні із розгляду
; (5.28)
– між змінними та при виключені із розгляду
. (5.29)
Для залежності, яка включає три і більше факторів, звязок` між () і результативною ознакою характеризується частин-
ними коефіцієнтами кореляції більш високого рівня. У випадку трьох факторів розглядаються частинні коефіцієнти кореляції другого порядку
, , . Так, визначається за формулою
. (5.30)
Оцінка стохастичних зв’язків між вхідними та вихідними ознаками 265
Цей коефіцієнт кореляції характеризує звязок` між та за умови, що спочатку фіксували (виключали) фактор а не . При іншому порядку фіксування буде отриманий частинний коефіцієнт кореляції , який може не дорівнювати .
Для інших коефіцієнтів кореляції маємо:
; (5.31)
. (5.32)
У загальному випадку з р факторами коефіцієнт кореляції можна визначити за формулами:
; (5.33)
або |
|
|
|
, |
(5.34) |
де |
– визначник матриці, утворений із матриці коефіцієнтів |
кореляції викреслюванням першого рядка і k-го стовпця для кожного визначника відповідно;
– визначник тієї ж самої матриці з викресленими першим рядком і першим стовпцем, тобто визначник матриці парних коефіцієнтів кореляції між факторами;
– визначник матриці з викресленими k-м рядком i k-м стовпцем.
Результати розрахунків представляють у вигляді вектора
,
де , , , – частинні коефіцієнти кореляції.
Гіпотеза : для коефіцієнта кореляції перевіряється за допомогою статистики
|
|
, |
(5.35) |
де – кількість факторів. |
|
|
При справедливості нульової гіпотези |
величина |
розподілена за |
розподілом Стьюдента з |
ступенями вільності (додаток Д6). |
У випадку |
нульова гіпотеза |
відхиляється на рівні |
значимості .
Як і парні коефіцієнти кореляції, частинні коефіцієнті кореляції змінюються від –1 до +1.
Оцінка щільності зв’язку. Кількісно щільність зв’язку при множинній кореляції можна оцінити за допомогою множинного (сукупного) коефіцієнта кореляції, який визначається за формулою
де – визначник матриці парних коефіцієнтів кореляції. У випадку залежності від двох факторів
. (5.37)
Коефіцієнт множинної кореляції змінюється у межах від 0 до 1. При спостерігається функціональний зв’язок. При кореляційний зв’язок між функцією і аргументом відсутній. Чим ближчий до одиниці, тим зв’язок щільніший.
Значимість коефіцієнта множинної кореляції можна перевірити декількома способами.
За критерієм Стьюдента
де – стандартна похибка коефіцієнта множинної кореляції.
Оцінка стохастичних зв’язків між вхідними та вихідними ознаками 267
Величина обчислюється за формулою
. (5.39)
За критерієм Фішера. Для цього обчислюють статистику
. (5.40)
Отримане значення порівнюють з табличним на вибраному рівні значимості (зазвичай ) і кількостях ступенів вільності і . Якщо розрахункове значення перевищує табличне, то зв’язок вважають статистично значимим.
Шляхом порівняння з критичним значенням коефіцієнта множинної кореляції. Якщо ,
то кореляція вважається значимою. Критичні значення
наведені у табл. 5.9.
Таблиця 5.9
Критичні значення коефіцієнтів множинної кореляції на рівні значимості ( – кількість змінних, – обсяг вибірки)
|
|
|
|
|
|
3 |
4 |
5 |
6 |
|
|
|
|
|
1 |
0,999 |
0,999 |
0,999 |
1,00 |
2 |
0,975 |
0,983 |
0,987 |
0,990 |
3 |
0,930 |
0,950 |
0,961 |
0,968 |
4 |
0,881 |
0,912 |
0,930 |
0,942 |
5 |
0,836 |
0,874 |
0,898 |
0,914 |
6 |
0,795 |
0,839 |
0,867 |
0,886 |
7 |
0,758 |
0,807 |
0,838 |
0,860 |
8 |
0,726 |
0,777 |
0,811 |
0,835 |
9 |
0,697 |
0,750 |
0,786 |
0,812 |
10 |
0,671 |
0,726 |
0,763 |
0,790 |
11 |
0,648 |
0,703 |
0,741 |
0,770 |
12 |
0,627 |
0,683 |
0,722 |
0,751 |
13 |
0,608 |
0,664 |
0,703 |
0,733 |
14 |
0,590 |
0,646 |
0,686 |
0,717 |
|
|
|
|
|
|
3 |
4 |
5 |
6 |
15 |
|
|
|
|
0,574 |
0,630 |
0,670 |
0,701 |
16 |
0,559 |
0,615 |
0,655 |
0,687 |
17 |
0,545 |
0,601 |
0,641 |
0,673 |
18 |
0,532 |
0,587 |
0,628 |
0,660 |
19 |
0,520 |
0,575 |
0,615 |
0,647 |
20 |
0,509 |
0,563 |
0,604 |
0,636 |
22 |
0,488 |
0,542 |
0,582 |
0,594 |
24 |
0,470 |
0,523 |
0,562 |
0,594 |
26 |
0,454 |
0,506 |
0,545 |
0,576 |
28 |
0,439 |
0,490 |
0,529 |
0,570 |
30 |
0,425 |
0,476 |
0,514 |
0,545 |
40 |
0,373 |
0,419 |
0,455 |
0,484 |
60 |
0,308 |
0,348 |
0,380 |
0,406 |
|
|
|
|
|