big_doc_LKG
.pdfОцінка стохастичних зв’язків між вхідними та вихідними ознаками 249
, (5.9)
де , – середини відповідних інтервалів по осях , .
Матеріал групують по інтервалах значень величин та , потім складають кореляційну таблицю (табл. 5.1), у якій також здійснюють розрахунок частот.
Таблиця 5.1 Кореляційна таблиця для визначення щільності зв’язку
Інтервал |
|
|
Інтервали x |
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Коефіцієнт кореляції можна визначити за такими формулами:
; |
(5.10) |
; |
(5.11) |
; |
(5.12) |
Оцінка стохастичних зв’язків між вхідними та вихідними ознаками 251
то дисперсія всього ряду буде дорівнювати сумі внутрішньогрупової
і міжгрупової дисперсій.
Загальна дисперсія визначає середній квадрат відхилень (за орди-
натою) точок кореляційного поля від лінії |
(рис. 5.3) |
|
|
. |
(5.15) |
Дисперсія визначає середній квадрат відхилень точок кореляційного поля від емпіричної лінії
|
|
, |
(5.16) |
де |
|
– середнє арифметичне значення |
в i-му |
|
|
інтервалі по осі . |
|
Ця складова характеризує ступінь розсіяння змінної |
навколо |
||
групових середніх |
, тобто описує вплив випадкових факторів на |
||
результати спостереження або досліду, незалежних від . |
|
||
Дисперсія |
|
описує вплив досліджуваного фактора |
на зміну |
функції |
і представляє середній квадрат відхилень емпірич- |
||
ної лінії регресії від лінії |
|
||
|
|
. |
(5.17) |
Емпіричне кореляційне відношення розраховують за формулою
. (5.18)
Величина змінюється в межах .
Оцінка стохастичних зв’язків між вхідними та вихідними ознаками 253
Підтвердження гіпотези означає, що обчислений за формулами (5.3), (5.10)–(5.13) вибірковий коефіцієнт кореляції є значимим.
Перевірку прийнятої гіпотези можна здійснити двома способами.
Перший спосіб. Перевірка здійснюється за t-критерієм Стьюдента. Значення обчислюється за формулою
. (5.19)
Величина порівнюється з табличними значеннями , визна-
ченим за розподілом Стьюдента у відповідності з прийнятим рівнем значимості (зазвичай ) і кількості ступенів вільності (додаток Д6).
Якщо , то отриманий коефіцієнт кореляції буде справед-
ливим для всієї генеральної сукупності.
Якщо , то у генеральній сукупності кореляції може не іс-
нувати, або зв’язок є нелінійним.
Другий спосіб. Гіпотеза перевіряється порівнянням вибіркового значення коефіцієнта кореляції з його критичним значенням , яке
являє собою -квантиль розподілу при . Кореляція між випадковими величинами вважається значимою, якщо . Критичні значення наведені у табл. 5.3.
Для кореляційного відношення перевірка нульової гіпотези : проти альтернативної гіпотези : виконується за допо-
могою статистики
|
|
|
, |
(5.20) |
де |
– кількість інтервалів факторіальної ознаки ; |
|
||
|
– загальна кількість спостережень результативної ознаки . |
|||
Отримане значення |
порівнюється |
з критичним |
значенням - |
|
критерію (додаток Д8) для вибраного рівня значимості |
і кількості |
|||
ступенів вільності |
та |
. |
|
|
Якщо |
, то нульова гіпотеза відхиляється на рівні значимості . |
Оцінка стохастичних зв’язків між вхідними та вихідними ознаками 255
Ця статистика при справедливості нульової гіпотези має -розподіл з та ступенями вільності. Якщо , то на рівні значимості гіпотеза лінійності кореляційного зв’язку відхиляється.
При другому підході міра нелінійності визначається за умовою
. (5.22)
У випадку необхідно виміряти відхилення від лінійності. Це можна здійснити двома способами.
Перший спосіб. Цей спосіб полягає у порівняння різниці коефіцієнтів детермінації з деякою величиною параметра t, який визначається за формулою
. (5.23)
де t – коефіцієнт, за яким вимірюється відхилення від лінійності;
– коефіцієнт детермінації, розрахований за емпіричним кореляційним відношенням;
– коефіцієнт детермінації, розрахований за лінійним коефіцієнтом кореляції;
– похибка різниці між та . Величина визначається як
|
, |
(5.24) |
де |
– коефіцієнт лінійності. |
|
Якщо величина |
то відмінність між емпіричною і теоретичною |
формами зв’язку вважають несуттєвою і кореляційний зв`язок визна-
ють лінійним.
Другий спосіб. Критерій прямолінійності зв’язку можна побуду-
вати на співвідношенні між |
та |
|
|
, |
(5.25) |
Оцінка стохастичних зв’язків між вхідними та вихідними ознаками 257
У системі координат (рис. 5.4) точками відмічаємо значення кожного спостереження і накреслюємо еліпс розсіяння.
y |
|
|
|
|
|
|
|
800 |
|
|
|
|
|
|
|
700 |
|
|
|
|
|
|
|
600 |
|
|
|
|
|
|
|
500 |
|
|
|
|
|
|
|
400 |
|
|
|
|
|
|
|
300 |
|
|
|
|
|
|
|
200 |
|
|
|
|
|
|
|
100 |
|
|
|
|
|
|
|
0 |
0,0 |
0,1 |
0,2 |
0,3 |
0,4 |
0,5 |
x |
|
|
Рис. 5.4. Поле кореляції і еліпс розсіяння |
|
Складаємо кореляційну таблицю (табл. 5.5). За формою еліпса розсіяння і табл. 5.4 робимо висновок, що між досліджуваними ознаками існує зворотний кореляційний зв’язок.
|
|
|
|
|
|
Таблиця 5.5 |
||
|
|
Кореляційна таблиця |
|
|
|
|||
|
|
|
|
|
|
|
|
|
, |
|
|
|
|
|
|
|
|
ваг.-год. |
0–0,1 |
0,1–0,2 |
0,2–0,3 |
0,3–0,4 |
0,4–0,5 |
0,5–0,6 |
||
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0 – 150 |
|
|
|
1 |
|
|
1 |
|
150 – 300 |
|
|
1 |
|
|
1 |
2 |
|
300 – 450 |
|
1 |
2 |
1 |
|
1 |
5 |
|
450 – 600 |
|
3 |
1 |
1 |
1 |
|
6 |
|
600 – 750 |
|
1 |
1 |
1 |
1 |
|
4 |
|
750 – 900 |
1 |
1 |
|
|
|
|
2 |
|
|
1 |
6 |
5 |
4 |
2 |
2 |
20 |
|
|
|
|
|
|
|
|
|
2. Кількісна оцінка щільності зв’язку. Оскільки вид зв’язку між змінними та невідомий, то необхідно обчислити за даними вибірки емпіричні значення коефі-
цієнта кореляції та кореляційного відношення.
Розрахунок коефіцієнта кореляції. Розрахунок виконуємо за формулою (5.13).
Складові формули обчислюємо окремо в табл. 5.6.