
- •Частина 2 Вступ до дисперсійного, кореляційного та регресійного аналізу
- •1. Виділення аномальних об’єктів і однорідних груп серед сукупності Два типи задач
- •Однофакторний непараметричний дисперсійний аналіз Краскала–Волліса
- •Узагальнений критерій Стьюдента
- •Виділення груп об’єктів, однорідних за середнім значенням Критерій хі-квадрат, що ґрунтується на статистиці Велча
- •Критерій хі-квадрат, що ґрунтується на статистиці Вілкоксона
- •2. Дисперсійний аналіз Головні ідеї дисперсійного аналізу
- •Однофакторний дисперсійний аналіз
- •Двофакторний дисперсійний аналіз
- •Перевірка гіпотез
- •3. Кореляційний аналіз Задачі кореляційного аналізу
- •Парна кореляція
- •Властивості коефіцієнта кореляції
- •Вибірковий коефіцієнт кореляції
- •Кореляційне поле
- •Перевірка гіпотези про значущість коефіцієнта кореляції
- •Кореляційна матриця
- •4. Вступ до регресійного аналізУ Рівняння прямої регресії
- •Двовимірний нормальний закон розподілу та геометрична інтерпретація прямої регресії
- •Інтервал довіри для умовного середнього
- •Метод найменших квадратів для визначення параметрів рівняння регресії
- •Оцінка якості апроксимації
- •5. Непараметрична кореляція Кореляція дихотомічних (якісних) ознак
- •Перевірка гіпотези про значущість вибіркового коефіцієнта кореляції
- •Кореляція порядкових геологічних даних
- •Перевірка гіпотези про значущість коефіцієнта кореляції Спірмена
- •Оцінка коефіцієнта кореляції методом “дробового пострілу”
- •6. Нелінійна кореляція Кореляційне співвідношення як універсальна міра взаємозв’язку
- •Властивості кореляційного відношення
- •Перевірка гіпотези про значущість
- •Гіпотеза про правомірність застосування лінійної моделі
- •7. Тренд аналіз
- •Фон, аномалії та поверхня тренда
- •Білінійна просторова апроксимація
- •Експрес-методи оцінки наявності або відсутності тренда (одномірний випадок)
- •Метод зміни знака
- •Метод стрибків
- •Список Рекомендованої літератури
- •Список Довідкової Літератури
- •Геостатистика
6. Нелінійна кореляція Кореляційне співвідношення як універсальна міра взаємозв’язку
На відміну від коефіцієнта кореляції,
що виражає міру лінійного зв’язку між
наборами даних, універсальною мірою
взаємозв’язку може слугувати кореляційне
відношення
.
Розрізняють два кореляційні відношення
та
.
Перше з них стосується нелінійної
регресії вигляду
,
а друге, навпаки, – вигляду
.
Нехай маємо два набори даних
;
.
Вибіркові дані групуємо за однією з
випадкових величин; наприклад, для
обчислення кореляційного відношення
групуємо пари
даних за величиною
.
Таке розбиття на
груп можна виконати на підставі деякої
апріорної інформації про класифікацію
даних на основі величини
або формально – з використанням,
наприклад, формули Стеджерса. Для кожного
з класів розбиття
обчислюємо групові середні
для парної величини
.
Визначаємо суму квадратів відхилень
групових середніх від загального
середнього
(6.1)
та суму квадратів відхилень від загального середнього
. (6.2)
Тоді
(6.3)
де
– відповідно, групове і загальне
стандартні відхилення.
Для обчислення другого кореляційного
відношення можна поміняти набори
та
місцями і повторити описану вище
процедуру. Зазначимо, що розбиття на
групи для обчислення
та
у загальному випадку відрізнятимуться,
тому одночасне обчислення обох
кореляційних відношень є незручним.
Властивості кореляційного відношення
У випадках, де несуттєво, яке з кореляційних відношень ми розглядаємо, для простоти опускатимемо нижні індекси. Маємо такі властивості кореляційного відношення.
1. Межі допустимих значень:
. (6.4)
2. Несиметричність
, (6.5)
тобто можлива ситуація, що = 0, а 0 (суттєво відрізняється!).
3. Кореляційне відношення є сильнішою мірою, ніж коефіцієнт кореляції
. (6.6)
Звідси, як наслідки, маємо:
;
– треба досліджувати;
.
4. Для лінійної функціональної залежності
. (6.7)
5. Якщо
,
то будь-якої залежності нема, а якщо
,
то є функціональна залежність (не
стохастична, не випадкова, хоча змінні
та
й будуть випадкові).
Перевірка гіпотези про значущість
Розрізнятимемо набори даних за обсягом: невеликі й середні (до 60 вимірювань) та великі (понад 60). Кожен з цих випадків відрізняється вибором функції-статистики і відповідними розподілами для відшукання критичних значень.
1. Нульова гіпотеза: кореляційне відношення дорівнює нулю
: (6.8)
за односторонньої альтернативи
:
. (6.9)
2. Вибираємо , наприклад, .
3. За відомим кореляційним співвідношенням будуємо статистику
,
(
)
– (6.10)
як для коефіцієнта кореляції або
,
(
). (6.11)
4. Статистика
має розподіл Стьюдента з
ступенями вільності, а статистика
– стандартний закон розподілу.
5. Знаходимо критичні значення статистики, тобто квантилі розподілу Стьюдента (чи стандартного для великих вибірок) для заданого рівня значущості . Для маємо
, (6.12)
а для
. (6.13)
6. Перевіряємо критерій: якщо
або
,
то нульову гіпотезу відхиляємо, тобто
кореляційне відношення суттєво
відрізняється від нуля.
Навпаки, якщо приймаємо нульову гіпотезу, то стверджуємо, що для заданого рівня значущості не існує ні лінійного, ні нелінійного зв’язку між даними.