
- •Частина 2 Вступ до дисперсійного, кореляційного та регресійного аналізу
- •1. Виділення аномальних об’єктів і однорідних груп серед сукупності Два типи задач
- •Однофакторний непараметричний дисперсійний аналіз Краскала–Волліса
- •Узагальнений критерій Стьюдента
- •Виділення груп об’єктів, однорідних за середнім значенням Критерій хі-квадрат, що ґрунтується на статистиці Велча
- •Критерій хі-квадрат, що ґрунтується на статистиці Вілкоксона
- •2. Дисперсійний аналіз Головні ідеї дисперсійного аналізу
- •Однофакторний дисперсійний аналіз
- •Двофакторний дисперсійний аналіз
- •Перевірка гіпотез
- •3. Кореляційний аналіз Задачі кореляційного аналізу
- •Парна кореляція
- •Властивості коефіцієнта кореляції
- •Вибірковий коефіцієнт кореляції
- •Кореляційне поле
- •Перевірка гіпотези про значущість коефіцієнта кореляції
- •Кореляційна матриця
- •4. Вступ до регресійного аналізУ Рівняння прямої регресії
- •Двовимірний нормальний закон розподілу та геометрична інтерпретація прямої регресії
- •Інтервал довіри для умовного середнього
- •Метод найменших квадратів для визначення параметрів рівняння регресії
- •Оцінка якості апроксимації
- •5. Непараметрична кореляція Кореляція дихотомічних (якісних) ознак
- •Перевірка гіпотези про значущість вибіркового коефіцієнта кореляції
- •Кореляція порядкових геологічних даних
- •Перевірка гіпотези про значущість коефіцієнта кореляції Спірмена
- •Оцінка коефіцієнта кореляції методом “дробового пострілу”
- •6. Нелінійна кореляція Кореляційне співвідношення як універсальна міра взаємозв’язку
- •Властивості кореляційного відношення
- •Перевірка гіпотези про значущість
- •Гіпотеза про правомірність застосування лінійної моделі
- •7. Тренд аналіз
- •Фон, аномалії та поверхня тренда
- •Білінійна просторова апроксимація
- •Експрес-методи оцінки наявності або відсутності тренда (одномірний випадок)
- •Метод зміни знака
- •Метод стрибків
- •Список Рекомендованої літератури
- •Список Довідкової Літератури
- •Геостатистика
Перевірка гіпотези про значущість вибіркового коефіцієнта кореляції
1.
;
.
2. Вибираємо рівень значущості .
3. Статистикою є сам коефіцієнт .
4. Він має розподіл
з одним ступенем вільності,
.
5. Знаходимо критичне
значення
.
6. Якщо
,
то приймаємо нульову гіпотезу
,
інакше
.
Кореляція порядкових геологічних даних
Геологічні дані, виміряні на порядковій шкалі, вже мають вищий рівень опису об’єктів і дають змогу не тільки віднести дані до того чи іншого класу (групи, категорії), а й упорядкувати ці класи за зростанням чи спаданням прояву досліджуваної ознаки (властивості). З іншого боку, різницю між градаціями визначити важко. Порядкова шкала вимірювань стосується, наприклад, даних напівкількісного спектрального аналізу (результати аналізу можна записати як “дуже багато”, “багато”, “мало”, “дуже мало”, “сліди”). Детальнішу інформацію можна отримати під час наближено-кількісних методів, якщо всі дані вимірювань просортувати і виконати ранжування даних, а не тільки віднести дані до певних класів.
Характерним для рангових даних є те, що їх можна впорядкувати за зростанням. Таке впорядкування, як відомо, називають варіаційним рядом
.
Процедура ранжування даних полягає у присвоєнні їм певних чисел (рангів), що відповідають їхньому номеру у цьому ряді:
. (5.9)
Якщо в межах досягнутої точності кілька членів ряду є однаковими:
,
то їм присвоюють один і той же усереднений ранг
. (5.10)
Для визначення міри лінійного зв’язку між двома наборами рангових даних
;
або кількісних даних, які не підпорядковані нормальному закону розподілу (розподіл яких значно відрізняється від нормального) найчастіше використовують ранговий коефіцієнт кореляції Спірмена між відповідними двома наборами рангів
;
.
Коефіцієнт кореляції Спірмена обчислюють за формулою
, (5.11)
де
–
різниця рангів між елементами двох
вибірок.
Властивості коефіцієнта кореляції Спірмена ті ж самі, що й для описаних вище коефіцієнтів кореляції.
Коли в першому або в другому наборі є однакові величини, то їм присвоюють однакові ранги, а формулу обчислення коефіцієнта кореляції Спірмена модифікують:
, (5.12)
де
– поправка на однакові ранги у першій
вибірці;
– кількість груп однакових рангів;
– кількість елементів у
‑й
групі. Аналогічно для другої вибірки
.
Приклад визначення поправки. Нехай для одного з наборів маємо ранги
1; 3; 3; 3; 5,5; 5,5; 7; 8.
Тоді в формулі поправки
,
,
.
Перевірка гіпотези про значущість коефіцієнта кореляції Спірмена
1. ; .
2. Вибираємо рівень значущості .
3. Статистикою є сам коефіцієнт .
4. Він має нормальний закон розподілу
нульовим середнім значенням
та дисперсією
.
5. Знаходимо критичне
значення
,
де
–
-квантиль
стандартного нормального розподілу
(обернена функція стандартного нормального
розподілу). Критичне значення отримують
дещо завищене.
Є декілька способів знаходження
,
що відрізняються типом апроксимаційної
функції (стьюдентівський, нормальний
чи асимптотично нормальний розподіл).
Уточнена формула
(5.13)
6. Якщо , то приймаємо нульову гіпотезу , інакше .
Оцінка коефіцієнта кореляції методом “дробового пострілу”
Цей експрес-метод належить до найпростіших
і не потребує значних обчислювальних
затрат (комп’ютера). Графічний
його варіант ґрунтується на аналізі
кореляційного поля. Вертикальною й
горизонтальною лінією, що відповідають
медіанним значенням, площину розбивають
на чотири квадранти і підраховують
кількості точок у кожному з них. Нехай
– кількість точок у квадрантах
I і III;
–
кількість точок у квадрантах
II і IV;
,
тоді
. (5.14)
Випадкова величина
має асимптотично нормальний розподіл
з нульовим середнім
та дисперсією
.
Для польових досліджень треба пам’ятати
критичне значення стандартного закону
розподілу для
:
. (5.15)
Тоді гіпотезу про значущість коефіцієнта кореляції відкидаємо, якщо
, (5.16)
де
. (5.17)
Можливий і табличний варіант цього методу. Тоді кожній з пар вимірювань треба приписати належність до одного з квадрантів, порівнюючи з медіанними значеннями, а саме:
квадрант I:
і
;
квадрант II:
і
;
квадрант III:
і
;
квадрант IV:
і
.
Далі підраховують кількості пар у кожному з квадрантів і для графічного варіанта обчислюють коефіцієнт кореляції. Його значущість свідчить про лінійну модель даних.