
- •Частина 2 Вступ до дисперсійного, кореляційного та регресійного аналізу
- •1. Виділення аномальних об’єктів і однорідних груп серед сукупності Два типи задач
- •Однофакторний непараметричний дисперсійний аналіз Краскала–Волліса
- •Узагальнений критерій Стьюдента
- •Виділення груп об’єктів, однорідних за середнім значенням Критерій хі-квадрат, що ґрунтується на статистиці Велча
- •Критерій хі-квадрат, що ґрунтується на статистиці Вілкоксона
- •2. Дисперсійний аналіз Головні ідеї дисперсійного аналізу
- •Однофакторний дисперсійний аналіз
- •Двофакторний дисперсійний аналіз
- •Перевірка гіпотез
- •3. Кореляційний аналіз Задачі кореляційного аналізу
- •Парна кореляція
- •Властивості коефіцієнта кореляції
- •Вибірковий коефіцієнт кореляції
- •Кореляційне поле
- •Перевірка гіпотези про значущість коефіцієнта кореляції
- •Кореляційна матриця
- •4. Вступ до регресійного аналізУ Рівняння прямої регресії
- •Двовимірний нормальний закон розподілу та геометрична інтерпретація прямої регресії
- •Інтервал довіри для умовного середнього
- •Метод найменших квадратів для визначення параметрів рівняння регресії
- •Оцінка якості апроксимації
- •5. Непараметрична кореляція Кореляція дихотомічних (якісних) ознак
- •Перевірка гіпотези про значущість вибіркового коефіцієнта кореляції
- •Кореляція порядкових геологічних даних
- •Перевірка гіпотези про значущість коефіцієнта кореляції Спірмена
- •Оцінка коефіцієнта кореляції методом “дробового пострілу”
- •6. Нелінійна кореляція Кореляційне співвідношення як універсальна міра взаємозв’язку
- •Властивості кореляційного відношення
- •Перевірка гіпотези про значущість
- •Гіпотеза про правомірність застосування лінійної моделі
- •7. Тренд аналіз
- •Фон, аномалії та поверхня тренда
- •Білінійна просторова апроксимація
- •Експрес-методи оцінки наявності або відсутності тренда (одномірний випадок)
- •Метод зміни знака
- •Метод стрибків
- •Список Рекомендованої літератури
- •Список Довідкової Літератури
- •Геостатистика
Гіпотеза про правомірність застосування лінійної моделі
Як бачимо, кореляційне відношення є ефективнішим для оцінки залежності між даними, але й більш трудомістким. Тому логічно поставити запитання, у яких випадках можна обмежитися розглядом парного коефіцієнта кореляції (тобто лінійною регресійною моделлю). Для цього перевіримо гіпотезу про рівність кореляційного відношення і коефіцієнта кореляції (за абсолютним значенням).
1. Нульова гіпотеза:
:
(6.14)
за альтернативи
:
. (6.15)
2. Вибираємо .
3. Статистика
. (6.16)
4.
має розподіл Фішера з
і
ступенями вільності.
5. Критичні значення для статистики
.
6. Якщо
,
то приймаємо нульову гіпотезу, тобто
можна обмежитися лінійною моделлю як
достатньо точною.
7. Тренд аналіз
Тренд – це закономірність зміни просторово-часових даних:
, (7.1)
де
– закономірна складова (тренд);
– випадкова змінна;
,
– точка з певного простору.
Фон, аномалії та поверхня тренда
Невипадковий компонент, що характеризує головну складову модельованого поля деякої геологічної ознаки, називають фоном. Фонова частина поля містить корисну інформацію про загальний характер зміни деякого параметра в просторі або часі. Суттєві відхилення від фонових значень можна розглядати як аномальні.
Процес виділення з виміряних величин закономірної складової називають тренд-аналізом (або аналізом поверхонь тренду).
Тренд-аналіз застосовують у просторі, на площині, уздовж конкретного напряму (профілю) або з плином часу.
Білінійна просторова апроксимація
; (7.2)
. (7.3)
Експрес-методи оцінки наявності або відсутності тренда (одномірний випадок)
Розв’язок задач з виявлення тренду статистичними методами ґрунтується на порівнянні спостережуваних даних з полями чи послідовностями, у яких тренда апріорі нема (для послідовності, про яку наперед відомо, що вона немає тренду).
Метод зміни знака
Точкою зміни знака в упорядкованій послідовності називають той елемент послідовності, де знак приросту змінюється на протилежний, тобто зростання – на спадання або навпаки (рис. 7.1).
Кількість точок зміни знака
залежить лише від кількості елементів
послідовності
.
Досліджено, що в послідовності без
тренда розподіл випадкової величини
асимптотично нормальний і вже для
математичне сподівання та дисперсія,
відповідно,
,
. (7.4)
Рис. 7.1. Визначення тренда методом зміни знака, крапками позначено точки зміни знака.
Перевірка гіпотези про наявність тренда полягає в порівнянні фактичного значення точок зміни знака з його математичним сподіванням (7.4), нормованим за дисперсією (перетворення Фішера). Критеріальне значення
(7.5)
порівнюємо з критичним значенням оберненої функції для стандартного розподілу і заданого .
Нульова гіпотеза свідчить, що тренда
немає. Для таких послідовностей значення
і
не повинні значно відрізнятися. Тому
гіпотезу приймаємо, якщо
, (7.6)
інакше вважаємо, що тренд є.
Метод стрибків
Нехай маємо послідовність даних
вимірювань, яку можна розділити на дві
категорії, наприклад, щодо медіанного
значення. Тоді точкам, що вище медіани,
припишемо знак “плюс” (+), а тим, що
нижче, – “мінус”(–) (рис. 7.2). Ділянки,
де знак однаковий, об’єднують і
називають інтервалом. Перехід від одного
інтервалу до іншого називають
стрибком. Позначимо кількість стрибків
як
.
Рис. 7.2. Визначення тренда методом стрибків.
У послідовності, про яку наперед відомо, що вона не має тренда, розподіл стрибків є асимптотично нормальним з параметрами розподілу
; (7.7)
, (7.8)
де
,
– кількість елементів послідовності
з приписаним знаком “плюс”
та “мінус”,
відповідно;
– усього елементів.
Перетворення за Фішером
(7.9)
дає
випадкову змінну зі стандартним
розподілом з математичним сподіванням
0 та стандартним відхиленням 1. Для
заданого
,
наприклад
0,05,
знаходимо критичне значення розподілу
і порівнюємо його з отриманим числом
згідно з (7.9). Якщо абсолютне значення
перевищує
,
то є тренд.