
- •Частина 2 Вступ до дисперсійного, кореляційного та регресійного аналізу
- •1. Виділення аномальних об’єктів і однорідних груп серед сукупності Два типи задач
- •Однофакторний непараметричний дисперсійний аналіз Краскала–Волліса
- •Узагальнений критерій Стьюдента
- •Виділення груп об’єктів, однорідних за середнім значенням Критерій хі-квадрат, що ґрунтується на статистиці Велча
- •Критерій хі-квадрат, що ґрунтується на статистиці Вілкоксона
- •2. Дисперсійний аналіз Головні ідеї дисперсійного аналізу
- •Однофакторний дисперсійний аналіз
- •Двофакторний дисперсійний аналіз
- •Перевірка гіпотез
- •3. Кореляційний аналіз Задачі кореляційного аналізу
- •Парна кореляція
- •Властивості коефіцієнта кореляції
- •Вибірковий коефіцієнт кореляції
- •Кореляційне поле
- •Перевірка гіпотези про значущість коефіцієнта кореляції
- •Кореляційна матриця
- •4. Вступ до регресійного аналізУ Рівняння прямої регресії
- •Двовимірний нормальний закон розподілу та геометрична інтерпретація прямої регресії
- •Інтервал довіри для умовного середнього
- •Метод найменших квадратів для визначення параметрів рівняння регресії
- •Оцінка якості апроксимації
- •5. Непараметрична кореляція Кореляція дихотомічних (якісних) ознак
- •Перевірка гіпотези про значущість вибіркового коефіцієнта кореляції
- •Кореляція порядкових геологічних даних
- •Перевірка гіпотези про значущість коефіцієнта кореляції Спірмена
- •Оцінка коефіцієнта кореляції методом “дробового пострілу”
- •6. Нелінійна кореляція Кореляційне співвідношення як універсальна міра взаємозв’язку
- •Властивості кореляційного відношення
- •Перевірка гіпотези про значущість
- •Гіпотеза про правомірність застосування лінійної моделі
- •7. Тренд аналіз
- •Фон, аномалії та поверхня тренда
- •Білінійна просторова апроксимація
- •Експрес-методи оцінки наявності або відсутності тренда (одномірний випадок)
- •Метод зміни знака
- •Метод стрибків
- •Список Рекомендованої літератури
- •Список Довідкової Літератури
- •Геостатистика
Двофакторний дисперсійний аналіз
У геології часто виникає ситуація, коли досліджують вплив двох факторів. Двофакторний дисперсійний аналіз дає змогу не тільки виявити вплив кожного з факторів, а й оцінити їхню взаємодію. Двофакторний аналіз має:
1) перехресну (двосторонню) класифікацію (з однаковою кількістю повторень у клітинці, з одним спостереженням у клітинці (без повторень), та з нерівномірною кількістю спостережень у клітинці);
2) ієрархічну класифікацію, коли один з
факторів є головним, а інший –
підпорядкованим. Тоді градація фактора
B є незалежною в межах
кожної з градацій фактора A.
Якщо в кожній групі
маємо однакову кількість підгруп
,
то така ієрархічна класифікація має
спеціальну назву – гніздова класифікація.
Для ієрархічної класифікації не виникає
проблеми оцінки взаємодії факторів (її
немає). Також уважаємо, що фактори не
взаємодіють, коли маємо класифікацію
без повторень.
Розглянемо випадок перехресної класифікації з однаковою кількіст. повторtym. Дані запишемо в табл. 2.2.
Таблиця 2.2
Вхідні дані для двофакторного аналізу
Рівні фактора |
|
… |
|
… |
|
|
|
… |
|
… |
|
… |
… |
… |
… |
… |
… |
|
|
… |
|
… |
|
… |
… |
… |
… |
… |
… |
|
|
… |
|
… |
|
Схема обчислень для двофакторного аналізу така:
А. Знаходимо вибіркові середні (генеральне
середнє
,
а також середнє в рядку
,
стовпці
й клітинці
):
;
; (2.12)
;
. (2.13)
Б. Обчислюємо суми квадратів відхилень від відповідних середніх:
мінливість, зумовлену фактором
,
; (2.14)
мінливість, зумовлену фактором
,
; (2.15)
мінливість, зумовлену взаємодією факторів і ,
; (2.16)
мінливість у межах кожної з клітинок
; (2.17)
загальну мінливість спостережуваної ознаки (параметра)
. (2.18)
Справджується рівність
. (2.19)
В. Знаходимо оцінки дисперсій (середні квадратів відхилень)
;
;
;
(2.20)
;
.
Перевірка гіпотез
Нехай
– математичні сподівання рядків
табл. 2.2, а
– математичні сподівання стовпців.
Тоді
– ефект
-ї
градації фактора
;
– ефект
-ї
градації фактора
;
– ефект
-ї
градації фактора
в умовах
-ї
градації фактора
;
– математичне сподівання у кожній з
клітинок.
Сформулюємо гіпотези, які стверджують, що впливи факторів і на всіх рівнях однакові, а взаємовпливу факторів нема:
;
;
для всіх
та
. (2.21)
Критерії для перевірки цих гіпотез мають такий вигляд:
;
;
(2.22)
Якщо гіпотеза
правильна (тобто одночасно виконуються
всі три підгіпотези), то
,
і
підпорядковані розподілу Фішера з
відповідними степенями вільності. Дію
факторів
,
і
уважатимемо суттєвою (для заданого
рівня значущості
),
якщо
або
,
або (2.23)
.
Результати двофакторного дисперсійного аналізу записують у таблицю (табл. 2.3).
Таблиця 2.3
Схема обчислень для двофакторного дисперсійного аналізу з рівномірною кількістю повторень
Різновид дисперсії |
Сума квадратів відхилень |
Кількість ступенів вільності |
Середній квадрат (оцінка дисперсії) |
–критерій |
Факторна для фактора |
|
|
|
|
Факторна для фактора |
|
|
|
|
Змішана для факторів
|
|
|
|
|
Залишкова |
|
|
|
|
Загальна |
|
|
|
|