
- •Частина 2 Вступ до дисперсійного, кореляційного та регресійного аналізу
- •1. Виділення аномальних об’єктів і однорідних груп серед сукупності Два типи задач
- •Однофакторний непараметричний дисперсійний аналіз Краскала–Волліса
- •Узагальнений критерій Стьюдента
- •Виділення груп об’єктів, однорідних за середнім значенням Критерій хі-квадрат, що ґрунтується на статистиці Велча
- •Критерій хі-квадрат, що ґрунтується на статистиці Вілкоксона
- •2. Дисперсійний аналіз Головні ідеї дисперсійного аналізу
- •Однофакторний дисперсійний аналіз
- •Двофакторний дисперсійний аналіз
- •Перевірка гіпотез
- •3. Кореляційний аналіз Задачі кореляційного аналізу
- •Парна кореляція
- •Властивості коефіцієнта кореляції
- •Вибірковий коефіцієнт кореляції
- •Кореляційне поле
- •Перевірка гіпотези про значущість коефіцієнта кореляції
- •Кореляційна матриця
- •4. Вступ до регресійного аналізУ Рівняння прямої регресії
- •Двовимірний нормальний закон розподілу та геометрична інтерпретація прямої регресії
- •Інтервал довіри для умовного середнього
- •Метод найменших квадратів для визначення параметрів рівняння регресії
- •Оцінка якості апроксимації
- •5. Непараметрична кореляція Кореляція дихотомічних (якісних) ознак
- •Перевірка гіпотези про значущість вибіркового коефіцієнта кореляції
- •Кореляція порядкових геологічних даних
- •Перевірка гіпотези про значущість коефіцієнта кореляції Спірмена
- •Оцінка коефіцієнта кореляції методом “дробового пострілу”
- •6. Нелінійна кореляція Кореляційне співвідношення як універсальна міра взаємозв’язку
- •Властивості кореляційного відношення
- •Перевірка гіпотези про значущість
- •Гіпотеза про правомірність застосування лінійної моделі
- •7. Тренд аналіз
- •Фон, аномалії та поверхня тренда
- •Білінійна просторова апроксимація
- •Експрес-методи оцінки наявності або відсутності тренда (одномірний випадок)
- •Метод зміни знака
- •Метод стрибків
- •Список Рекомендованої літератури
- •Список Довідкової Літератури
- •Геостатистика
Міністерство освіти і науки України
Львівський національний університет імені Івана Франка
Микола Хом’як
Курс лекцій
Частина 2 Вступ до дисперсійного, кореляційного та регресійного аналізу
Львів
Видавничий центр ЛНУ імені Івана Франка
2004
ББК Д3/5 к 95 я 73
Х-76
УДК 55:311(075.8)
Рецензенти:
канд. геол.-мін. наук,
доц. Л.З. Скакун (Львівський національний університет імені Івана Франка)
канд. фіз.-мат. наук,
доц. П.С. Венгерський (Львівський національний університет імені Івана Франка)
Рекомендовано до друку Вченою радою геологічного факультету. Протокол № 11/5 від 19 травня 2004 р.
Х-76 Хом’як М.М. Геостатистика. Курс лекцій. Ч. 2: Вступ до дисперсійного, кореляційного та регресійного аналізу. – Львів: Видавничий центр ЛНУ імені Івана Франка, 2004. – 47 с.
Розглянуто основи класичних методів статистики: дисперсійного, кореляційного та регресійного аналізу. Описано статистичні методи оцінки тренда, поліноміальний тренд і метод найменших квадратів для оцінки його параметрів.
Для студентів геологічного факультету.
©
Хом’як М.М., 2004
1. Виділення аномальних об’єктів і однорідних груп серед сукупності Два типи задач
Перший тип задач полягає у виділенні суттєво відмінних за середнім вмістом (аномальних) об’єктів на загальному фоні переважно більшої групи об’єктів. Таку задачу називатимемо задачею класифікації набору об’єктів на фонову групу та аномальні об’єкти.
Другий тип задач полягає в обґрунтованому виділенні серед набору об’єктів груп однорідності (за середнім вмістом деякого параметра).
Між цими задачами нема різкої межі. Виділення аномальних об’єктів потребує менше затрат часу, а розбиття на статистично однорідні групи більш затратне.
Для розв’язування задач першого типу можна використовувати узагальнений критерій Стьюдента для k об’єктів або ранговий критерій Краскала–Волліса (див. далі непараметричний однофакторний дисперсійний аналіз), а для задач другого типу – критерій хі-квадрат, побудований на статистиці Велча або Вілкоксона.
Обом типам задач відповідає одна і та ж нульова гіпотеза:
(1.1)
за альтернативи
(1.2)
хоча
б для однієї пари індексів
.
Однофакторний непараметричний дисперсійний аналіз Краскала–Волліса
Дисперсійний аналіз використовують для виявлення суттєвих чинників (факторів), що зумовлюють мінливість даних. Далі його розглянемо детальніше. Для однофакторного аналізу вважають суттєвою дію тільки одного фактора, що має декілька рівнів. Тому дані розбивають на декілька груп, що відповідають рівням наявності (дії) цього фактора. Якщо дія фактора суттєва, то логічно припустити, що середній вміст даних на кожному з рівнів буде різним (тобто фактор зумовлює мінливість даних). Навпаки, якщо справджується гіпотеза про рівність середніх на всіх рівнях (1.1), то дія фактора несуттєва.
Непараметричний дисперсійний аналіз Краскала–Волліса формально передбачає таке:
побудову варіаційного ряду і присвоєння рангів елементам об’єднаної вибірки для всіх рівнів факторів,
– обсяг усієї вибірки;
знаходження суми рангів елементів
для кожного з рівнів фактора;
обчислення статистики критерію Краскала–Волліса
; (1.3)
відшукання критичного значення
для заданого рівня значущості
: якщо кількість даних на кожному з рівнів перевищує 5, то статистика
має
-розподіл з
ступенями вільності;
відкидання гіпотези (1.1), якщо
(вплив фактора суттєвий).