
- •Частина 1 Базові поняття статистики
- •Передмова
- •1. Вступ до геостатистики Характер геологічної інформації
- •Шкали вимірювання кількісних даних
- •Первинне опрацювання інформації
- •Системний аналіз геологічних об’єктів і процесів
- •Три типи математичних моделей
- •Роль математичної статистики в опрацюванні геологічних даних
- •Завдання математичної статистики
- •Загальна схема розв’язування геологічних задач
- •Геостатистика: між ейфорією та скепсисом
- •2. Головні поняття теорії Ймовірностей
- •Головні властивості ймовірностей
- •Приклад обчислення ймовірностей за допомогою частотного відношення
- •Властивості функції розподілу
- •Характеристики випадкових величин
- •4. Головні закони розподілу, які використовують у геостатистиці
- •Біноміальний закон розподілу
- •Закон розподілу Пуассона
- •Нормальний закон розподілу, або розподіл Гауcса
- •Логарифмічно нормальний (логнормальний) розподіл
- •Інші закони розподілу
- •Розподіл Стьюдента (t-розподіл)
- •Розподіл хі-квадрат
- •Розподіл Фішера (f-розподіл)
- •5. Точкові та інтервальні оцінки статистичного матеріалу (параметрів геологічної сукупності) Критерії оцінювання
- •Точкові оцінки для математичного сподівання, дисперсії, асиметрії та ексцесу
- •Інтервальна оцінка для математичного сподівання
- •Мінімально необхідна кількість вимірювань для оцінювання математичного сподівання із заданою точністю
- •Інтервальна оцінка для дисперсії
- •Дисперсія асиметрії та ексцесу й перевірка гіпотези про нормальний розподіл
- •6. Перевірка геологічних гіпотез Поняття про статистичне доведення
- •Шість етапів статистичного доведення
- •Похибки першого й другого роду
- •Параметричні й непараметричні критерії
- •Критерій погодженості хі-квадрат
- •7. Порівняння двох об’єктів за середнім та дисперсією Критерії Велча й Вілкоксона
- •Критерії Фішера й Сіджела–Тьюкі
- •Список Рекомендованої літератури
- •Список Довідкової Літератури
- •Деякі Інтернет-ресурси
- •Геостатистика
Похибки першого й другого роду
Результати статистичного доведення можна навести у вигляді таблиці:
-
H0
Правильна
Хибна
Приймають
+
Помилка другого роду,
Відкидають
Помилка першого роду,
+
Як звичайно, нульову гіпотезу формулюють так, щоб негативний вплив (шкода) помилки першого роду був меншим, ніж вплив помилки другого роду. З імовірністю ми можемо помилково віднести дані, що відповідають гіпотезі H0, до H1. Мірою якості критерію, або потужністю критерію, є число 1- (рис.6.1).
Рис. 6.1. Розподіли
і
значень функції-статистики, якщо
правильна нульова гіпотеза чи проста
альтернативна гіпотеза, відповідно.
Тут:
– критичне значення статистики, що
відділяє область прийняття нульової
гіпотези
(з рівнем значущості
)
від критичної області
(нульову гіпотезу відкидаємо);
– ймовірність помилки другого роду.
Параметричні й непараметричні критерії
Статистичні критерії поділяють на параметричні і непараметричні. Для застосування параметричних критеріїв необхідно перевірити виконання додаткових умов, наприклад, підпорядкування вибірки певному закону розподілу. Непараметричні ж критерії не потребують додаткових перевірок, але мають меншу потужність.
Критерій погодженості хі-квадрат
Цей критерій використовують для перевірки частотного розподілу деякого параметра двох об’єктів або вибірки і заданого розподілу (планового теоретичного, еталонного об’єкта).
Нехай задано вибірку, яку можна розбити на k класів (груп). Класи вибирають так, щоб у кожному з них було достатньо значень (не менше шести-восьми), інакше класи об’єднують. Завдання полягає в перевірці гіпотези, що кількість появи значень у кожному з класів (інтервалів) узгоджується із заданим. Схема статистичного доведення така.
1. Формулювання гіпотези
H0:
для всіх
;
H1:
хоча б для одного
,
де
– фактична кількість – частота –
(експериментальних) даних в i-му
класі;
– очікувана (планова, теоретична)
кількість даних в i-му
класі;
– кількість класів (груп);
– частотне відношення;
– теоретична ймовірність.
2. Вибір рівня значущості .
3. Обчислюємо статистику Пірсона
або
. (6.1)
4. Статистика
має однойменний розподіл
(Пірсона), з
ступенями вільності (
– “degree of
freedom” (англ.) – ступені
вільності). Якщо теоретичний закон
розподілу має параметри, які оцінюють
на підставі вибірки (наприклад, середнє
та дисперсія для нормального закону
розподілу), то
додатково потрібно зменшити на кількість
оцінюваних параметрів (тому для
нормального розподілу матимемо
).
5. Знаходимо критичні значення статистики
.
6. Перевіряємо критерій: якщо
,
то порівнювані розподіли статистично
не відрізняються.
Приклад. Перевірити узгодженість експериментальних даних нормальному закону розподілу.
Статистичний матеріал розбиваємо на класи (з використанням формули Стеджерса або з інших міркувань, наприклад, з урахуванням правила “трьох сигм”). Для ефективності критерію домагаємося, щоб кількість класів була не менше шести–семи, а кількість даних у кожному класі – не менше п’яти. Інакше потрібно збільшити сусідні класи. Отже, можна вважати, що критерій ефективно застосовувати, якщо обсяг вибірки досягає 50–60 значень.
Далі знаходимо точкові оцінки математичного
сподівання та дисперсії (або стандартного
відхилення):
.
Ступені вільності:
.
Для обчислення теоретичної кількості
значень в i-му
класі скористаємося властивостями
частотного відношення та інтегральної
функції розподілу
:
, (6.2)
де
– межі (інтервал) k-го
класу. Обчисливши статистику (6.1) і
знайшовши для неї верхнє критичне
значення
,
робимо висновок щодо нульової гіпотези
.
Очевидно, що для добре узгоджених
теоретичного й експериментального
розподілу значення повинне бути малим,
тому розглядаємо тільки праву альтернативу
.