
- •Частина 1 Базові поняття статистики
- •Передмова
- •1. Вступ до геостатистики Характер геологічної інформації
- •Шкали вимірювання кількісних даних
- •Первинне опрацювання інформації
- •Системний аналіз геологічних об’єктів і процесів
- •Три типи математичних моделей
- •Роль математичної статистики в опрацюванні геологічних даних
- •Завдання математичної статистики
- •Загальна схема розв’язування геологічних задач
- •Геостатистика: між ейфорією та скепсисом
- •2. Головні поняття теорії Ймовірностей
- •Головні властивості ймовірностей
- •Приклад обчислення ймовірностей за допомогою частотного відношення
- •Властивості функції розподілу
- •Характеристики випадкових величин
- •4. Головні закони розподілу, які використовують у геостатистиці
- •Біноміальний закон розподілу
- •Закон розподілу Пуассона
- •Нормальний закон розподілу, або розподіл Гауcса
- •Логарифмічно нормальний (логнормальний) розподіл
- •Інші закони розподілу
- •Розподіл Стьюдента (t-розподіл)
- •Розподіл хі-квадрат
- •Розподіл Фішера (f-розподіл)
- •5. Точкові та інтервальні оцінки статистичного матеріалу (параметрів геологічної сукупності) Критерії оцінювання
- •Точкові оцінки для математичного сподівання, дисперсії, асиметрії та ексцесу
- •Інтервальна оцінка для математичного сподівання
- •Мінімально необхідна кількість вимірювань для оцінювання математичного сподівання із заданою точністю
- •Інтервальна оцінка для дисперсії
- •Дисперсія асиметрії та ексцесу й перевірка гіпотези про нормальний розподіл
- •6. Перевірка геологічних гіпотез Поняття про статистичне доведення
- •Шість етапів статистичного доведення
- •Похибки першого й другого роду
- •Параметричні й непараметричні критерії
- •Критерій погодженості хі-квадрат
- •7. Порівняння двох об’єктів за середнім та дисперсією Критерії Велча й Вілкоксона
- •Критерії Фішера й Сіджела–Тьюкі
- •Список Рекомендованої літератури
- •Список Довідкової Літератури
- •Деякі Інтернет-ресурси
- •Геостатистика
Інтервальна оцінка для дисперсії
Побудова інтервальної оцінки для
дисперсії ґрунтується на тому факті,
що величина
відповідає розподілу
із
ступенями вільності. Тоді
(5.10)
або
, (5.11)
де
,
,
– квантилі розподілу хі-квадрат для
заданої ймовірності
і
,
відповідно (критичні значення для
“хвостів” розподілу).
Дисперсія асиметрії та ексцесу й перевірка гіпотези про нормальний розподіл
Точкові оцінки асиметрії та ексцесу мають асимптотично нормальний розподіл. На цьому факті ґрунтується експрес-метод перевірки належності вибірки до нормального закону розподілу. Наближено стандартне відхилення для цих величин можна оцінити за формулами
,
, (5.12)
де – обсяг вибірки. Якщо
або
,
, (5.13)
то гіпотезу про нормальний закон розподілу відкидають.
Для середніх (
50–60)
та малих (
15–25)
вибірок розподіл оцінок асиметрії та
ексцесу вже значно відхиляється від
нормального, що різко знижує ефективність
методу. Іноді можна рекомендувати брати
або застосовувати точніші методи.
6. Перевірка геологічних гіпотез Поняття про статистичне доведення
Вирішення багатьох геологічних, геохімічних, геофізичних, екологічних та інших завдань ґрунтується на принципі аналогії, коли властивості невідомих або досліджуваних об’єктів виводять або порівнюють з властивостями відомих або еталонних об’єктів.
Інше завдання – це порівняння або класифікація, поділ об’єктів за деяким критерієм (принципом), що потребує оцінки міри розбіжності.
Для об’єктивного вирішення таких завдань використовують статистичні методи перевірки гіпотез про однаковість деяких числових характеристик. Під гіпотезою розуміють деяке твердження, яке може бути істинним або хибним. Перевірку гіпотез статистичними методами називають статистичним доведенням. Воно суттєво відрізняється від логічного або математичного. Прийняття чи відхилення гіпотези не дає логічного (фізичного) пояснення досліджуваного явища чи події, тобто не виявляються причинно-наслідкові зв’язки (не відповідає на питання “чому?”). Неформальна інтерпретація результатів статистичного опрацювання даних можлива із залученням знань фундаментальних наук (фізики, хімії, біології, геології).
Шість етапів статистичного доведення
1. Формулювання гіпотези
(головної, нульової)
про значення (однаковість, значущість,
вплив) деяких числових характеристик.
Для нульової гіпотези існує альтернативна
,
що її заперечує. Вона може складатися
з декількох підгіпотез. Гіпотези
і
утворюють повну систему подій для
твердження, яке перевіряють.
Приклад. Фактична середня
концентрація деякого елемента
(інгредієнта) у двох серіях проб,
відповідно,
=5,22%
і
=4,83%.
Нульову гіпотезу можна сформулювати
твердженням, що середній вміст цього
елемента у двох експериментах статистично
не відрізняється:
.
Альтернативна гіпотеза
складається з двох односторонніх:
або
,
відповідно, лівої і правої.
2. Вибір рівня значущості . Тоді довірча ймовірність для прийнятої нульової гіпотези дорівнює , тобто – це “право на похибку”, зумовлене відсутністю повної інформації про генеральну сукупність (усі можливі прояви природного об’єкта дослідження). Вибирають:
для попередніх (“грубих”) оцінок правильності гіпотези (у межах 10%);
інженерний рівень точності (похибки), найчастіше використовують на практиці (у межах 5%);
для достатньо точних оцінок гіпотези, притаманних, наприклад, глибоким науковим дослідженням. Вибір конкретного часто залежить від завдань і наявних ресурсів (до 1%).
3. Вибір і обчислення статистики
.
Тут під терміном статистика розуміємо
математичну функцію, що залежить від
даних експерименту і дає випадкове
число. Отже, її результати можна
досліджувати статистичними методами.
[4]. Математичне дослідження закону розподілу для статистики . Виконують тільки спеціалісти з математичної статистики під час розробки нового методу. Далі вважатимемо, що дані про закон розподілу можна взяти з довідника (для конкретного критерію).
5. Згідно зі встановленим (п. 4)
законом розподілу знаходять критичні
значення статистики (для заданого
рівня значущості):
.
6. Перевірка критерію: якщо
,
то приймаємо нульову гіпотезу
,
інакше – альтернативну
.
Ще говорять, що для заданого рівня
значущості експериментальні дані не
суперечать нульовій гіпотезі.
Висновки щодо гіпотези повинні бути проінтерпретовані в термінах прикладного завдання із зазначенням рівня значущості.