
- •Частина 1 Базові поняття статистики
- •Передмова
- •1. Вступ до геостатистики Характер геологічної інформації
- •Шкали вимірювання кількісних даних
- •Первинне опрацювання інформації
- •Системний аналіз геологічних об’єктів і процесів
- •Три типи математичних моделей
- •Роль математичної статистики в опрацюванні геологічних даних
- •Завдання математичної статистики
- •Загальна схема розв’язування геологічних задач
- •Геостатистика: між ейфорією та скепсисом
- •2. Головні поняття теорії Ймовірностей
- •Головні властивості ймовірностей
- •Приклад обчислення ймовірностей за допомогою частотного відношення
- •Властивості функції розподілу
- •Характеристики випадкових величин
- •4. Головні закони розподілу, які використовують у геостатистиці
- •Біноміальний закон розподілу
- •Закон розподілу Пуассона
- •Нормальний закон розподілу, або розподіл Гауcса
- •Логарифмічно нормальний (логнормальний) розподіл
- •Інші закони розподілу
- •Розподіл Стьюдента (t-розподіл)
- •Розподіл хі-квадрат
- •Розподіл Фішера (f-розподіл)
- •5. Точкові та інтервальні оцінки статистичного матеріалу (параметрів геологічної сукупності) Критерії оцінювання
- •Точкові оцінки для математичного сподівання, дисперсії, асиметрії та ексцесу
- •Інтервальна оцінка для математичного сподівання
- •Мінімально необхідна кількість вимірювань для оцінювання математичного сподівання із заданою точністю
- •Інтервальна оцінка для дисперсії
- •Дисперсія асиметрії та ексцесу й перевірка гіпотези про нормальний розподіл
- •6. Перевірка геологічних гіпотез Поняття про статистичне доведення
- •Шість етапів статистичного доведення
- •Похибки першого й другого роду
- •Параметричні й непараметричні критерії
- •Критерій погодженості хі-квадрат
- •7. Порівняння двох об’єктів за середнім та дисперсією Критерії Велча й Вілкоксона
- •Критерії Фішера й Сіджела–Тьюкі
- •Список Рекомендованої літератури
- •Список Довідкової Літератури
- •Деякі Інтернет-ресурси
- •Геостатистика
7. Порівняння двох об’єктів за середнім та дисперсією Критерії Велча й Вілкоксона
Задано дві вибірки (два об’єкти) обсягом N і M, відповідно:
а)
; б)
.
Точкові оцінки для середнього й дисперсії позначимо так:
–
перший об’єкт,
– другий об’єкт.
Параметричний критерій Велча ефективно
застосовують для порівняння достатньо
великих вибірок (
)
за умов нормального розподілу даних
кожної з вибірок.
Непараметричний критерій Вілкоксона доцільно використовувати для невеликих вибірок (до 50) і тоді, коли нема достовірної інформації про нормальний закон розподілу емпіричних даних.
Як відомо, варіаційним рядом статистичного матеріалу називають упорядкування елементів за зростанням. Порядковий номер елемента у варіаційному ряді називають рангом:
. (7.1)
Верхній індекс означає номер елемента у вибірці (до сортування), нижній – у варіаційному ряді. Якщо варіаційний ряд містить групу або декілька груп однакових елементів, то кожній з них присвоюють усереднений номер (ранг).
Приклад.
Вибірка 5, 4, 8, 6, 4, 9.
Варіаційний ряд 4, 4, 5, 6, 8, 9.
Ранги 1,5; 1,5; 3; 4; 5; 6.
Шість пунктів статистичного доведення для цих критеріїв зведено в порівняльну табл. 7.1.
Таблиця 7.1
Критерії порівняння вибіркових середніх
Номер за пор. |
Критерій |
Велча |
Вілкоксона |
параметричний |
Так |
Ні |
|
1. |
Нульова гіпотеза Альтернатива |
|
|
2. |
Рівень значущості |
|
|
3. |
Статистика |
|
|
4. |
Закон розподілу |
Розподіл Стьюдента з
|
Розподіл Вілкоксона |
5. |
Критичні значення |
|
|
6. |
Критерій |
|
|
Значення
і
відшукують за допомогою спеціальних
таблиць, де, як звичайно, наведено
значення
і
для фіксованих
.
Для достатньо великих обсягів кожної
з вибірок (понад 25) можна скористатися
формулами
,
, (7.2)
де
– критичне значення нормального закону
розподілу для рівня значущості
(обернена функція нормального закону
розподілу).
Критерії Фішера й Сіджела–Тьюкі
Ці критерії використовують для перевірки гіпотези про однаковість дисперсій двох об’єктів, тобто про однаковість розсіяння даних:
. (7.3)
Компактно ці критерії знову ж таки згідно зі схемою статистичного дослідження наведено у табл. 7.2.
Таблиця 7.2
Критерії порівняння дисперсій
Номер за пор. |
Критерій |
Фішера |
Сіджела–Тьюкі |
Параметричний |
Так |
Ні |
|
1. |
Нульова гіпотеза Альтернатива |
|
|
2. |
Рівень значущості |
{0,01; 0,05; 0,10} |
|
3. |
Статистика |
|
|
4. |
Закон розподілу |
Розподіл Фішера з
|
Розподіл Вілкоксона |
5. |
Критичні значення |
|
|
6. |
Критерій прийняття
|
|
|
Критерій Фішера часто використовують у таких задачах.
1. Для впевненості в ефективності використання критерію Велча. Розрізняють випадки однакових дисперсій і суттєво різних, яким відповідають різні статистики. Зазначимо, що в разі підтвердження гіпотези про однаковість дисперсій використовують дещо іншу статистику:
, (7.4)
а тому критерій Фішера часто перевіряють перед використанням критерію Велча.
2. Порівняння ефективності двох методів за аналізом дисперсії похибок. Прилад уважають кондиційним, якщо дисперсія в нього невелика.
3. Розділення різних об’єктів, подібних за середнім вмістом деякого параметра, але різних за ступенем мінливості цього параметра.
4. Іноді виникає потреба порівняти
мінливість об’єкта за параметрами
різної розмірності. Наприклад, концентрація
елемента в об’ємі і вздовж жильного
тіла (погонна концентрація). Використовують
критерій Фішера, записаний щодо
безрозмірного коефіцієнта варіації:
.
Тоді
. (7.5)
Критерій Сіджела–Тьюкі побудований на припущенні про однаковість центрів розподілів заданих вибірок, які оцінюють їхніми медіанами. Тому якщо медіани різні, то дані кожної з вибірок потрібно центрувати щодо медіан і порівнювати не самі значення, а відхилення від медіан.
Значення порівнюваних вибірок об’єднують і записують у вигляді спільного варіаційного ряду (за зростанням):
.
Процедура ранжування цього ряду полягає
в такому: першому елементу ряду
присвоюють ранг 1, останньому – 2, другому
– 3, передостанньому – 4 і так далі,
беручи почергово крайні непронумеровані
елементи. Якщо загальна кількість
непарна, то медіанному елементові ранг
не присвоюють. Тоді значенням вибірки
з меншою дисперсією присвоюватимуть
переважно більші ранги (елементи
скупчуються навколо медіани), а значенням
вибірки з більшою дисперсією – навпаки,
менші ранги. У випадку однакових дисперсій
значення обох вибірок чергуватимуться
випадково, і суми рангів кожної з вибірок
приблизно збігатимуться, як і для
критерію Вілкоксона, тому можна
застосувати відповідну статистику.