
- •Критерій узгодженості Колмогорова-Смирнова
- •Перевірка гіпотез про узгодженність
- •Перевірка простої гіпотези
- •Критерій Колмогорова при простій гіпотезі
- •Критерій Смирнова при простій гіпотезі
- •Перевірка складної гіпотези
- •Критерій Колмогорова при складній гіпотезі
- •Критерій Смирнова при складній гіпотезі
- •Вплив обсягу вибірки на розподіл при складних і простих гіпотезах
- •Приклади
- •Висновок
Вступ
Математична статистика вивчає способи отримання статистичних закономірностей на підставі спостережень випадкових величин.
Статистичною
гіпотезою називається будь-яке твердження
про вигляд або властивості розподілу
спостережуваних в експерименті
випадкових величин (зазвичай вона
позначається
і
називається основною).
Перевірка статистичної гіпотези полягає в тому, щоб сформулювати таке правило, яке дозволило б за результатами відповідних спостережень прийняти або відхилити гіпотезу.
Рішення статистичних задач зазвичай містить два етапи: припущення про розподіл досліджуваної випадкової величини і вивчення цієї величини в рамках зробленого припущення. При цьому, природно, необхідно встановити, наскільки припущення про розподіл випадкових величин відповідають експериментальним даним. Прийнято ставити питання у формі: чи не вступає прийнята статистична модель в протиріччя з наявними даними. Критерії, що вирішують таке завдання, називають критеріями згоди.
Критеріями згоди називають статистичні критерії, призначені для виявлення розбіжностей між гіпотетичною статистичною моделлю і реальними даними, які ця модель покликана описати.
Вважаємо, що спостереження становлять випадкову вибірку, а теоретична модель описує закон розподілу ймовірностей, який управляє випадковим вибором. Важливо, що цей розподіл має бути вибрано незалежно від тих даних, за якими будемо його перевіряти. Інакше кажучи, неприпустимо спочатку "підігнати" по вибірці деякий закон розподілу, а потім намагатися перевірити згоду з отриманим законом по цій же вибірці. Допускається розбити вибірку на дві частини, по одній "підігнати" закон розподілу, а по інший - перевірити його. Говорячи по теоретичному законі розподілу, якому гіпотетично мали б слідувати елементи даної вибірки, треба розрізняти прості і складні гіпотези про цей закон:
• проста гіпотеза прямо вказує якийсь певний закон ймовірностей (розподіл ймовірностей), по якому виникли вибіркові значення;
• складна гіпотеза вказує на єдиний розподіл (наприклад, параметричне сімейство).
Критерії згоди засновані на використанні різних заходів відстаней між аналізованим емпіричним розподілом і функцією розподілу ознаки у генеральній сукупності.
Критерій узгодженості Колмогорова-Смирнова
Критерій узгодженості Колмогорова-Смирнова застосовується для перевірки гіпотез лише про неперервні закони розподілу : неперервна випадкова величина Х має рівномірний розподіл на відрізку [a, b], якщо на цьому відрізку щільність розподілу ймовірності випадкової величини постійна, тобто якщо диференціальна функція розподілу f (х) має наступний вигляд:
Даний критерій дозволяє проводити перевірку узгодженості емпіричної функції розподілу з теоретичною. Перевіряється справедливість гіпотези H0 : F*(x) = F(x) в протиставлення гіпотезі H1 : F*(x) ≠ F(x).
Критерій узгодженості Колмогорова заснований на тому факті, що розподіл супремума різниці між теоретичною і емпіричною функціями розподілу
Dn = sup │F*(x) – F(x)│
однаковий для будь-якої F(x). Величину Dn називають статистикою Колмогорова.
При малих n для статистики Колмогорова є таблиці критичних точок Dкр. При великих n використовують граничний розподіл Колмогорова:
P(
Для
розподілу Колмогорова, граничного для
статистики
,
також існують таблиці критичних точок
.
Практично їх використовують вже при
n>
20.
У
загальному випадку функція розподілу
F(x) може бути і різною, хоча вона має
розриви тільки першого роду, які є
скачками. Тому вибіркову статистику
в загальному випадку визначають за
допомогою точної верхньої межі (sup):
,
- статистика
Смирнова,
,
- статистика Колмогорова,
при
цьому
.
Алгоритм перевірки гіпотези:
Результати спостереження представляються у вигляді інтервального статистичного ряду.
Знаходиться значення емпіричної функції розподілу F*(x).
Користуючись гіпотетичною функцією розподілу, обчислюють значення F(x) теоретичної функції розподілу, що відповідають спостережуваним значенням випадкової величини
.
Знаходять Dn і розраховують спостережуване значення вибіркової статистики
.
За заданимм рівнем значущості
із таблиць квантилей розподілу Колмогорова знаходять критичні точки
.
Порівнюючи спостережуване значення вибіркової статистики
з критичною точкою , приймають одне з рішень:
а)
якщо Dn
, то
вважається, що для відхилення нульової
гіпотези підстав нема, тобто, гіпотетична
функція розподілу узгоджується з
досвідченими даними;
б)
якщо Dn
, то нульова гіпотеза відхиляється на
користь альтернативної.
Примітка. Критерій Колмогорова, строго говорячи, не можна застосовувати у випадках згрупованних даних при невідомих параметрах розподілу. Тим не менш, він інколи застосовується на практиці і в подібних випадках. Однак, при цьому статистики критерію виходять заниженими, що збільшує помилку першого роду. Тоді слід використовувати інші критерії.
Перевірка гіпотез про узгодженність
Застосовуючи критерії узгодженості для перевірки відповідності спостережуваного відомого розподілу теоретичному закону, слід розрізняти перевірку простих і складних гіпотез.
Проста перевіряюча гіпотеза має вигляд H0: F (x) = F (x, θ), де F (x, θ) - функція розподілу ймовірностей, з якої перевіряють узгодженість спостережуваної вибірки, а θ - відоме значення параметра (скалярного або векторного).
Складна
перевіряюча гіпотеза
має вигляд H0:
F (x) Î {F (x, θ), θ Î
}, де
- область визначення параметра θ. У
цьому випадку оцінку параметра розподілу
обчислюють за тією ж самою вибіркою,
за якою перевіряють згоду. Якщо оцінку
обчислюють за іншою вибіркою, то гіпотеза
проста.
У процесі перевірки узгодженості по вибірці обчислюють значення S* статистики використовуваного критерію. Потім для того, щоб зробити висновок про прийняття або відхилення гіпотези Н0, необхідно знати умовний розподіл G (S ½ Н0) статистики S при справедливості Н0.
У процесі перевірки узгодженості по вибірці обчислюють значення S* статистики використовуваного критерію. Потім для того, щоб зробити висновок про прийняття або відхилення гіпотези Н0, необхідно знати умовний розподіл G (S ½ Н0) статистики S при справедливості Н0. І якщо ймовірність
P
досить
велика, принаймні P
{S
S*}
α,
де
(s
½ Н0)
- умовна щільність, а α
- рівень значущості (ймовірність помилки
1-го роду - відхилити справедливу гіпотезу
Н0),
то прийнято вважати, що немає підстав
для відхилення гіпотези Н0.