- •Серія: теорія ймовірностей та математична статистика Перевірка статистичних гіпотез
- •Рекомендовано до друку кафедрою теоретичної та прикладної статистики Протокол № від .
- •4.1. Означення статистичної гіпотези. Приклади
- •4.2. Критерії узгодження
- •4.3. Перевірка гіпотез про розподіл за допомогою критерію
- •Критерій
- •Нормальний розподіл
- •Рівномірний розподіл
- •Показниковий розподіл
- •Розподіл Пуассона
- •Біноміальний розподіл
- •Перевірка гіпотези про незалежність двох випадкових величин
- •Непараметричні критерії перевірки гіпотез
- •4.4.1. Основні поняття
- •4.4.2. Гіпотеза про однорідність вибірки
- •4.4.3. Критерій знаків
- •4.4.4. Критерій серій
- •4.4.5. Перевірка гіпотези про однорідність двох вибірок. Критерій Вілкоксона
- •4.4.6. Двовибірковий критерій м.В.Смірнова
- •4.4.7. Критерій Колмогорова
- •4.5. Параметричні гіпотези
- •4.5.1. Гіпотеза про рівність математичних сподівань двох нормально розподілених ознак генеральної сукупності
- •4.5.2. Гіпотеза про рівність дисперсій двох нормально розподілених ознак генеральної сукупності
- •Розглянемо випадкову величину
- •4.5.3. Гіпотеза про рівність математичного сподівання нормально розподіленої ознаки генеральної сукупності гіпотетичному значенню
- •4.5.4. Гіпотеза про рівність дисперсії нормально розподіленої ознаки генеральної сукупності гіпотетичному значенню
- •4.5.5. Гіпотеза про рівність декількох дисперсій нормально розподілених ознак генеральної сукупності за вибірками однакового об'єму
- •4.5.6. Гіпотеза про рівність математичних сподівань двох нормально розподілених ознак і генеральної сукупності з невідомими дисперсіями (залежні вибірки)
- •4.5.7. Гіпотеза про рівність невідомої ймовірності р гіпотетичній ймовірності
- •4.5.8. Гіпотеза про рівність двох ймовірностей біноміальних розподілів
- •4.6. Застосування ппп
- •Гіпотетична середня різниця
- •Вихідний діапазон
- •Додаток
- •Значення функції Лапласа .
- •Значення для t-розподілу Стьюдента
- •Критичні значення для виявлення промахів
- •Критерій знаків
- •Критерій серій
- •Критерій Вілкоксона
- •Література
4.4.6. Двовибірковий критерій м.В.Смірнова
Нехай
– вибірка з неперервно розподіленої
генеральної сукупності з функцією
розподілу
,
а
– вибірка з неперервно розподіленої
генеральної сукупності з функцією
розподілу
.
Потрібно перевірити нульову гіпотезу
про співпадання розподілів обох вибірок.
Для її перевірки М.В.Смірнов запропонував
статистику
де
і
-
емпіричні функції розподілу обох
вибірок.
Розподіл
статистики
не залежить від гіпотетичних розподілів
і
,
а при досить великих
і
випадкова величина
має розподіл А.М.Колмогорова. Критична
область
,
де
знаходимо з таблиці 6 у додатку.
Приклад. 4.11. При експертній оцінці вагомості факторів „Операції з дочірними підприємствами” та „Форма розрахунків на підприємстві”, які впливають на внутрішньогосподарський ризик, групою з 20 експертів отримано наступні результати:
5 |
5 |
5 |
2 |
5 |
2 |
4 |
3 |
5 |
8 |
3 |
3 |
2 |
10 |
2 |
5 |
0 |
3 |
5 |
5 |
5 |
1 |
0 |
5 |
5 |
2 |
4 |
5 |
6 |
4 |
7 |
3 |
4 |
5 |
3 |
5 |
3 |
5 |
4 |
3 |
Для
рівня значущості
перевірити нульову гіпотезу
про співпадання розподілів оцінок обох
факторів.
Розв’язок. Обчислення проведемо, використовуючи таблицю 4.4.
Таблиця 4.4.
хі |
yi |
|
|
|
0
2 3 4 5
8 10 |
0 1 2 3 4 5 6 7 |
0,05 0,05 0,25 0,45 0,5 0,9 0,9 0,9 0,95 1 |
0,05 0,1 0,15 0,35 0,55 0,9 0,95 1 1 1 |
0 0,05 0,1 0,1 0,05 0 0,05 0,1 0,05 0 |
Максимальне
значення відхилення
дорівнює 0,1. Тоді
.
З таблиці 6 у додатку знаходимо
як розв’язок рівняння
.
Оскільки 0,316<1,36, то гіпотеза приймається.
4.4.7. Критерій Колмогорова
Якщо обмежимося випадком, коли випадкова величина (ознака) в генеральній сукупності є неперервною, то задачу про перевірку гіпотези H0 ((4.5) або (4.10)) про розподіл для неї можна розв’язати і з допомогою іншого критерію узгодження, а саме, критерію Колмогорова.
Ідея його побудови полягає в наступному.
За міру відхилення теоретичних даних від емпіричних вибирають запропоновану А.М. Колмогоровим випадкову величину у вигляді
,
(4.16)
де
– емпірична функція розподілу, а
– теоретична функція розподілу, яка
задається гіпотезою.
І, що найважливіше, розподіл випадкової величини (4.16) відомий і визначається наступною теоремою, яку ми також наводимо без доведення.
Теорема
4.2.
При
розподіл випадкової величини
незалежно від виду розподілу випадкової
величини
прямує до розподілу Колмогорова:
,
(4.17)
де
- функція Колмогорова, яка протабульована
у таблиці 6 у додатку.
Виходячи
зі змісту даної теореми, рівняння для
визначення критичної області W=(
)
для заданого рівня значущості ,
згідно з рівнянням (4.2), запишеться у
виді:
P(
)=
(4.18)
або
K(t)=1-. (4.19)
Розв’язуючи рівняння (4.19) для заданого , за таблицею 6 отримаємо розв’язок t. Це дозволяє сформулювати критерій узгодження Колмогорова таким чином: нехай – точкова оцінка випадкової величини , яка отримується на основі вибірки (x1, x2, ..., xn) з умови (4.16).
Тоді:
1.
Якщо
,
то гіпотеза H0
відхиляється;
2.
Якщо ж
,
то гіпотеза H0
приймається.
Приклад 4.12. Нехай результати вимірювань 1000 одиниць товару представляються у вигляді такої згрупованої вибірки:
xi |
98 |
98,5 |
99 |
99,5 |
100 |
100,5 |
101 |
101,5 |
102 |
1
(4.20) |
ki |
21 |
47 |
87 |
158 |
181 |
201 |
142 |
97 |
41 |
25 |
Необхідно, користуючись критерієм Колмогорова, перевірити, чи узгоджуються отримані спостереження з гіпотезою про те, що похибка вимірювань має нормальний закон розподілу з параметрами a= =100,25 i =1, якщо рівень значущості =0,05.
Розв’язок. Оскільки, згідно з гіпотезою H0, випадкова величина є нормально розподіленою з параметрами a= =100,25 і =1, то гіпотезу можна записати, як:
H0:F(x)=
,
де (x) - відома функція Лапласа.
За таблицею 2 у додатку для функції Лапласа і на основі методики обчислення емпіричних функцій розподілу для заданої вибірки (4.20) побудуємо для зручності наступну таблицю:
xi |
F(xi) |
F*(xi) |
| F(xi)- F*(xi)| |
98 98,5 99 99,5 100 100,5 101 |
0,012 0,04 0,105 0,226 0,401 0,598 0,773 |
0,01 0,004 0,41 0,234 0,403 0,594 0,776 |
0,002 0,004 0,006 0,008 0,002 0,004 0,007 |
101,5 |
0,894 |
0,885 |
0,009 |
102 102,5 |
0,959 0,987 |
0,954 0,987 |
0,005 0,000 |
з
якої випливає, що максимальне значення
різниця |F(xi)-
F*(xi)|
приймає при xi=101,5
і дорівнює 0,009. Отже, точкова оцінка
,
а
За таблицею 6 для функції Колмогорова для заданого рівня значущості =0,05 отримаємо t0,05=1,38.
Таким
чином,
,
а, отже, згідно з критерієм Колмогорова,
який сформульований вище, робимо
висновок, що дану гіпотезу можна прийняти.
Розглянемо тепер приклади параметричних гіпотез.
