- •Серія: теорія ймовірностей та математична статистика Перевірка статистичних гіпотез
- •Рекомендовано до друку кафедрою теоретичної та прикладної статистики Протокол № від .
- •4.1. Означення статистичної гіпотези. Приклади
- •4.2. Критерії узгодження
- •4.3. Перевірка гіпотез про розподіл за допомогою критерію
- •Критерій
- •Нормальний розподіл
- •Рівномірний розподіл
- •Показниковий розподіл
- •Розподіл Пуассона
- •Біноміальний розподіл
- •Перевірка гіпотези про незалежність двох випадкових величин
- •Непараметричні критерії перевірки гіпотез
- •4.4.1. Основні поняття
- •4.4.2. Гіпотеза про однорідність вибірки
- •4.4.3. Критерій знаків
- •4.4.4. Критерій серій
- •4.4.5. Перевірка гіпотези про однорідність двох вибірок. Критерій Вілкоксона
- •4.4.6. Двовибірковий критерій м.В.Смірнова
- •4.4.7. Критерій Колмогорова
- •4.5. Параметричні гіпотези
- •4.5.1. Гіпотеза про рівність математичних сподівань двох нормально розподілених ознак генеральної сукупності
- •4.5.2. Гіпотеза про рівність дисперсій двох нормально розподілених ознак генеральної сукупності
- •Розглянемо випадкову величину
- •4.5.3. Гіпотеза про рівність математичного сподівання нормально розподіленої ознаки генеральної сукупності гіпотетичному значенню
- •4.5.4. Гіпотеза про рівність дисперсії нормально розподіленої ознаки генеральної сукупності гіпотетичному значенню
- •4.5.5. Гіпотеза про рівність декількох дисперсій нормально розподілених ознак генеральної сукупності за вибірками однакового об'єму
- •4.5.6. Гіпотеза про рівність математичних сподівань двох нормально розподілених ознак і генеральної сукупності з невідомими дисперсіями (залежні вибірки)
- •4.5.7. Гіпотеза про рівність невідомої ймовірності р гіпотетичній ймовірності
- •4.5.8. Гіпотеза про рівність двох ймовірностей біноміальних розподілів
- •4.6. Застосування ппп
- •Гіпотетична середня різниця
- •Вихідний діапазон
- •Додаток
- •Значення функції Лапласа .
- •Значення для t-розподілу Стьюдента
- •Критичні значення для виявлення промахів
- •Критерій знаків
- •Критерій серій
- •Критерій Вілкоксона
- •Література
Нормальний розподіл
а) емпіричний розподіл заданий у виді рівновіддалених варіант.
Для заданого рівня значущості перевірку гіпотези про нормальний закон розподілу генеральної сукупності проводять за схемою:
Обчислюємо вибіркове середнє
і вибіркове середнє квадратичне
відхилення
.Теоретичні частоти
обчислюємо за формулою
,
де n
– об’єм вибірки, h
– різниця між двома сусідніми варіантами
(крок),
,
.
Критична область
,
де
– точкова оцінка випадкової величини
,
– критична точка правосторонньої
критичної області, яку для заданого
рівня значущості
і числа ступенів свободи
знаходять за таблицею 5 у додатку.
Зауваження 4.4. Якщо в окремих розрядах емпіричні частоти малочисельні (ki < 10), то їх об’єднують, а відповідні їм емпіричні та теоретичні частоти додають. Тоді при обчисленні число ступенів свободи l дорівнює числу розрядів вибірки, які залишились після об’єднання.
Зауваження 4.5. Для контролю за правильністю обчислень користуються рівністю
.
б)
емпіричний розподіл заданий у виді
послідовності інтервалів (xi,
xi+1)
і відповідних їм частот
.
Нехай рівень значущості задано. Тоді:
Обчислюємо
і
,
причому
.Переходимо до випадкової величини
і шукаємо кінці інтервалів за формулами
,
,
причому найменше z
покладаємо рівним -,
а найбільше +.Теоретичні частоти
обчислюємо за формулою
,
де n
– об’єм вибірки,
– ймовірності попадання випадкової
величини
в інтервал (xi,
xi+1),
.Критична область
визначається аналогічно до пункту а).
Тут і надалі (п.п. 2, 3, 4, 5) слід враховувати також зауваження 4.6 і 4.7.
Приклад 4.1. Групування споживчих товариств (СТ) за величиною роздрібного товарообігу дало наступні результати:
Групи СТ (тис. грн.) |
[zi, zi+1) |
[0 – 100) |
[100 – 200) |
[200 – 300) |
[300 – 400) |
[400 – 500] |
Кількість СТ |
|
26 |
102 |
48 |
16 |
6 |
Для рівня значущості =0,05 перевірити гіпотезу про нормальність розподілу генеральної сукупності.
Розв’язок.
Перейдемо від інтервальної таблиці
частот до статистичного ряду з
рівновіддаленими варіантами, поклавши
:
|
50 |
150 |
250 |
350 |
450 |
|
26 |
102 |
48 |
16 |
6 |
Для
нього
= 186,36,
= 115,87.
Обчислюємо
теоретичні частоти
.
Для цього складаємо розрахункову таблицю
4.1.
Таблиця 4.1
i |
xi |
xi+1 |
|
|
|
|
|
|
|
|
1 |
0 |
100 |
-186,36 |
-86,36 |
- |
-0,7453 |
-0,5 |
-0,27337 |
0,22663 |
44,83 |
2 |
100 |
200 |
-86,36 |
13,64 |
-0,7453 |
0,1177 |
-0,27337 |
0,04776 |
0,32113 |
63,58 |
3 |
200 |
300 |
13,64 |
113,64 |
0,1177 |
0,9808 |
0,04776 |
0,33648 |
0,28872 |
57,17 |
4 |
300 |
400 |
113,64 |
213,64 |
0,9808 |
1,8438 |
0,33648 |
0,46712 |
0,13064 |
25,87 |
5 |
400 |
500 |
213,64 |
313,64 |
1,8438 |
+ |
0,46712 |
0,5 |
0,03288 |
6,51 |
|
|
|
|
|
|
|
|
|
1 |
197,96 |
Порівняємо емпіричні і теоретичні частоти і проведемо контроль обчислень (зауваження 4.7). Складемо таблицю 4.2.
Таблиця 4.2
i |
|
|
|
|
1 |
26 |
44,83 |
7,9 |
15,079 |
2 |
102 |
63,58 |
23,22 |
163,636 |
3 |
48 |
57,17 |
1,47 |
40,301 |
4 |
16 |
25,87 |
3,77 |
9,896 |
5 |
6 |
6,51 |
0,004 |
5,530 |
|
|
|
36,364 |
234,442 |
.
Оскільки
незначна різниця між 36,442 і 36,364 зумовлена
заокругленнями при проведенні обчислень,
то можемо вважати, що вони проведені
вірно. З таблиці 5 у додатку знаходимо,
що
.
Враховуючи, що 36,364 > 5,99, то гіпотеза
про нормальність розподілу відхиляється.
Це означає, що дані досліджень не
узгоджуються з гіпотезою про нормальний
розподіл генеральної сукупності.
