- •Серія: теорія ймовірностей та математична статистика Перевірка статистичних гіпотез
- •Рекомендовано до друку кафедрою теоретичної та прикладної статистики Протокол № від .
- •4.1. Означення статистичної гіпотези. Приклади
- •4.2. Критерії узгодження
- •4.3. Перевірка гіпотез про розподіл за допомогою критерію
- •Критерій
- •Нормальний розподіл
- •Рівномірний розподіл
- •Показниковий розподіл
- •Розподіл Пуассона
- •Біноміальний розподіл
- •Перевірка гіпотези про незалежність двох випадкових величин
- •Непараметричні критерії перевірки гіпотез
- •4.4.1. Основні поняття
- •4.4.2. Гіпотеза про однорідність вибірки
- •4.4.3. Критерій знаків
- •4.4.4. Критерій серій
- •4.4.5. Перевірка гіпотези про однорідність двох вибірок. Критерій Вілкоксона
- •4.4.6. Двовибірковий критерій м.В.Смірнова
- •4.4.7. Критерій Колмогорова
- •4.5. Параметричні гіпотези
- •4.5.1. Гіпотеза про рівність математичних сподівань двох нормально розподілених ознак генеральної сукупності
- •4.5.2. Гіпотеза про рівність дисперсій двох нормально розподілених ознак генеральної сукупності
- •Розглянемо випадкову величину
- •4.5.3. Гіпотеза про рівність математичного сподівання нормально розподіленої ознаки генеральної сукупності гіпотетичному значенню
- •4.5.4. Гіпотеза про рівність дисперсії нормально розподіленої ознаки генеральної сукупності гіпотетичному значенню
- •4.5.5. Гіпотеза про рівність декількох дисперсій нормально розподілених ознак генеральної сукупності за вибірками однакового об'єму
- •4.5.6. Гіпотеза про рівність математичних сподівань двох нормально розподілених ознак і генеральної сукупності з невідомими дисперсіями (залежні вибірки)
- •4.5.7. Гіпотеза про рівність невідомої ймовірності р гіпотетичній ймовірності
- •4.5.8. Гіпотеза про рівність двох ймовірностей біноміальних розподілів
- •4.6. Застосування ппп
- •Гіпотетична середня різниця
- •Вихідний діапазон
- •Додаток
- •Значення функції Лапласа .
- •Значення для t-розподілу Стьюдента
- •Критичні значення для виявлення промахів
- •Критерій знаків
- •Критерій серій
- •Критерій Вілкоксона
- •Література
4.4.3. Критерій знаків
Нехай
і
- n
пар випадкових величин, для яких різниці
можна подати у вигляді
,
а випадкові величини
:
1) незалежні; 2) неперервно розподілені;
3) симетрично розподілені відносно нуля
(симетричність розподілів
означає, що розподіли
та -
збігаються).
Зауважимо,
що розподіли випадкових величин
та
неперервні, але невідомі (і вони можуть
бути, взагалі кажучи, різними як і
розподіли випадкових величин
).
Щодо
невідомого параметра
висувається гіпотеза
. Альтернативними до неї є
;
;
.
Справджується
чи ні гіпотеза
,
випадкові величини
неперервно й симетрично розподілені
відносно нуля і незалежні. Звідси
випливає, що випадкова величина, яка
дорівнює кількості випадкових величин
що набули додатних значень має біноміальний
розподіл із параметрами
і тому кількість даних величин серед
,
близька до половини наявних, тобто до
.
Позначимо
через
кількість додатних різниць серед
.
Тоді при перевірці гіпотези
її природно відхиляти, якщо кількість
додатних різниць
істотно відрізняється від
і не відхиляти в іншому випадку.
Критична
точка
визначається як мінімальне число m
, для якого
,
де
- біноміально розподілена випадкова
величина з параметрами n
та
.
Для заданого рівня значущості
значення
знаходять за таблицею 12 у додатку.
Критична
область
при
;
при
;
при
.
Якщо
зняти вимогу про неперервність розподілів
випадкових величин
і
,
то різниці
,
можуть набувати нульових значень з
ненульовою ймовірністю. В даному випадку
критерій знаків можна застосувати до
відмінних від нуля різниць, відкинувши
нульові.
Приклад 4.8 Групою з 20 експертів проводилася оцінка вагомості факторів „Характер бізнесу клієнта” і „Професійність і чесність адміністрації” та отримано наступні результати:
8, 5, 20, 8, 5, 18, 8, 5, 10, 8, 15, 8, 5, 10, 35, 5, 10, 5, 10, 12.
4, 5, 20, 5, 3, 6, 10,15,10, 9, 8, 40, 8, 5, 10, 20, 18, 20, 10, 20.
Для
рівня значущості
перевірити нульову гіпотезу
про співпадання оцінок експертів при
альтернативній гіпотезі
про їх відмінність.
Розв’язок.
Позначимо через
- оцінки першого фактору,
– другого, а
.
Тоді різниці
будуть мати наступні знаки:
+, 0, 0, +, +, +, -, -, 0, -, +, -, -, +, +, -, -, -, 0, -.
Кількість
різниць відмінних від нуля
, а кількість додатних різниць
.
Тоді з таблиці 12 у додатку для
і
знаходимо, що область прийняття гіпотези
.
Таким чином гіпотеза
приймається, тобто нема істотної різниці
в оцінках експертів.
Часто
при перевірці гіпотези
користуються критерієм Фішера. Зокрема,
при альтернативній гіпотезі
статистика
,
число ступенів свободи
,
,
критична область
.
При
альтернативній гіпотезі
,
,
,
,
.
При
альтернативній гіпотезі
гіпотеза
відхиляється, якщо виконується одна з
нерівностей:
або
.
Зокрема
для прикладу 4.8
,
,
.
За таблицею 8 у додатку
.
Оскільки,
,
то гіпотеза
приймається.
4.4.4. Критерій серій
Даний
критерій застосовується для перевірки
гіпотези
,
в якій стверджується, що елементи вибірки
одержані випадковим чином і незалежні.
Нехай
– вибірка результатів спостережень, а
медіана, обчислена на основі результатів
спостережень. Кожному елементу вибірки
ставиться у відповідність знак „+” або
„-” в залежності від того, чи його
значення більше або менше за медіану
(нульові значення різниць не враховуються).
Таким чином, всій вибірці поставлено у
відповідність певний набір знаків.
Позначимо через
число знаків „+”, а
– число знаків „-” в одержаному наборі.
Серією в цьому наборі називається будь
– яка послідовність, яка складається
з однакових знаків і обмежена протилежними
знаками, або знаходиться на початку чи
в кінці набору.
Наприклад,
в наборі: +,-,+,+,+,-,-,-,-,-,+,+ міститься 5 серій,
а
,
.
Статистикою
критерію серій є число серій N.
Критична область
.
Значення
і
задаються таблицею 13 у додатку.
При
великих об’ємах вибірки, коли або
,
або
, або обидва значення
і
більші 20 для перевірки гіпотези
можна використати статистику
,
точкова оцінка якої
обчислюється за формулою
.
При
умові, що вірна гіпотеза
,
статистика
має приблизно нормальний розподіл
N(0,1).
В цьому випадку критична область
,
де
знаходять за таблицею 2а у додатку.
Приклад 4.9 Розподіл середньомісячної зарплати в 1999р. по регіонах України представляється у вигляді ряду:168, 129, 118, 209, 220, 134, 130, 215, 140, 191, 137, 184, 152, 169, 183, 173, 135, 150, 112, 184, 143, 127, 146, 123, 141, 303, 187. Чи можна для рівня значущості вважати отримані результати випадковими?
Розв’язок. Знайдемо оцінку медіани отриманих результатів. Для цього представимо їх у виді рангованого ряду:
112,118,123,127,129,130,134,135,137,140,141,143,146,150,152,168,169,173,183,184,187,191,209,215,202,303.
Для нього Me=150, а відповідна послідовність знаків:
+,
-, -, +, +, -, -, +, -, +, -, +, +, +, +, +, -, -, +, -, -, -, -, -,
+, +, де
,
,
число серій N=13.
За таблицею 13 додатку при
знаходимо
,
.Таким чином, гіпотеза
приймається. Отримані результати можна
вважати випадковими.
