- •Серія: теорія ймовірностей та математична статистика Перевірка статистичних гіпотез
- •Рекомендовано до друку кафедрою теоретичної та прикладної статистики Протокол № від .
- •4.1. Означення статистичної гіпотези. Приклади
- •4.2. Критерії узгодження
- •4.3. Перевірка гіпотез про розподіл за допомогою критерію
- •Критерій
- •Нормальний розподіл
- •Рівномірний розподіл
- •Показниковий розподіл
- •Розподіл Пуассона
- •Біноміальний розподіл
- •Перевірка гіпотези про незалежність двох випадкових величин
- •Непараметричні критерії перевірки гіпотез
- •4.4.1. Основні поняття
- •4.4.2. Гіпотеза про однорідність вибірки
- •4.4.3. Критерій знаків
- •4.4.4. Критерій серій
- •4.4.5. Перевірка гіпотези про однорідність двох вибірок. Критерій Вілкоксона
- •4.4.6. Двовибірковий критерій м.В.Смірнова
- •4.4.7. Критерій Колмогорова
- •4.5. Параметричні гіпотези
- •4.5.1. Гіпотеза про рівність математичних сподівань двох нормально розподілених ознак генеральної сукупності
- •4.5.2. Гіпотеза про рівність дисперсій двох нормально розподілених ознак генеральної сукупності
- •Розглянемо випадкову величину
- •4.5.3. Гіпотеза про рівність математичного сподівання нормально розподіленої ознаки генеральної сукупності гіпотетичному значенню
- •4.5.4. Гіпотеза про рівність дисперсії нормально розподіленої ознаки генеральної сукупності гіпотетичному значенню
- •4.5.5. Гіпотеза про рівність декількох дисперсій нормально розподілених ознак генеральної сукупності за вибірками однакового об'єму
- •4.5.6. Гіпотеза про рівність математичних сподівань двох нормально розподілених ознак і генеральної сукупності з невідомими дисперсіями (залежні вибірки)
- •4.5.7. Гіпотеза про рівність невідомої ймовірності р гіпотетичній ймовірності
- •4.5.8. Гіпотеза про рівність двох ймовірностей біноміальних розподілів
- •4.6. Застосування ппп
- •Гіпотетична середня різниця
- •Вихідний діапазон
- •Додаток
- •Значення функції Лапласа .
- •Значення для t-розподілу Стьюдента
- •Критичні значення для виявлення промахів
- •Критерій знаків
- •Критерій серій
- •Критерій Вілкоксона
- •Література
Перевірка гіпотези про незалежність двох випадкових величин
Нехай проведено n експериментів, результати яких є значеннями дискретних випадкових величин і , які приймають відповідно значення x1, x2, …, xm і y1, y2, …,yl.
Позначимо через
kij число експериментів, в
яких
і
,
.
Якщо
і
- неперервні випадкові величини, то
область значень кожної з них розбивається
на скінченне число інтервалів. В цьому
випадку
- число експериментів, в яких випадкова
величина
попала в i – ий інтервал, а випадкова
величина
в j – ий інтервал. Результати n
експериментів можна представити у
таблиці спряженості ознак розміру m*l
(Таблиця 4.3)
Таблиця 4.3.
|
y1 |
y2 |
… |
yl |
|
x1 |
k11 |
k12 |
… |
k1l |
k1. |
x2 |
k21 |
k22 |
… |
k2l |
k2. |
… |
… |
… |
… |
… |
… |
xm |
km1 |
km2 |
|
kml |
km. |
|
k.1 |
k.2 |
… |
k.l |
k..=n |
Перевіряється
нульова гіпотеза H0, яка
стверджує, що випадкові величини
і
незалежні. Якщо гіпотеза H0
вірна, то за означенням
.
Нехай
і
- оцінки ймовірностей
і
.
Якщо гіпотеза H0 вірна, то
теоретичні частоти
.
Для перевірки гіпотези H0 за допомогою критерію використовують статистику
,
(4.13)
яка при справедливості гіпотези
H0 і для
має розподіл
з (m-1)(l-1) ступенями свободи.
Нехай
точкова оцінка випадкової величини
.
Тоді для заданого рівня значущості
критична область
,
де
знаходять за таблицею 5 у додатку.
Для зручності обчислень, формулу (4.13) можна переписати у виді
.
(4.14)
Якщо теоретичні частоти
для деяких кліток таблиці 4.3 не
задовольняють умову
,
то відповідні рядки і стовпці повинні
бути об’єднані з сусідніми рядками і
стовпцями.
Якщо
і
,
то мінімально допустиме значення
теоретичних частот може бути рівним
одиниці.
Випадкові величини і можна розглядати як дві ознаки, за якими класифікується вибірка об’єму n; незалежність і відповідає незалежності цих ознак.
В багатьох випадках потрібно перевірити гіпотезу про однорідність декількох вибірок, або, іншими словами, гіпотезу про те, що ці вибірки одержані з одної генеральної сукупності. Якщо перевіряється однорідність m різних вибірок з об’ємами n1, n2, …,nm і вони можуть бути записані у виді таблиці 4.3, то можна використовувати той же критерій, що і для перевірки незалежності двох ознак.
Приклад 4.6. Проводився
аналіз результатів (в балах) вступних
випробувань з математики і української
мови на трьох спеціальностях (результати
розбили на дві групи: (>60;
)
і отримали наступний розподіл:
Бали |
|
Всього |
||
1 |
2 |
3 |
||
>60 |
38 |
48 |
38 |
124 |
|
10 |
5 |
4 |
19 |
Всього |
48 |
53 |
42 |
143 |
Чи можна вважати, що для рівня
значущості
результати вступних випробувань залежать
від вибраної спеціальності.
Розв’язок. За формулою (4.14) знаходимо:
число ступенів свободи
k=(2-1)(3-1)=2. За таблицею 5 додатку
.
Оскільки 3,575<4,6, то результати вступних
випробувань не залежать від вибраної
спеціальності.
Зауважимо, що твердження про те, що результати випробувань не залежать від вибраної спеціальності можна трактувати як перевірку гіпотези про однорідність трьох вибірок об’ємами 48, 53, 42.
