- •Серія: теорія ймовірностей та математична статистика Перевірка статистичних гіпотез
- •Рекомендовано до друку кафедрою теоретичної та прикладної статистики Протокол № від .
- •4.1. Означення статистичної гіпотези. Приклади
- •4.2. Критерії узгодження
- •4.3. Перевірка гіпотез про розподіл за допомогою критерію
- •Критерій
- •Нормальний розподіл
- •Рівномірний розподіл
- •Показниковий розподіл
- •Розподіл Пуассона
- •Біноміальний розподіл
- •Перевірка гіпотези про незалежність двох випадкових величин
- •Непараметричні критерії перевірки гіпотез
- •4.4.1. Основні поняття
- •4.4.2. Гіпотеза про однорідність вибірки
- •4.4.3. Критерій знаків
- •4.4.4. Критерій серій
- •4.4.5. Перевірка гіпотези про однорідність двох вибірок. Критерій Вілкоксона
- •4.4.6. Двовибірковий критерій м.В.Смірнова
- •4.4.7. Критерій Колмогорова
- •4.5. Параметричні гіпотези
- •4.5.1. Гіпотеза про рівність математичних сподівань двох нормально розподілених ознак генеральної сукупності
- •4.5.2. Гіпотеза про рівність дисперсій двох нормально розподілених ознак генеральної сукупності
- •Розглянемо випадкову величину
- •4.5.3. Гіпотеза про рівність математичного сподівання нормально розподіленої ознаки генеральної сукупності гіпотетичному значенню
- •4.5.4. Гіпотеза про рівність дисперсії нормально розподіленої ознаки генеральної сукупності гіпотетичному значенню
- •4.5.5. Гіпотеза про рівність декількох дисперсій нормально розподілених ознак генеральної сукупності за вибірками однакового об'єму
- •4.5.6. Гіпотеза про рівність математичних сподівань двох нормально розподілених ознак і генеральної сукупності з невідомими дисперсіями (залежні вибірки)
- •4.5.7. Гіпотеза про рівність невідомої ймовірності р гіпотетичній ймовірності
- •4.5.8. Гіпотеза про рівність двох ймовірностей біноміальних розподілів
- •4.6. Застосування ппп
- •Гіпотетична середня різниця
- •Вихідний діапазон
- •Додаток
- •Значення функції Лапласа .
- •Значення для t-розподілу Стьюдента
- •Критичні значення для виявлення промахів
- •Критерій знаків
- •Критерій серій
- •Критерій Вілкоксона
- •Література
4.5. Параметричні гіпотези
4.5.1. Гіпотеза про рівність математичних сподівань двох нормально розподілених ознак генеральної сукупності
Нехай
в генеральній сукупності досліджуються
дві нормально розподілені випадкові
величини (ознаки)
і
з параметрами (a,
)
і (a,
),
відповідно. З цією метою проведено дві
незалежні вибірки (x1,
x2,
...,
)
i
(y1,
y2,
...,
)
з об’ємами n1
і
n2.
Необхідно перевірити таку параметричну гіпотезу:
H0:a=a. (4.21)
Розглянемо два випадки:
а) i – відомі.
Враховуючи,
що значення математичних сподівань a
i
a
випадкових величин
i
– невідомі, то для перевірки гіпотези
(4.21) використовують їх точкові оцінки
відповідно. Відомо [6], що, у випадку
нормально розподілених
i
,
вибіркові середні
мають нормальний закон розподілу з
параметрами
i
.
Оскільки вибірки незалежні, то випадкові
величини
також незалежні.
З
цього факту випливає, що випадкова
величина (
)
також є нормально розподіленою. Дійсно,
використовуючи властивості математичного
сподівання, дисперсії та їх точкових
оцінок з врахуванням змісту гіпотези
(4.21), будемо мати:
Отже,
випадкова величина (
)
нормально розподілена з параметрами
.
Це дає змогу зробити висновок, що оскільки
випадкова величина
,
(4.22)
як неважко показати, є нормально розподіленою з параметрами (0,1), то вона може бути вибрана за міру різниці між математичними сподіваннями a i a.
При
альтернативній гіпотезі
для заданого рівня значущості
критичну область
можна знайти з рівняння:
.
(4.23)
А
оскільки
,
то враховуючи те, що
– нормально розподілена випадкова
величина, отримаємо, що рівняння (4.23)
запишеться у вигляді:
,
(4.24)
де
– функція Лапласа.
Розв’язуючи
рівняння (4.24), для заданого
за таблицею 2 у додатку для функції
Лапласа отримаємо, що межа (критична
точка) критичної області знаходиться
в точці
.
При
альтернативних гіпотезах: Н1:
;
Н1:
,
де
–
розв’язок рівняння
.
Нехай
– точкова оцінка випадкової величини
,
яка обчислюється на основі вибірок
і
за формулою (4.22). Тоді, якщо
,
то гіпотеза відхиляється, а в протилежному
випадку – приймається.
Приклад
4.13.
В результаті проведення двох вибірок
об’ємами n1=40
і n2=50
при дослідженні деякої ознаки в
генеральній сукупності отримані такі
середні значення:
і
.
Зробивши припущення про те, що дана
ознака в генеральній сукупності нормально
розподілена, необхідно перевірити
гіпотезу H0:
a=a,
якщо відомо, що ==0,3
i
=0,01.
Розв’язок.
За формулою (4.22), виходячи з умови задачі,
знайдемо, що:
Розв’язавши рівняння (4.21), із таблиці 2 у додатку для функції Лапласа отримаємо значення межі критичної області t0,01 = 2,58.
Оскільки
>t0,01,
то, згідно із вищенаведеним критерієм,
дану гіпотезу треба відхилити.
б) i – невідомі.
Необхідно підкреслити, що побудувати критерій узгодження для гіпотези H0 (4.21) в загальному у даному випадку не вдається. Це складає, так звану, проблему Беренса -Фішера. Тому розглянемо лише частковий випадок, а саме: будемо вважати, що 2=2=2, оскільки при виконанні цієї умови можна знайти випадкову величину , як міру відхилення між математичними сподіваннями a i a.
Дійсно,
можна показати, аналогічно як і в
попередньому випадку, що якщо
i
- нормально розподілені випадкові
величини, то випадкова величина (
)
також має нормальний розподіл з
параметрами
.
У математичній статистиці, наприклад,
в [6], доведено, що, якщо за точкову оцінку
дисперсії
вибрати наступну зміщену (це неважко
показати) точкову оцінку:
,
(4.25)
де
i
- виправлені вибіркові дисперсії
випадкових величин
i
,
а випадкова величина (
)
є нормально розподіленою, то випадкова
величина
(4.26)
має
t
- розподіл Стьюдента з
числом ступенів свободи. Саме це дає
змогу знайти критичну область виду
,
де
- рівень значущості.
Згідно з (4.2), рівняння для отримання межі (критичної точки) критичної області, виходячи з (4.26), буде мати вигляд:
.
(4.27)
Розв’язуючи
рівняння (4.27), для заданого рівня
значущості
і числа ступенів свободи
за таблицею 4 для t-розподілу
Стьюдента дістанемо, що межа критичної
області знаходиться в точці
.
А це дозволяє сформулювати шуканий критерій узгодження таким чином.
Нехай
– точкова оцінка випадкової величини
,
яка обчислена на основі вибірок (x1,
x2,
...,
)
і (y1,
y2,
...,
)
за формулою (4.26). Тоді:
1.
Якщо
,
то гіпотеза H0
відхиляється;
2.
Якщо ж
,
то гіпотеза H0
приймається.
Зауваження 4.9. При перевірці гіпотези (4.18) для заданого рівня значущості контролюється лише помилка першого роду. Задача про перевірку гіпотези про рівність математичних сподівань випадкових величин (ознак) і в генеральній сукупності має велике прикладне значення. Зокрема, у промисловості та торгівлі задача порівняння середніх часто виникає при вибірковому контролю якості виробів. Критерій узгодження, який сформульований у випадку б) можна застосувати до задачі про виключення грубих помилок при проведенні вибіркових спостережень.
