- •Серія: теорія ймовірностей та математична статистика Перевірка статистичних гіпотез
- •Рекомендовано до друку кафедрою теоретичної та прикладної статистики Протокол № від .
- •4.1. Означення статистичної гіпотези. Приклади
- •4.2. Критерії узгодження
- •4.3. Перевірка гіпотез про розподіл за допомогою критерію
- •Критерій
- •Нормальний розподіл
- •Рівномірний розподіл
- •Показниковий розподіл
- •Розподіл Пуассона
- •Біноміальний розподіл
- •Перевірка гіпотези про незалежність двох випадкових величин
- •Непараметричні критерії перевірки гіпотез
- •4.4.1. Основні поняття
- •4.4.2. Гіпотеза про однорідність вибірки
- •4.4.3. Критерій знаків
- •4.4.4. Критерій серій
- •4.4.5. Перевірка гіпотези про однорідність двох вибірок. Критерій Вілкоксона
- •4.4.6. Двовибірковий критерій м.В.Смірнова
- •4.4.7. Критерій Колмогорова
- •4.5. Параметричні гіпотези
- •4.5.1. Гіпотеза про рівність математичних сподівань двох нормально розподілених ознак генеральної сукупності
- •4.5.2. Гіпотеза про рівність дисперсій двох нормально розподілених ознак генеральної сукупності
- •Розглянемо випадкову величину
- •4.5.3. Гіпотеза про рівність математичного сподівання нормально розподіленої ознаки генеральної сукупності гіпотетичному значенню
- •4.5.4. Гіпотеза про рівність дисперсії нормально розподіленої ознаки генеральної сукупності гіпотетичному значенню
- •4.5.5. Гіпотеза про рівність декількох дисперсій нормально розподілених ознак генеральної сукупності за вибірками однакового об'єму
- •4.5.6. Гіпотеза про рівність математичних сподівань двох нормально розподілених ознак і генеральної сукупності з невідомими дисперсіями (залежні вибірки)
- •4.5.7. Гіпотеза про рівність невідомої ймовірності р гіпотетичній ймовірності
- •4.5.8. Гіпотеза про рівність двох ймовірностей біноміальних розподілів
- •4.6. Застосування ппп
- •Гіпотетична середня різниця
- •Вихідний діапазон
- •Додаток
- •Значення функції Лапласа .
- •Значення для t-розподілу Стьюдента
- •Критичні значення для виявлення промахів
- •Критерій знаків
- •Критерій серій
- •Критерій Вілкоксона
- •Література
4.2. Критерії узгодження
Нехай при статистичному дослідженні даної випадкової величини (ознаки) в генеральній сукупності провели вибірку (x1, x2, ..., xn) і, виходячи з результатів попередньої вибірки або з інших міркувань, прийняли гіпотезу H0 про одну з її характеристик (про розподіл або про його параметри). Необхідно на основі вибірки (x1, x2, ..., xn) знайти правило, з допомогою якого можна вирішувати питання про відповідність гіпотези H0 отриманим статистичним даним.
Означення 4.2. Правило, за яким приймається рішення прийняти або відхилити гіпотезу H0, називається критерієм узгодження.
Розглянемо принцип побудови критерію узгодження в загальному випадку.
Найважливішою при вирішенні даної задачі є проблема знаходження для вибірки (1, 2, ..., n) випадкової величини (статистики) =(1, 2, ..., n), котра виражала б міру відхилення теоретичних (отриманих на основі прийняття гіпотези) даних від емпіричних, які отримані на основі вибірки.
Допустимо, що таку випадкову величину (статистику) =(1, 2, ..., n) знайдено, а область W - множина можливих значень даної випадкової величини. Далі фіксується деяка мала ймовірність (<0,1), яка називається рівнем значущості, а область W визначається умовою:
P(W) . (4.2)
Іншими словами, W представляє собою таку область, що ймовірність попадання випадкової величини в W не більша від рівня значущості . Область W називається критичною областю. Її знаходять для заданого , знаючи випадкову величину , з умови (4.2). Як правило, в практичних застосуваннях критична область W представляє собою інтервал виду W=( >t). Область W\W називають областю прийняття гіпотези H0.
Точка t , яка відділяє критичну область W від області прийняття гіпотези W\W , називається критичною точкою.
Як правило, в практичних застосуваннях розглядають два типи критичних областей W: а) одностороння (лівостороння або правостороння); б) двостороння.
Лівосторонньою називають критичну область W=( <t), t<0, причому критична точка t визначається з умови P( <t)= .
Правосторонньою називають критичну область W=( >t), t>0, причому критична точка t визначається з умови P( >t)= .
Двосторонньою
називають критичну область W=(
<t
,
>t
),
t
>t
,
причому критичні точки t
,
t
визначаються
з умови
P(
<t
)+P(
>t
)=
.
Зокрема,
якщо t
і t
симетричні відносно нуля, то W=(
>t),
t>0,
причому t
визначається
з умови
P(
<-t)=P(
>t)=
.
Якщо рівень значущості визначає “розмір” критичної області W, то положення критичної області на множині значень статистики залежить від формулювання альтернативної гіпотези Н1.
Наприклад,
якщо перевіряється гіпотеза H0:
,
а альтернативна гіпотеза Н1:
,
то критична область розміщується на
правому (лівому) “хвості” розподілу
статистики ,
тобто є правосторонньою (лівосторонньою)
критичною областю.
Якщо
альтернативна гіпотеза Н1:
,
то критична область розміщується на
обох “хвостах” розподілу статистики
,
тобто є двосторонньою.
Таким чином, шуканий критерій узгодження формулюється так:
Якщо точкова оцінка
,
обчислена на основі вибірки
,
попадає в критичну область W(
W),
то гіпотезу H0
відхиляють.Якщо ж значення попадає в область прийняття гіпотези W\W(
W\W),
то гіпотезу H0
приймають.
Отже, для перевірки статистичної гіпотези на практиці необхідно:
Для висунутої у задачі гіпотези H0 і на основі вибірки
знайти випадкову величину (статистику)
=(1,
2,
..., n).З умови (4.2) для заданого рівня значущості визначити критичну область W.
Для даної вибірки
отримати точкову оцінку
.На основі сформульованого вище критерію узгодження прийняти рішення.
Зауваження 4.1. Рішення, яке приймається на основі критерію узгодження, може бути помилковим. Нехай точкова оцінка попадає в критичну область W і гіпотеза H0 відхиляється у відповідності з критерієм. Якщо ж гіпотеза H0 все-таки вірна, то прийняте рішення помилкове. Помилка, яка здійснюється при відхиленні правильної гіпотези H0, називається помилкою першого роду. Ймовірність помилки першого роду дорівнює ймовірності попадання випадкової величини в критичну область W при умові, що справедлива гіпотеза H0, тобто дорівнює рівню значущості . Помилка другого роду наступає в тому випадку, якщо гіпотеза H0 приймається, але, насправді, вона невірна. Простіше можна сказати, що при великій кількості вибірок частка помилкових рішень дорівнює , якщо гіпотеза H0 вірна, і , якщо вона невірна. На практиці при проведенні конкретних досліджень необхідно контролювати величини обох помилок як , так і . З цією метою розглядають альтернативну гіпотезу H1. Тоді рівняння, які визначають величини помилок першого і другого роду, запишуться у виді:
P(W|H0)=, (4.3)
P(W\W|H0)=, (4.4)
відповідно. Ймовірності в лівих частинах рівнянь розуміють як умовні ймовірності. Як доводиться у математичній статистиці, при заданому об’ємі вибірки відповідний вибір критичної області W дозволяє зробити як завгодно малою або помилку , або помилку .
Величину 1- називають надійністю критерію. Надійність критерію є ймовірністю того, що нульова гіпотеза буде прийнятою, якщо хибна альтернативна.
Величину 1- називають потужністю критерію. Потужність критерію є ймовірністю того, що нульова гіпотеза буде відкинута, якщо вірна альтернативна.
Очевидно, що на множині W значень статистики критерію можна вибирати як завгодно багато критичних областей W для заданого рівня значущості , проте відповідні їм критерії будуть мати, взагалі кажучи, різні ймовірності помилок другого роду.
Найкращою критичною областю (НКО) називають критичну область, яка для заданого рівня значущості , забезпечує мінімальну ймовірність помилки другого роду.
Перевірка
статистичних гіпотез з використанням
критеріїв значущості може бути проведена
на основі довірчих інтервалів. Так для
всіх параметричних гіпотез область
прийняття гіпотези Н0:
для рівня значущості
співпадає
з довірчим інтервалом для параметра
при довірчій ймовірності 1-.
При цьому односторонньому критерію
значущості відповідає односторонній
довірчий інтервал, а двосторонньому –
двосторонній довірчий інтервал. Гіпотеза
Н0
приймається,
якщо значення
покривається відповідним довірчим
інтервалом; в іншому випадку гіпотеза
Н0
відхиляється.
Якщо
перевіряється гіпотеза Н0:
і довірчий інтервал для різниці параметрів
накриває нульове значення, то гіпотеза
приймається. Виключення становить
перевірка гіпотези про рівність
дисперсій, оскільки довірчий інтервал
будується для відношення дисперсій. В
цьому випадку гіпотеза Н0
приймається,
якщо довірчий інтервал накриває значення
рівне 1.
Перейдемо до розгляду методики перевірки конкретних гіпотез.
