Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Met_MatStat2311.doc
Скачиваний:
9
Добавлен:
02.11.2018
Размер:
1.42 Mб
Скачать

Теоретичні відомості Загальна схема перевірки гіпотез

До проблеми перевірки статистичних гіпотез ми неминуче приходимо в таких часто виникаючих задачах, як порівняльна оцінка різних технологічних процесів за їх продуктивністю та економічністю або порівняння конструктивних особливостей машин, приладів і т.п. Аналогічні задачі характерні для багатьох областей науки та техніки. І хоч критерії перевірки гіпотез досить різноманітні, їх об’єднує загальна логічна схема:

  1. Формулюється нульова Н0 і альтернативна Н1 гіпотези.

  2. Вибирається так званий рівень значущості .

  3. Вибирається відповідна гіпотезі статистика критерію Тn.

  4. Знаходиться розподіл статистики Тn при гіпотезі Н0.

  5. Визначається критична область Y1 та допустима область Y1.

  6. За вибіркою x1, x2, …, xn обчислюється експериментальне значення статистики Тn.

  7. Приймається рішення про гіпотезу Н0. Якщо експериментальне значення статистики Тn потрапляє в критичну область, то гіпотезу Н0 відкидаємо; в противному випадку говоримо, що вибірка не дає підстави відкинути гіпотезу.

Дамо необхідні пояснення до цієї схеми.

Під статистичними гіпотезами розуміють різного роду припущення про закони теоретичного розподілу. Нульовою (основною) називають висунуту гіпотезу і позначають її символом Н0. Конкуруючою (альтернативною) називають гіпотезу Н1, яка суперечить Н0.

Статистикою критерію Тn= Тn(x1, x2, …, xn) називають функцію вибіркових значень, яка використовується для перевірки гіпотез. Статистика Тn є випадковою величиною, розподіл якої вважається відомим за умови, що нульова гіпотеза Н0 справедлива.

Основна ідея перевірки статистичних гіпотез

Множину Y всіх значень, які може приймати випадкова величина Тn, розіб’ємо на дві неперетинаючихся підмножини Y0 та Y1 (Y = Y0  Y1) так, щоб імовірність попадання значення статистики Тn у множину Y1 за умови справедливості гіпотези Н0 була достатньо малою. Якщо виявилося, що Тn(x) = Тn(x1, x2, …, xn)  Y1, то в припущенні справедливості гіпотези Н0 трапилась малоімовірна подія, і ця гіпотеза повинна бути відкинутою як така, що протирічить статистичним даним. У протилежному випадку (тобто якщо Тn(x)  Y0 ) немає причин не прийняти гіпотезу Н0, і слід вважати, що спостереження не виявляють протиріч з Н0.

Найчастіше імовірність попадання у множину Y1 вибирається рівною або не вищою ніж 0,01 або 0,05 або 0,1. Таку імовірність називають рівнем значущості (); множину Y1 – критичною областю; Y0 – областю прийняття гіпотези, а правило перевірки – критерієм згоди.

Якщо Тn – неперервна випадкова величина, то критична область Y1 задовольняє рівності:

P{ Тn  Y1 | Н0} =  (7.1)

де вираз у лівій частині позначає імовірність прийняття статистикою Тn значення у множині Y1 за умови справедливості гіпотези Н0.

Зауважимо, що на практиці замість рівності (7.1) часто використовується нерівність (≤) або наближена рівність.

Доцільний вибір критичної області, окрім співвідношення (7.1), може залежати ще й від альтернативної гіпотези Н1. Найчастіше за критичну область Y1 вибирають множину:

(правосторонній критерій)

(лівосторонній критерій)

(двосторонній критерій)

де - квантиль рівня  умовного розподілу статистики Тn (умовного в припущенні справедливості Н0). Точки, які розділяють множини Y0 та Y1, називають критичними точками.

В результаті перевірки статистичних гіпотез можуть бути зроблені помилки двох типів. Помилка першого роду полягає в тому, що буде відкинута вірна гіпотеза Н0. Її імовірність  дорівнює Р{ Тn  Y0 | Н0}, якщо виконується (7.1). У випадку, коли замість (7.1) виконується нерівність (≤) або наближена рівність, імовірність помилки 1-го роду може бути відповідним чином оцінена, а не точно визначена. Помилка другого роду виникає тоді, коли ми приймаємо гіпотезу Н0, в той час, коли справедлива альтернативна гіпотеза. Імовірність  помилки другого роду дорівнює Р{ Тn  Y1 | Н1}.

Перевірка гіпотези відносно імовірності

Нехай А – деяка випадкова подія. Маючи результати n незалежних випробувань, в яких подія А спостерігалась m разів, ми хочемо перевірити гіпотезу, що імовірність події А дорівнює заданому числу р0, тобто Н0 = { P(A)=p0 }. На практиці до цієї гіпотези ми приходимо, наприклад, при перевірці відповідності технологічного процесу заданим умовам (наприклад - відсутності систематичної похибки вимірювань).

Нехай гіпотеза Н0 справедлива. Тоді маємо схему Бернуллі:

успіх – подія А відбулась;

невдача – відбулась подія .

Kn – число успіхів в n випробуваннях;

тоді, як відомо з курсу теорії імовірностей: MKn=np0; DKn=np0q0; q0=1-p0.

Користуючись нормальним наближенням біноміального розподілу (теорема Муавра - Лапласа), одержуємо:

(7.2)

( статистика Тn має наближено нормальний розподіл з параметрами 0; 1).

При альтернативній гіпотезі Н1 ={ P(A)p0 } і рівні значущості  критична область буде мати вигляд:

(7.3)

(для нормального розподілу U =-U1-, U - квантиль рівня  -розподілу). Область прийняття гіпотези у0 – це інтервал (, ).

Якщо значення статистики Тn, знайдене за вибірковими даними, належить області Y0, то гіпотеза Н0 приймається, в протилежному випадку, коли Тn Y1, то гіпотеза Н0 відхиляється.

Приклад 1. Нехай потрібно перевірити відсутність систематичної похибки терезів, тобто Н0 = { P(п) = P(н)=p0=1/2 }, де P(н) - імовірність недоважування, P(п) - імовірність переважування.

В досліді проведено 280 зважувань і із них виявилось 151 недоважувань і 129 переважувань.

При справедливості гіпотези Н0 маємо р=1/2; q=1/2 і згідно (7.2) одержимо:

Виберемо рівень значущості =0,05, тоді 1-/2=0,975; U0,975=1,96 – квантиль рівня 0,975 N(0;1)-розподілу. Тоді із рівності (7.3) одержуємо критичну область . Допустима область Y0 = (-1,96, 1,96).

При кількості успіхів (недоважувань) m=151 отримаємо:

.

Таким чином, Т280  Y0 і гіпотеза Н0 приймається (Н0 не суперечить спостереженням).

Зауваження. На практиці наведену вище процедуру перевірки гіпотези відносно імовірностей можна використовувати коли n>=50; np>=10.

Перевірка гіпотези про середнє значення нормального розподілу. Критерій Стьюдента

Нехай x1, x2, …, xn - ряд незалежних спостережень над випадковою величиною , яка має нормальний розподіл N(, ). Параметри  ,  - невідомі. Потрібно перевірити гіпотезу H0= { M=0 }, де 0 – деяке задане число. Такого типу задачі часто виникають на практиці, наприклад тоді, коли потрібно визначити наявність систематичних відхилень від номіналу параметрів виробів деякого технологічного процесу.

На підставі вибірки обчислимо

, (7.3)

Розглянемо статистику

(7.4)

Відомо (див. лаб. роботу № 6), що випадкова величина Tn має розподіл, який називається t - розподілом Стьюдента з (n-1) ступенями волі. Звідси випливає критерій перевірки гіпотези Н0 – критерій Стьюдента. При рівні значущості  вибираємо із таблиць квантилів t-розподілу Стьюдента - квантиль рівня розподілу Стьюдента з (n-1) ступенями волі.

Тоді при альтернативній гіпотезі Н1 ={ M0 } і рівні значущості  критична область відповідно до (7.2) буде мати вигляд:

(7.5)

Допустима область:

.

Якщо статистика Tn в (7.4) при =0 попадає в область Y1, то гіпотезу H0= { M=0 } відхиляємо, якщо Tn  Y0, то кажемо, що гіпотеза H0 не суперечить експериментальним даним.

Приклад 2. Стьюдент у класичній роботі про t – розподіл наводить наступні дані про додаткові години сну 10 пацієнтів, викликані дією снодійних засобів та .

Таблиця 7.1

Пацієнт

X

Y

Різниця X-Y

1

1.9

0.7

1.2

2

0.8

-1.6

2.4

3

1.1

-0.2

1.3

4

0.1

-1.2

1.3

5

-0.1

-0.1

0.0

6

4.4

3.4

1.0

7

5.5

3.7

1.8

8

1.6

0.8

0.8

9

4.6

0.0

4.6

10

3.4

2.0

1.4

Виникає запитання, чи існує істотна різниця між дією снодійних засобів та . Якщо припустити, що різниця ξ між додатковими годинами сну розподілена нормально, то вибірка буде вибіркою об’єму n=10 нормального розподілу N(0, σ) при умові справедливості гіпотези H0= { M=0 }, тобто коли між снодійними засобами X та Y немає різниці. При цій же умові величина має t – розподіл Стьюдента з 9 ступенями волі; , - відповідно середнє значення та вибіркове середнє квадратичне відхилення вибірки .

Обчислення згідно формул (7.3) та (7.4) для вибірки дають: =1.11; =1.58; .

При α=0.05 та 9 ступенях волі tкр= =2.26, тоді . Ясно, що і гіпотезу Н0 відхиляємо, тобто різниця між снодійними засобами та значуща.

Завдання до лабораторної роботи №7

1. Для заданої вибірки x1, x2, …, xn спостережень над випадковою величиною  (див. лаб. роботу №1) перевірити її симетричність відносно середнього значення .

Точніше, гіпотеза полягає в тому, що імовірність прийняття величиною  значення, не більшого від , дорівнює імовірності прийняття нею значення, не меншого від  (таким чином, обидві імовірності дорівнюють 1/2). Скорочений запис:

Нехай: А = {  ≤  };

тоді Н0 = { P(A)=1/2 },

В якості величини  можна взяти значення .

Перевірку гіпотези Н0 провести при рівнях значущості =0,05 та =0,1.

2. Для заданої вибірки x1, x2, …, xn спостережень над нормально розподіленою випадковою величиною  (див. лаб. роботу № 6) перевірити гіпотезу H0= { M=0 } при рівнях значущості =0,05 та =0,1. За величину 0 взяти значення 0 = ( xmin+ xmax )/2.

Контрольні питання до лабораторної роботи №7

  1. Дати пояснення основних понять перевірки статистичних гіпотез: основна гіпотеза, статистика критерія, рівень значущості, критична і допустима області, помилки 1-го і 2-го роду.

  2. Навести загальну схему перевірки гіпотез.

ЛАБОРАТОРНА РОБОТА № 8

Тема : Перевірка статистичних гіпотез - 2. Гіпотеза про нормальність розподілу імовірностей

Мета роботи : Навчитися перевіряти гіпотези про нормальність розподілу випадкової величини

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]