Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Частина 4 практикум.pdf
Скачиваний:
79
Добавлен:
20.02.2016
Размер:
1.14 Mб
Скачать

3.10.2. СТАТИСТИЧНИЙ КРИТЕРІЙ ПЕРЕВІРКИ НУЛЬОВОЇ ГІПОТЕЗИ

Для перевірки нульової гіпотези використовують спеціально підібрану випадкову величину, точний або наближений розподіл якої відомий. Цю величину позначають черезU або Z , якщо вона розподілена

нормально, або v2 – за законом Фішера-Снедекора, T – за законом Стьюдента, c2 – за законом “хі-квадрат” і т.д. Із метою узагальнення позначимо цю величину K.

Статистичним критерієм (або просто критерієм) називають випадкову величину K , яка служить для перевірки нульової гіпотези H0.

Емпіричним значенням критерію гіпотези називають значення випадкової величини K, обчислене на підставі даних певної вибірки. Позначають емпіричне значення Kемп .

Виявляється, що за одних значень Kемп гіпотеза H0 приймається, а за інших – відхиляється.

Критичною областю називається сукупність значень критерію K, за яких нульова гіпотеза H 0 відхиляється.

Областю прийняття гіпотези H 0 називається сукупність значень критерію K, за яких нульову гіпотезу H 0 приймають.

Таким чином, сформулюємо основний принцип перевірки статистичних гіпотез:

·якщо емпіричне значення критерію Kемп належить критичній області, то нульову гіпотезу H 0 відхиляють;

·якщо емпіричне значення критерію Kемп належить області прийняття гіпотези H0 , то нульову гіпотезу H 0 приймають.

Увипадку одновимірності випадкової величини K критична область, як правило, є множиною точок певних інтервалів на прямій, які відокремлені від області прийняття гіпотези так званими критичними

точками kкр .

Критичними точками (межами) kкр називають точки, що відо-

кремлюють критичну область від області прийняття гіпотези.

Тобто для знаходження критичної області достатньо визначити критичні точки.

Розглядають три види критичних областейзалежно від конкуруючої гіпотези:

·правостороння критична область – це та область на числовій пря-

мій, що визначається нерівністю K > kкр ;

ДВНЗ “Українська академія банківської справи НБУ”

135

· лівостороння критична область – це та область на числовій пря-

мій, що визначається нерівністю K < kкр ;

·двостороння критична область – це та область на числовій прямій, що визначається нерівністю K > kкр (у припущенні, що kкр > 0).

Для знаходження критичної області задаються рівнем значущо-

сті a і шукають критичні точки kкр із таких співвідношень:

·

для правосторонньої критичної області:

 

 

P { K > kкр } = a;

(kкр

> 0);

·

для лівосторонньої критичної області:

 

 

P { K < kкр } = a;

(kкр

< 0);

· для двосторонньої симетричної критичної області:

P { K > kкр } = a / 2;

(kкр > 0).

Цілком зрозуміло, що для певної гіпотези можна побудувати багато різних критеріїв її перевірки, за кожним із них можемо одержувати різні результати щодо прийняття нульової гіпотези H 0 на підставі тієї самої вибірки.

Ми будували критичну область, виходячи з вимоги, щоб імовірність попадання в неї критерію дорівнювалаa за умови, що саме нульова гіпотеза справедлива. Трапляється, що доцільно ввести в розглядання ймовірність попадання критерію в критичну область за іншої умови, а саме – за умови, що нульова гіпотеза неправильна, а значить істинна – конкуруюча. Для визначення цього критерію вводиться характеристика, яка має назву потужності критерію.

Потужністю критерію називають імовірність потрапляння критерію у критичну область за умови, що конкуруюча гіпотеза H1 є істинною.

Іншими словами, потужність критерію визначається як імовірність не допустити помилку другого роду при обраному критерію.

Питання для самоконтролю

1.Яку гіпотезу називають статистичною?

2.Які типи статистичних гіпотез є основними?

3.Яку гіпотезу називають основною(нульовою), а яку альтернативною (конкуруючою)?

4.Яку параметричну гіпотезу називають простою, складеною?

5.Що називають помилкою першого, другого роду?

6.Що називають рівнем значущості?

ДВНЗ “Українська академія банківської справи НБУ”

136

7.Яку інформацію називають гіпотетичною, а яку емпіричною?

8.Що називають статистичним критерієм?

9.Що називають емпіричним значенням критерію?

10.Що називається критичною областю, областю прийняття гіпотези, критичними точками?

11.Як знайти критичну область?

12.Які види критичних областей розрізняють залежно від конкуруючої гіпотези?

13.Що називають потужністю критерію?

3.10.3. ПЕРЕВІРКА ГІПОТЕЗИ ПРО ЗАКОН РОЗПОДІЛУ. КРИТЕРІЙ ЗГОДИ ПІРСОНА

Критерієм згоди називають статистичний критерій перевірки гіпотези про закон розподілу ймовірностей випадкової величини(ознаки генеральної сукупності).

Є декілька критеріїв згоди: критерій Пірсона, критерій Колмогорова та інші.

Розглянемо критерій згоди Пірсона (критерій c 2 ), який ґрунтується на порівнянні емпіричних і теоретичних частот.

Припустимо, що висунуто гіпотезу H0: випадкова величина X роз-

поділена за законом A.

обсягу n , знаходять

 

 

 

 

 

Здійснивши

вибірку

і

записують у вигляді

таблиці 3.12 інтервальний статистичний розподіл частот:

 

 

 

 

 

 

 

 

 

 

Таблиця 3.12

 

 

 

 

 

 

 

 

 

 

[ai -1; ai )

 

[a0 ; a1)

 

[a1; a2 )

 

 

[am-1; am )

 

 

 

 

 

 

 

 

 

 

 

 

ni

 

n1

 

n2

 

 

nm

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

 

å n i = n.

 

 

 

 

 

 

 

 

 

i =1

 

 

 

 

 

Оскільки перевіряється гіпотеза про те, що розподіл ознаки X

ге-

неральної сукупності описується певною функцією розподілуF (x)

або

(що еквівалентно) щільністю розподілу f (x). Тоді для кожного інтер-

валу [ai-1;ai ) можна визначити теоретичні ймовірності pi попадання

значень випадкової величини X у цей інтервал, а отже, і теоретичні частоти ni¢ = n × pi .

ДВНЗ “Українська академія банківської справи НБУ”

137

Для обчислення ймовірностей pi використовують формули:

 

 

 

 

 

 

 

ai

 

 

 

 

 

 

pi = P{ai-1 < X < ai }= F (ai ) - F (ai-1 ) = ò f (x) dx,

i =

 

.

(3.42)

 

1, m

 

 

 

 

 

 

 

ai-1

 

 

 

 

 

 

Зазначимо, що для обчислення ймовірностей p1

і pm у форму-

 

 

 

 

 

 

 

 

 

 

 

 

m

 

 

лах (3.42) покладають, відповідно, a0 = і am = +¥. Тоді å pi

=1.

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

Отримані результати обчислень зручно записати у вигляді таб-

лиці 3.13:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблиця 3.13

 

 

 

 

 

 

 

 

 

 

 

 

 

 

[ai -1; ai )

 

[a0 ; a1 )

 

[a1; a2 )

 

 

 

 

 

[am -1; am )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ni

 

n1

 

n2

 

 

 

 

 

 

nm

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

pi

 

p1

 

p2

 

 

 

 

 

 

pm

 

 

¢

 

¢

 

¢

 

 

 

 

 

¢

 

 

ni

 

n1

 

n2

 

 

 

 

 

 

nk

 

 

Згідно з критерієм Пірсона для перевірки гіпотезиH 0 вводиться

випадкова величина (статистика) K:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

- ni¢)

2

 

 

 

 

 

 

 

 

 

 

K = c 2 = å

(ni

 

,

 

 

 

 

 

 

 

 

 

 

ni¢

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

де m

– кількість груп у статистичному розподілі вибірки;

 

 

ni

– емпірична частота ознаки X в i -й групі;

 

 

 

 

 

 

ni¢ = npi

– теоретична частота;

 

 

 

 

 

 

 

 

 

 

pi

– ймовірність того, що значення X належить i -й групі.

Відомо, що при n ® ¥ закон розподілу статистики K прямує до закону розподілу c 2 з k = m - r -1 ступенями вільності, де m – кількість груп у статистичному розподілі вибірки; r – кількість параметрів

гіпотетичного розподілу A. Наприклад,

r = 2 – для нормального роз-

поділу, r =1 – для розподілу Пуассона,

r = 0 – для рівномірного роз-

поділу.

 

 

 

Для критеріюc 2 будують

правосторонню

критичну область за

правилом:

 

 

 

P { c 2

> cкр2 } = a.

(3.43)

ДВНЗ “Українська академія банківської справи НБУ”

138