Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Сис. ан. лек+пр.+ін. зав. 2013 2с..doc
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
7.39 Mб
Скачать

4. Перевірка статистичних гіпотез

Під гіпотезою розуміємо твердження про властивості певного явища, яке потребує доведення. Статистична гіпотеза (H) – це твердження про параметри чи розподіл генеральної сукупності, висунуте на основі вибіркових спостережень.

При перевірці статистичної гіпотези необхідно встановити, чи узгоджуються дані спостереження з висунутою гіпотезою, тобто розбіжності між гіпотезою і результатами спостережень вважати випадковими, чи вони викликані впливом певних систематично діючих причин. У результаті такої перевірки гіпотеза або приймається, або відкидається (відхиляється).

Гіпотезу, яку перевіряють, називають нульовою (H0), або основною (робочою), гіпотезою. До нульової гіпотези завжди можна поставити альтернативну (конкуруючу) – Ha. Наприклад, H0: ; Ha: .

Нульовій гіпотезі можна вказати нескінченну кількість альтернативних. Вибір нульової гіпотези має принциповий характер і вимагає обґрунтування.

Оскільки та чи інша гіпотеза перевіряється на основі вибірки обмеженого обсягу, то завжди є певний ризик допустити одну з помилок:

  1. відкинути нульову гіпотезу H0, хоча в дійсності вона вірна (помилка 1–го роду);

  2. прийняти нульову гіпотезу H0, хоча вона не вірна, при вірній конкуруючій (помилка 2–го роду).

Ймовірність допустити помилку 1–го роду (відкинути вірну гіпотезу) отримала назву рівня значимості і позначається . Якщо знижувати рівень значимості гіпотези, то збільшується ризик зробити помилку 2–го роду. Тому помилки першого і другого родів у певному розумінні є конкуруючими.

Рівень значимості гіпотези вибирають стандартним: та ін. Для них складені спеціальні таблиці (див. додатки), за якими знаходять критичне значення ознаки. Порівнюючи його з емпіричним значенням, робимо висновок про прийняття чи відхилення гіпотези.

Встановлений рівень значимості контролює ймовірність допустити помилку 1–го роду. Єдиний шлях одночасного зменшення ймовірності допущення помилок першого та другого родів є збільшення обсягу вибірки.

Спеціальні статистичні критерії дозволяють робити висновок про прийняття нульової гіпотези. Для кожного виду гіпотез розроблені свої критерії, наприклад tкритерії нормального розподілу і розподілу Стьюдента, F–критерій Фішера–Снедекора, (хі – квадрат) – розподіл Пірсона.

Областю допустимих значень (областю прийняття гіпотези H0) називають сукупність значень критерію, при яких нульова гіпотеза приймається. Критична область – область значень критерію, при яких нульова гіпотеза відкидається. Точки, які відділяють область допустимих значень і критичну, називають критичними точками. Тоді стає зрозумілим головний принцип (правило): якщо фактичне значення критерію попадає в критичну область, то гіпотезу H0 відкидають; в іншому випадку нульову гіпотезу приймають.

Для кожного критерію складені спеціальні таблиці, за якими знаходять табличне значення (критичні точки). Знайдене табличне значення порівнюють із фактичним. Якщо фактичне значення критерію, обчислене за вибіркою, більше від табличного, то нульову гіпотезу відкидають. Якщо ж фактичне значення критерію менше або дорівнює табличному, то нульову гіпотезу приймають.

Слід мати на увазі, що узгодження з нульовою гіпотезою ще не доводить її абсолютної справедливості. Це свідчить про необхідність подальшої перевірки за допомогою збільшення обсягу вибірки. Тому краще казати, що спостереження не суперечать нульовій гіпотезі, а отже, не дають основ для її відхилення.

Розрізняють односторонні та двосторонні критичні області. Односторонні розділяють на правосторонні та лівосторонні; вони визначаються відповідно нерівностями , причому , і . Двостороння область визначається нерівностями , де . Інколи двосторонню область записують , де .

Критерій перевірки гіпотези підбирають так, щоб ризик допустити помилку був мінімальний. Важливим є також не допустити помилку другого роду. Ймовірність, яка характеризує чутливість критерію до помилок другого роду, має назву потужності критерію.

Потужність (чутливість) критерію – це ймовірність відхилення нульової гіпотези H0, коли справедлива альтернативна гіпотеза Ha .

Отже, потужність критерію – це ймовірність того, що не буде допущена помилка другого роду. Потужність критерію може бути підвищена двома способами: а) збільшенням рівня значимості, хоча це підвищує небезпеку допустити помилку другого роду; б) збільшенням обсягу вибірки.

Подамо схему перевірки гіпотези, яка передбачає знання закону розподілу генеральної сукупності:

  1. Опис статистичної моделі вибірки.

  2. Висунення нульової і альтернативної гіпотез.

  3. Встановлення рівня значимості, з допомогою якого контролюється допущення помилки першого роду.

  4. Вибір найбільш потужного критерію, який дозволяє контролювати ймовірність появи помилки другого роду.

  5. Розрахунок фактичного значення критерію.

  6. Визначення критичної області і області узгодження з нульовою гіпотезою, тобто встановлення табличного значення критерію.

  7. Зіставлення табличного і фактичного значення критерію і формулювання висновку про прийняття гіпотези.

Вибір конкретного методу перевірки гіпотези залежить від багатьох обставин. Наприклад, якщо обсяг вибірки , доцільно використовувати –критерій нормального розподілу, а для малої вибірки – –критерій Стьюдента.

Для перевірки гіпотези про рівність двох дисперсій у генеральній сукупності використовується F–критерій Фішера, заснований на співвідношенні двох вибіркових виправлених дисперсій і , що заміняють значення дисперсій у генеральних сукупностях:

де .

Критичне значення критерію Фішера знаходять за спеціальними таблицями при вказаному рівні значимості та кількості ступенів вільності. Для перевірки нульової гіпотези спочатку визначають фактичне значення критерію . З таблиць знаходимо критичне значення . Якщо , то нульову гіпотезу відхиляємо, якщо ж , то H0 приймаємо.

Розглянемо детальніше критерій (критерій Пірсона).

Перевірка гіпотези про нормальний розподіл генеральної сукупності за критерієм Пірсона здійснюється за такою схемою:

  1. знаходимо та ;

  2. знаходимо теоретичні (вирівняні) частоти кривої за формулою

, (19)

де – обсяг вибірки, – різниця між двома сусідніми варіантами, – умовні варіанти, які вводяться для спрощення обчислень, − функція Гаусса, яка є табульована (див. додатки);

  1. обчислюємо за формулою ;

  2. за таблицею критичних точок розподілу , при заданому рівні значимості та числі ступенів вільності , знаходять критичне значення , де – кількість груп;

  3. у прямокутній системі координат будують полігон частот та полігон теоретичних частот . Близькість цих графіків спонукає до висунення гіпотези про нормальний розподіл;

  4. оцінюючи нерівність між та , робимо висновок про прийняття чи відхилення нульової гіпотези.

Контроль обчислень спостережуваних значень можна проводити за формулою

.

Приклад. Нехай із деякої генеральної сукупності взята вибірка ( ), на основі якої побудований ранжирований неперервний варіаційний ряд та взяті середини інтервалів із відповідними частотами

Перевірити гіпотезу про нормальний розподіл генеральної сукупності.

Розв’язання. Спочатку знайдемо вибіркову середню та середньоквадратичне відхилення:

;

.

Для знаходження теоретичних (вирівняних) частот (1) складемо розрахункову таблицю

15

9

10,95

1,73

0,0878

6,97≈ 7

20

21

5,95

0,94

0,2565

20,33≈ 21

25

32

0,95

0,15

0,3945

31,27≈ 31

30

22

4,05

0,64

0,3251

25,77≈ 26

35

12

9,05

1,43

0,1435

11,87≈ 12

40

4

14,05

2,23

0,0332

2,63 ≈3

100

100

Побудуємо полігон спостережуваних частот і теоретичну криву за вирівняними частотами (рис. 1).

П орівняння графіків наочно вказує на малу розбіжність між ними, тому є надія прийняти гіпотезу про нормальний розподіл генеральної сукупності. Для перевірки гіпотези використаємо критерій Пірсона.

Складемо розрахункову таблицю.

9

7

2

4

0,57

81

11,57

21

21

0

0

0

441

21

32

31

1

1

0,03

1024

33,03

22

26

4

16

0,62

484

18,52

12

12

0

0

0

144

12

4

4

1

1

0,33

16

5,33

100

100

1,55

2190

101,55

З розрахункової таблиці отримуємо спостережене значення критерію . Контроль обчислень .

Знайдемо критичне значення критерію при та рівні значимості гіпотези за спеціальною таблицею .

Оскільки спостережене значення критерію менше за критичне ( ), то нульову гіпотезу приймають. Отже, можна вважати, що розглядувана сукупність розподілена за нормальним законом.