Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Кн Методология наук досл Ерина.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
3.29 Mб
Скачать

4.2. Критерії перевірки гіпотез

4.2.1. Перевірка гіпотез щодо середньої

Тестування гіпотез щодо середньої здійснюється у двох на­прямах:

  1. порівняння середньої зі «стандартом»;

  2. порівняння середніх двох сукупностей.

При розв'язанні першого типу задач перевірці підлягає гі­потеза Но : X = Хо, тобто генеральна середня X дорівнює стан­дарту Хо, а різниця | X - Хо | = 0. З такою ситуацією стикаються при контролі якості продукції чи технологічного процесу, коли якість характеризується середнім рівнем: середня тривалість служби виробу, середня міцність пряжі, середня вологість речо­вини тощо. Коли гіпотеза Но істинна, порушення рівності X = Хо можливе внаслідок дії механізму випадкового добору і влас­тивої йому похибки. Отже, щоб відхилити чи не відхилити гіпо­тезу Но, треба перевірити, випадкова чи не випадкова різниця | X - Хо |. Ступінь випадковості визначається стандартною похиб­кою вибірки jU-, розмір якої залежить від варіації ознаки і обсягу вибірки:

Велика вибірка

Мала вибірка (п < ЗО)

~х — X

, де вибіркова середня х слугує

Перевірка гіпотези Яо: X = Хо ґрунтується на використанні нормованого відхилення

оцінкою генеральної середньої X.

У великих за обсягом сукупностях розподіл вибіркових се­редніх асимптотично наближається до нормального, а отже но­рмоване відхилення є квантилем нормального розподілу (z-тест). При односторонній перевірці гіпотез щодо значення середньої найчастіше використовують квантилі: zo,go = 1,28; zo,95 =1>64; Zom ;96. Завдяки симетричності нормального розподілу

1-а •

Коли альтернативна гіпотеза формулюється як На: X о, застосовують двосторонню перевірку з критичними значеннями тесту : za ; z а. При а = 0,05 це будуть значення: z 0,025 = -1,96

2 2

Та Z 0,975 = 1,96.

У малих вибірках розподіл вибіркових середніх підпоряд­ковується розподілу Стьюдента '. Відповідно гіпотеза Яо : X = Хо перевіряється за допомогою t -тесту, значення якого для а = 0,05 і числа ступенів свободи2 df= (п - 1) наведено у табл. 4.2.1.

1 Розподіл Стьюдента симетричний, але порівняно з нормальним має менший ексцес, а тому на «хвостах» більшу площу. Отже, при одному і тому ж рівні істотності а значення ta >za , а довірчий інтервал ширший, ніж при нормально­ му розподілі. При п > 30 розподіли Стьюдента і нормальний збігаються.

2 Число незалежних величин, необхідних для визначення /-характеристики (degrees of freedom - df)-

114

Таблиця 4.2.1. Критичні точки f-тесту для a = 0,05

df

Двосторон­ній

Односто­ронній

df

Двосторон­ній

Односто­ронній

4

2,78

2,13

16

2,12

1,75

5

2,57

2,01

18

2,10

1,73

6

2,45

1,94

20

2,09

1,73

7

2,37

1,89

22

2,07

1,72

8

2,31

1,86

24

2,06

1,71

9

2,26

1,83

26

2,06

1,71

10

2,23

1,81

28

2,05

1,70

11

2,20

1,80

30

2,04

1,70

12

2,18

1,78

40

2,02

1,68

13

2,16

1,77

50

2,01

1,68

14

2,15

1,76

100

1,98

1,66

15

2,13

1,75

оо

1,96

1,64

Наприклад, необхідно перевірити, чи відповідає зольність вугілля, що надійшло на теплоелектростанцію, нормативу (Хо = 16%). Для цього з різних вагонів узято 20 проб. За результатами аналізу проб середня зольність становить 17,2% при дисперсії -12,2 . Щоб відповісти на питання, випадкове чи не випадкове відхилення середньої від нормативу (17,2 - 16,0), перевірці під­дамо нульову гіпотезу На : X = 16 проти альтернативної На : Х> 16.


За даними вибірки стандартна похибка середньої дорівнює

Вибіркова дисперсія далі позначається символом S2.

115


Звідси вибіркове значення t -

о_= 17,2-16,0 _ j з Мі 0,8

х-Х,

Для числа ступенів свободи df= 20-1 = 19 і рівня істотно­сті а = 0,05 критичне значення одностороннього критерію стано­вить //.„ (19)= 1,73. Вибіркове значення менше за критичне (1,5 < 1,73), тобто належить області припустимих значень, а отже, гіпо­теза про те, що середній рівень зольності вугілля відповідає ста­ндарту, не відхиляється.

Аналогічна процедура перевірки гіпотез щодо часток роз-

т

поділу. Слід зазначити, що частка р = це середня величина

п

бінарної ознаки, яка має лише два взаємовиключні значення (0; 1). Нехай гіпотеза полягає в тому, що частка дорівнює певному нормативу ро, тобто Но'.р =ро- У великих за обсягом сукупностях перевірку гіпотези здійснюють за z-критерієм, у малих сукупно­стях - за t - критерієм. Нагадаємо, що дисперсія частки розрахо­вується за формулою s2 = р(\ — р), дер і (І~р) - частки вибір­кової сукупності, які відображають наявність і відсутність певної властивості. Стандартна похибка частки визначається за форму­лою

п -\

Наприклад, за даними вибіркового обстеження 26 актів прийому будівельних об'єктів частка дефектів малярних робіт становила 18% при допустимій нормі дефектів 4%. Чи відповідає нормативам якість малярних робіт?

_ [

Нульову гіпотезу Hq. р - р0 перевіримо проти альтернатив­ної На: р > ро за допомогою одностороннього /-критерію. Стан­дартна похибка дорівнює

0,18(1-0,18) 26-1

а значення t- критерію за даними вибірки

,_ 0J 8-0,04 ЛЮ

0,0768

Розділ 4. Гіпотези і доведення у наукових дослідженнях

Оскільки вибіркове значення t потрапляє в критичну об­ласть одностороннього критерію (1,82 >?,_005(25) = 1,71), то

гіпотеза про те, що якість малярних робіт відповідає нормативу, відхиляється з імовірністю 1 - а = 1 - 0,05 = 0,95.

При перевірці гіпотези щодо частки статистичною характе­ристикою критерію може бути сама частка р0. У такому разі для заданого рівня істотності а визначаються межі припустимих значень частки і на їхній основі - критичні точки

У нашому прикладі р0 = 0,04, м и /0,04(1 - 0,04) _0029>

а верхня критична точка двостороннього критерію з імовірністю а = 0,05 становить

0,04 + 2,06 • 0,039 = 0,08.

Фактичне значення частки виявляється поза межами при­пустимих значень (0,18 > 0,08), що дає підстави відхилити ну­льову гіпотезу. Отже, і за цим критерієм якість малярних робіт не відповідає нормативу.

4.2.2. Двовибіркові t-тести Стьюдента

Другий тип задач пов'язаний з порівнянням параметрів двох сукупностей. Скажімо, у промисловості при вибірковому контролі якості виробів, виготовлених на різних верстатах чи за різними технологіями, у сільському господарстві - при експе­риментальному оцінюванні ефекту нового сорту рослин, у торгі­влі - при оцінюванні ефективності реклами і т.ін.

Наприклад, ведеться вибіркове обстеження продуктивності праці двох груп робітників, які виготовляють один і той же виріб на верстатах, модернізованих за різними проектами. Перша група працює на верстатах, модернізованих за проектом А, друга - за проектом Б (п\= п2- 8). Погодинний виробіток робітників стано­вить, виробів:

Методологія наукових досліджень

Проект А

10

12

15

11

12

9

14

13

Проект Б

8

10

12

9

10

8

11

12

розбіжності середніх невипадкові, тобто проект модернізації ве­рстатів А ефективніший за проект Б.

Вибіркові оцінки середніх і дисперсій за групами: хх = 12 штук при s2 = 4,00; хг = 10 штук при s2 = 2,57. Різниця між середніми (х, — л2 ) = (12 — 10) = 2 вироби. Потрібно визначити, чи істотна розбіжність середніх, тобто чи зумовлена вона різною ефективністю проектів модернізації чи випадкова. Нульова гіпо­теза формулюється на припущенні, що розбіжності середніх ви­падкові Щ : Хх - Х2Альтернативна гіпотеза передбачає, що про­ект А ефективніший: На: ХІ2. При такому формулюванні На проводиться одностороння (правостороння) перевірка.

Тестування гіпотези Щ можна виконати за допомогою кри-терія Стьюдента з числом ступенів свободи df- щ + пг - 2. Вибі­ркове значення j-тесту обчислюється діленням розбіжності ви­біркових середніх на стандартну похибку розбіжності Н(ххг)> яка дорівнює сумі стандартних похибок цих середніх

хх2_

f =

M(x,-x2) V "1 "2

У нашому прикладі стандартна похибка розбіжності

середніх дорівнює

1

а вибіркове значення t -тесту

= 2,20.

0,906

Для числа ступенів свободи df= 8 + 8-2=14 критичне зна­чення одностороннього критерія £,_005 (14)= 1,76. Оскільки фак­тичне значення перевищує критичне (2,20 >1,76), нульова гіпо­теза відхиляється, і з імовірністю 0,95 можна стверджувати, що

І

У середовищі Excel для тестування гіпотези щодо тотож­ності групових середніх в пакеті Анализ данньїх передбаче­но Двухвьіборочньій t-mecm с одинаковьши дисперсиями.

У діалоговому вікні (рис. 4.2.1) вказуються інтервали зна­чень показника по кожній вибірці (два інтервали), рівень істот­ності - Альфа і, якщо в масиві даних є назви рядків чи стовпців, - Метки.

Рис. 4.2.1. Діалогове вікно двовибіркового / -тесту

Проілюструємо результати комп'ютерного тестування роз­глянутої вище гіпотези щодо тотожності вибіркових середніх. У таблиці двовибіркового г-тесту (рис. 4.2.2) містяться:

  • середні та дисперсії по кожній вибірці;

  • гіпотетична розбіжність середніх (за нульовою гіпотезою

■ об'єднана дисперсія, розрахована як середня зважена з вибіркових дисперсій

2 _(я, -l)s,} +(n2-l)s22 _ 7 ■ 4,00 + 7 ■ 2,57 _ 46,0 _ •

8 + 8-2 ТГ"

я, +п2-2

  • кількість спостережень і число ступенів свободи у кожній вибірці;

  • значення /-тесту: вибіркове і критичні для односторон­ ньої і двосторонньої перевірки гіпотези при а = 0,05;

  • фактичні рівні істотності p-level.

Як бачимо, значення двовибіркового критерію Стьюдента збігається з розрахованим вище (/ = 2,20), а отже, нульова гіпоте­за відхиляється. Імовірність помилки становить р= 0,022.

Рис. 4.2.2. Результати тестування гіпотези щодо ефективності проектів модернізації верстатів

Оцінка розбіжності середніх дещо змінюється, коли ряди спостережень утворюють пари. Така ситуація виникає у повтор­них обстеженнях типу «до - після», скажімо, до і після регулю­вання пристрою, зміни умов праці, зміни законодавства тощо. У таких випадках два ряди попарно зв'язаних даних замінюються одним рядом відхилень між ними (d = X] - х0). Дисперсія і стан­дартна похибка цих відхилень визначаються за такими форму­лами

Наприклад, фірма реалізує свій товар у мережі магазинів (я = 10). Після реклами по телебаченню обсяги продажу дещо змі­нилися. До реклами денний обсяг продажу становив у середньо­му Хо = 68 тис. грош.од., після реклами - Хх = 74 тис. грош.од. Щоб оцінити, випадкові чи невипадкові розбіжності середніх (74 - 68 = 6 тис. грош. од) перевіримо гіпотезу Н<ь\Хх = Хо проти альтернативної Яа: Хх > Хо. Для цього в пакеті Анализ данньїх виберемо Парний двухвьіборочньїй t-mecm для средних. Параме­три діалогового вікна парного /-тесту такі ж самі, як і двовибір­кового (рис.4.2.1).

Результати тестування гіпотези щодо розбіжності середніх денних обсягів продажу «до і після реклами» представлено на рис. 4.2.3. Модуль вибіркового значення /-тесту значно переви­щує критичне значення (6,0 > 1,83), а отже, розбіжності середніх не випадкові. З імовірністю 0,95 можна зробити висновок про ефективність реклами.

и-1

де d - відхилення по кожній парі значень, d - середнє відхилен­ня, п - кількість пар.