- •Передмова
- •2.1. Види та джерела наукової інформації
- •2.3. Формування інформаційної бази дослідження
- •3.3.1. Характеристики варіації
- •3.4. Рейтингові оцінки
- •4.2. Критерії перевірки гіпотез
- •4.3. Дисперсійний аналіз
- •4.4. Аналіз кореляцій і регресій
- •Дослідженнях
- •5.1. Інформаційна база прогнозування
- •5.2. Тенденції розвитку
- •5.4. Сезонні «хвилі»
- •5.6. Пошук рішень
- •5.6.1. Загальна задача оптимізації
4.2. Критерії перевірки гіпотез
4.2.1. Перевірка гіпотез щодо середньої
Тестування гіпотез щодо середньої здійснюється у двох напрямах:
порівняння середньої зі «стандартом»;
порівняння середніх двох сукупностей.
При розв'язанні першого типу задач перевірці підлягає гіпотеза Но : X = Хо, тобто генеральна середня X дорівнює стандарту Хо, а різниця | X - Хо | = 0. З такою ситуацією стикаються при контролі якості продукції чи технологічного процесу, коли якість характеризується середнім рівнем: середня тривалість служби виробу, середня міцність пряжі, середня вологість речовини тощо. Коли гіпотеза Но істинна, порушення рівності X = Хо можливе внаслідок дії механізму випадкового добору і властивої йому похибки. Отже, щоб відхилити чи не відхилити гіпотезу Но, треба перевірити, випадкова чи не випадкова різниця | X - Хо |. Ступінь випадковості визначається стандартною похибкою вибірки jU-, розмір якої залежить від варіації ознаки і обсягу вибірки:
Велика вибірка |
|
Мала вибірка (п < ЗО) |
|
~х — X
, де вибіркова середня х слугує
Перевірка гіпотези Яо: X = Хо ґрунтується на використанні нормованого відхилення
оцінкою генеральної середньої X.
У великих за обсягом сукупностях розподіл вибіркових середніх асимптотично наближається до нормального, а отже нормоване відхилення є квантилем нормального розподілу (z-тест). При односторонній перевірці гіпотез щодо значення середньої найчастіше використовують квантилі: zo,go = 1,28; zo,95 =1>64; Zom =і;96. Завдяки симетричності нормального розподілу
■ 1-а •
Коли альтернативна гіпотеза формулюється як На: X о, застосовують двосторонню перевірку з критичними значеннями тесту : za ; z а. При а = 0,05 це будуть значення: z 0,025 = -1,96
2 2
Та Z 0,975 = 1,96.
У малих вибірках розподіл вибіркових середніх підпорядковується розподілу Стьюдента '. Відповідно гіпотеза Яо : X = Хо перевіряється за допомогою t -тесту, значення якого для а = 0,05 і числа ступенів свободи2 df= (п - 1) наведено у табл. 4.2.1.
1
Розподіл
Стьюдента симетричний, але порівняно
з нормальним має менший
ексцес,
а тому на «хвостах» більшу площу. Отже,
при одному і тому ж рівні
істотності
а значення ta
>za
,
а довірчий інтервал ширший, ніж при
нормально
му
розподілі. При п
> 30
розподіли Стьюдента і нормальний
збігаються.
2 Число незалежних величин, необхідних для визначення /-характеристики (degrees of freedom - df)-
114
Таблиця 4.2.1. Критичні точки f-тесту для a = 0,05
df |
Двосторонній |
Односторонній |
df |
Двосторонній |
Односторонній |
4 |
2,78 |
2,13 |
16 |
2,12 |
1,75 |
5 |
2,57 |
2,01 |
18 |
2,10 |
1,73 |
6 |
2,45 |
1,94 |
20 |
2,09 |
1,73 |
7 |
2,37 |
1,89 |
22 |
2,07 |
1,72 |
8 |
2,31 |
1,86 |
24 |
2,06 |
1,71 |
9 |
2,26 |
1,83 |
26 |
2,06 |
1,71 |
10 |
2,23 |
1,81 |
28 |
2,05 |
1,70 |
11 |
2,20 |
1,80 |
30 |
2,04 |
1,70 |
12 |
2,18 |
1,78 |
40 |
2,02 |
1,68 |
13 |
2,16 |
1,77 |
50 |
2,01 |
1,68 |
14 |
2,15 |
1,76 |
100 |
1,98 |
1,66 |
15 |
2,13 |
1,75 |
оо |
1,96 |
1,64 |
Наприклад, необхідно перевірити, чи відповідає зольність вугілля, що надійшло на теплоелектростанцію, нормативу (Хо = 16%). Для цього з різних вагонів узято 20 проб. За результатами аналізу проб середня зольність становить 17,2% при дисперсії -12,2 . Щоб відповісти на питання, випадкове чи не випадкове відхилення середньої від нормативу (17,2 - 16,0), перевірці піддамо нульову гіпотезу На : X = 16 проти альтернативної На : Х> 16.
За даними вибірки стандартна похибка середньої дорівнює
Вибіркова дисперсія далі позначається символом S2.
115
Звідси вибіркове значення t -
о_= 17,2-16,0 _ j з Мі 0,8
х-Х,
Для числа ступенів свободи df= 20-1 = 19 і рівня істотності а = 0,05 критичне значення одностороннього критерію становить //.„ (19)= 1,73. Вибіркове значення менше за критичне (1,5 < 1,73), тобто належить області припустимих значень, а отже, гіпотеза про те, що середній рівень зольності вугілля відповідає стандарту, не відхиляється.
Аналогічна процедура перевірки гіпотез щодо часток роз-
т
поділу. Слід зазначити, що частка р = це середня величина
п
бінарної ознаки, яка має лише два взаємовиключні значення (0; 1). Нехай гіпотеза полягає в тому, що частка дорівнює певному нормативу ро, тобто Но'.р =ро- У великих за обсягом сукупностях перевірку гіпотези здійснюють за z-критерієм, у малих сукупностях - за t - критерієм. Нагадаємо, що дисперсія частки розраховується за формулою s2 = р(\ — р), дер і (І~р) - частки вибіркової сукупності, які відображають наявність і відсутність певної властивості. Стандартна похибка частки визначається за формулою
п
-\
Наприклад, за даними вибіркового обстеження 26 актів прийому будівельних об'єктів частка дефектів малярних робіт становила 18% при допустимій нормі дефектів 4%. Чи відповідає нормативам якість малярних робіт?
_ [
Нульову гіпотезу Hq. р - р0 перевіримо проти альтернативної На: р > ро за допомогою одностороннього /-критерію. Стандартна похибка дорівнює
0,18(1-0,18)
26-1
а значення t- критерію за даними вибірки
,_ 0J 8-0,04 ЛЮ
0,0768
Розділ 4. Гіпотези і доведення у наукових дослідженнях
Оскільки вибіркове значення t потрапляє в критичну область одностороннього критерію (1,82 >?,_005(25) = 1,71), то
гіпотеза про те, що якість малярних робіт відповідає нормативу, відхиляється з імовірністю 1 - а = 1 - 0,05 = 0,95.
При перевірці гіпотези щодо частки статистичною характеристикою критерію може бути сама частка р0. У такому разі для заданого рівня істотності а визначаються межі припустимих значень частки і на їхній основі - критичні точки
У нашому прикладі р0 = 0,04, м и /0,04(1 - 0,04) _0029>
а верхня критична точка двостороннього критерію з імовірністю а = 0,05 становить
0,04 + 2,06 • 0,039 = 0,08.
Фактичне значення частки виявляється поза межами припустимих значень (0,18 > 0,08), що дає підстави відхилити нульову гіпотезу. Отже, і за цим критерієм якість малярних робіт не відповідає нормативу.
4.2.2. Двовибіркові t-тести Стьюдента
Другий тип задач пов'язаний з порівнянням параметрів двох сукупностей. Скажімо, у промисловості при вибірковому контролі якості виробів, виготовлених на різних верстатах чи за різними технологіями, у сільському господарстві - при експериментальному оцінюванні ефекту нового сорту рослин, у торгівлі - при оцінюванні ефективності реклами і т.ін.
Наприклад, ведеться вибіркове обстеження продуктивності праці двох груп робітників, які виготовляють один і той же виріб на верстатах, модернізованих за різними проектами. Перша група працює на верстатах, модернізованих за проектом А, друга - за проектом Б (п\= п2- 8). Погодинний виробіток робітників становить, виробів:
|
Методологія наукових досліджень |
|
|
|||||
Проект А |
10 |
12 |
15 |
11 |
12 |
9 |
14 |
13 |
Проект Б |
8 |
10 |
12 |
9 |
10 |
8 |
11 |
12 |
розбіжності середніх невипадкові, тобто проект модернізації верстатів А ефективніший за проект Б.
Вибіркові
оцінки середніх і дисперсій за групами:
хх
= 12
штук
при s2
=
4,00;
хг
=
10 штук при s2
= 2,57.
Різниця між середніми
(х, — л2
) = (12 — 10) = 2 вироби. Потрібно визначити,
чи істотна розбіжність середніх, тобто
чи зумовлена вона різною ефективністю
проектів модернізації чи випадкова.
Нульова гіпотеза
формулюється на припущенні, що розбіжності
середніх випадкові
Щ
: Хх
- Х2
■ Альтернативна
гіпотеза передбачає, що проект
А
ефективніший:
На:
ХІ>Х2.
При
такому формулюванні На
проводиться
одностороння (правостороння) перевірка.
Тестування гіпотези Щ можна виконати за допомогою кри-терія Стьюдента з числом ступенів свободи df- щ + пг - 2. Вибіркове значення j-тесту обчислюється діленням розбіжності вибіркових середніх на стандартну похибку розбіжності Н(хх-хг)> яка дорівнює сумі стандартних похибок цих середніх
хх-х2_
f =
M(x,-x2) V "1 "2
У нашому прикладі стандартна похибка розбіжності
середніх дорівнює
1
а вибіркове значення t -тесту
= 2,20.
0,906
Для числа ступенів свободи df= 8 + 8-2=14 критичне значення одностороннього критерія £,_005 (14)= 1,76. Оскільки фактичне значення перевищує критичне (2,20 >1,76), нульова гіпотеза відхиляється, і з імовірністю 0,95 можна стверджувати, що
І
У середовищі Excel для тестування гіпотези щодо тотожності групових середніх в пакеті Анализ данньїх передбачено Двухвьіборочньій t-mecm с одинаковьши дисперсиями.
У
діалоговому вікні (рис. 4.2.1) вказуються
інтервали значень показника по
кожній вибірці (два інтервали), рівень
істотності
- Альфа
і,
якщо в масиві даних є назви рядків чи
стовпців, -
Метки.
Рис. 4.2.1. Діалогове вікно двовибіркового / -тесту
Проілюструємо результати комп'ютерного тестування розглянутої вище гіпотези щодо тотожності вибіркових середніх. У таблиці двовибіркового г-тесту (рис. 4.2.2) містяться:
середні та дисперсії по кожній вибірці;
гіпотетична розбіжність середніх (за нульовою гіпотезою
■ об'єднана дисперсія, розрахована як середня зважена з вибіркових дисперсій
2 _(я, -l)s,} +(n2-l)s22 _ 7 ■ 4,00 + 7 ■ 2,57 _ 46,0 _ •
8 + 8-2 ТГ"
я, +п2-2
кількість спостережень і число ступенів свободи у кожній вибірці;
значення /-тесту: вибіркове і критичні для односторон ньої і двосторонньої перевірки гіпотези при а = 0,05;
фактичні рівні істотності p-level.
Як бачимо, значення двовибіркового критерію Стьюдента збігається з розрахованим вище (/ = 2,20), а отже, нульова гіпотеза відхиляється. Імовірність помилки становить р= 0,022.
Рис. 4.2.2. Результати тестування гіпотези щодо ефективності проектів модернізації верстатів
Оцінка розбіжності середніх дещо змінюється, коли ряди спостережень утворюють пари. Така ситуація виникає у повторних обстеженнях типу «до - після», скажімо, до і після регулювання пристрою, зміни умов праці, зміни законодавства тощо. У таких випадках два ряди попарно зв'язаних даних замінюються одним рядом відхилень між ними (d = X] - х0). Дисперсія і стандартна похибка цих відхилень визначаються за такими формулами
Наприклад, фірма реалізує свій товар у мережі магазинів (я = 10). Після реклами по телебаченню обсяги продажу дещо змінилися. До реклами денний обсяг продажу становив у середньому Хо = 68 тис. грош.од., після реклами - Хх = 74 тис. грош.од. Щоб оцінити, випадкові чи невипадкові розбіжності середніх (74 - 68 = 6 тис. грош. од) перевіримо гіпотезу Н<ь\Хх = Хо проти альтернативної Яа: Хх > Хо. Для цього в пакеті Анализ данньїх виберемо Парний двухвьіборочньїй t-mecm для средних. Параметри діалогового вікна парного /-тесту такі ж самі, як і двовибіркового (рис.4.2.1).
Результати тестування гіпотези щодо розбіжності середніх денних обсягів продажу «до і після реклами» представлено на рис. 4.2.3. Модуль вибіркового значення /-тесту значно перевищує критичне значення (6,0 > 1,83), а отже, розбіжності середніх не випадкові. З імовірністю 0,95 можна зробити висновок про ефективність реклами.
и-1
де d - відхилення по кожній парі значень, d - середнє відхилення, п - кількість пар.
