
Лабораторне практичне заняття №7
Тема заняття: Перевірка статистичної гіпотези про рівність середніх двох вибіркових сукупностей
Мета заняття: Освоєння статистичного інструментарію перевірки гіпотез про оцінку параметрів вибіркового розподілу
Основні завдання практичного заняття:
визначення мети перевірки гіпотез про рівність середніх двох вибіркових сукупностей;
вивчення принципів побудови та схеми перевірки гіпотез;
приклади перевірки гіпотез.
Методичні вказівки.
Перевірка статистичної гіпотези передбачає послідовне виконання таких етапів:
Оцінка вихідної інформації і опис статистичної моделі вибіркової сукупності.
Формулювання нульової і альтернативної гіпотез.
Встановлення рівня значущості, за допомогою якого контролюється помилка І роду.
Вибір найбільш потужного критерію для перевірки нульової гіпотези.
Розрахунок за певним алгоритмом фактичного значення критерію.
Визначення критичної області і області згоди з нульовою гіпотезою, тобто встановлення табличного значення критерію.
Співставлення фактичного і табличного значень критерію і формулювання висновків за результатами перевірки нульової гіпотези.
Приклад 7.1.
Перевірка
гіпотези відносно двох середніх. Вибірки
незалежні з рівними чисельностями (
)
і рівними дисперсіями в генеральних
сукупностях (
)
• У приміському держгоспі досліджується раціон з добавкою вітамінів при відгодівлі тварин. Були організовані дослідна і контрольна група по 5 голів у кожній групі. Протягом місяця дослідна група тварин отримала понад звичайного раціону комплекс вітамінів. В кінці місяця для кожного виду визначено приріст у живій масі. Дані досліду подані у табл. 7.1.
Співставлення середніх добових приростів по двох групах тварин показує, що більш високий добовий приріст дали тварини дослідної групи. Однак, у зв'язку з тим, що чисельність вибірок невелика (п = 5), не виключена можливість, що розходження між добовими приростами отримані в результаті дії випадкових причин.
Потрібно статистично оцінити різницю між середніми по двох групах тварин.
За результатами перевірки гіпотези зробити висновок про те, що різниця між середніми лежить у межах випадкових коливань, або ж ця різниця настільки значна, що не узгоджується з нульовою гіпотезою про випадковий характер відмінностей між середніми.
Таблиця 7.1.
Добовий приріст живої маси відгодівельного поголів'я, г
-
Тварини
Основний
раціон + вітаміни (дослід)
Основний раціон
(контроль)
1
632
520
2
691
586
3
570
490
4
694
609
5
683
590
Якщо буде доведено друге положення і відхилене перше, можна стверджувати, що умови росту тварин дослідної групи істотно відрізнялись від умов росту тварин контрольної групи, тобто комплекс вітамінів стимулював підвищення добових приростів.
Розв'язування:
Умова задачі припускає, що обидві вибірки взяті із нормально розподіленої генеральної сукупності. Формування груп випадкове (незалежне), тому оцінюватись повинна різниця між середніми. В середовищі Excel створюємо форму вихідних даних.
Визначимо середні добові прирости у дослідній і контрольній групах за допомогою вбудованої функції СРЗНАЧ(), параметри якої є масиви даних відповідних вибірок. Так, в рядку 8 отримуємо середні значення, в рядку 9 обчислимо фактичну різницю між середніми (Рис.7.1). Істотність цієї різниці повинна бути оцінена Дія цього необхідно перевірити гіпотезу про рівність двох середніх.
Р ис.7.1. Обчислення середніх та їх різниці
Етапи схеми перевірки гіпотези:
Сформулюємо нульову Но і альтернативну На гіпотези:
.
Приймемо рівень значущості
=0,05, гарантуючи прийняття гіпотези або відмови від неї з ймовірністю помилки тільки в 5 випадках із 100.
Найбільш потужним критерієм для перевірки такої гіпотези Но є
-критерій Стьюдента.
4.
Сформулюємо правило прийняття рішення
за результатами
перевірки На.
Оскільки
за альтернативною гіпотезою
може
бути або більше або менше
,
то критична
область повинна бути встановлена з двох
сторін:
(так
звана двостороння критична
область завдання критерію).
Критична область при =0,05 буде міститися в межах - всі значення вищі, ніж верхнє 2,5% і нижче, ніж 2,5% точки розподілу -критерію Стьюдента.
Висновок
при перевірці Н0
можна сформулювати таким
чином: гіпотеза Но
відхиляється,
якщо вибіркове значення
критерію
виявиться в критичній області, тобто
якщо
.
В
протилежному випадку Н0
повинна
бути прийнята.
5. Щоб перевірити Н0, потрібно визначити фактичне значення -критерію Стьюдента і порівняти його з табличним значенням.
Фактичне значення -критерію Стьюдента визначимо за формулою:
,
де
-
середнє значення ознаки за першою
виборкою (середній добовий приріст
за даними дослідної групи);
-
середнє
значення ознаки за другою виборкою
(середній добовий приріст за даними
контрольної групи);
і
- середнє
значення ознаки відповідних генеральних
сукупностей, з яких зроблені вибірки
(оскільки згідно з Н0:
,
то
);
- узагальнена середня помилка різниці
середніх.
Для визначення фактичного значення -критерію Стьюдента зробимо такі обчислення.
6.
Обчислимо за кожною вибіркою скореговані
на втрату ступенів свободи варіації
дисперсії за допомогою вбудованої
функції ДИСП(),
параметри
якої є масиви даних відповідних вибірок
(рядок 10). Обчислення за вказаною функцією
проводиться на основі формули:
.
7. Розрахуємо квадрати середніх помилок за кожною виборкою й узагальнену середню помилку різниці середніх (рядки 11, 12 Рис.7.2.):
Розрахуємо фактичне значення -критерію Стьюдента (рядок 13 Рис.7.2.):
.
9.
Встановимо табличне значення
-критерію
Стьюдента (рядок 14 Рис.7.2.), виходячи
із рівня значущості
=0,05
і загального
числа ступенів свободи для двох вибірок:
за допомогою вбудованої функції
СТЬЮДРАСПОБР(0,05;8):
.
10. Співставимо фактичне і табличне значення t-критерію Стьюдента:
;
2,88 > 2,31.
Отже, вибіркове значення критерію знаходиться в критичній області, нульова гіпотеза про рівність середніх у генеральних сукупностях повинна бути відхилена і прийнята альтернативна гіпотеза про те, що середні в генеральних сукупностях нерівні. Таким чином, дані досліду не узгоджуються з гіпотезою про те, що відмінності в середніх приростах випадкові. Фактичне значення t-критерію Стьюдента перевищує його можливу теоретичну величину, яка вимірює випадкове коливання, що дозволяє зробити висновок про істотність (вірогідність) відмінностей між середніми.
Р
ис.7.2.
Обчислення
-критерію
Стьюдента
Відзначимо, що проведені розрахунки можна отримати також за допомогою вбудованого пакету “Анализ данных”, який складається з набору інструментів.
П |
Рис.7.3. Діалогове вікно інструменту “Двухвыборочный F-тест для дисперсии ” пакету “Анализ данных”
В поле Интервал переменной 1 слід ввести діапазон даних першої виборки, в поле Интервал переменной 2 - діапазон даних другої виборки. В поле Выходной интервал вводиться посилання на клітину виведення результатів обчислень.
На рис. 7.4. представлено результат виконання інструменту “Двухвыборочный F-тест для дисперсии” пакету “Анализ данных”.
Рис. 7.4. Результат виконання інструменту “Двухвыборочный F-тест для дисперсии”
Fфакт=1,084
<
=6,388
-
приймається гіпотеза про рівність
дисперсій у генеральних сукупностях.
Для подальшого дослідження про рівність середніх слід використати інструмент “Двухвыборочный t-тест с одинаковыми дисперсиями”.
На рис. 7.5. представлено результат виконання інструменту “Двухвыборочный t-тест с одинаковыми дисперсиями” пакету “Анализ данных”. На основі представлених значень t-статистики та t-критического підтверджується висновок про відхилення нульової гіпотези про рівність середніх у генеральних сукупностях і прийняття альтернативної гіпотези про те, що середні в генеральних сукупностях нерівні.
Рис. 7.5. Результат виконання інструменту “Двухвыборочный t-тест с одинаковыми дисперсиями”
Дані для самостійного розв'язування наведені в таблиці 7.2.
Таблиця 7.2.