- •6.070800, 7.070801, 8.070801 — «Екологія та охорона навколишнього середовища»
- •Тема 6. Дисперсійний аналіз 46
- •Тема 7. Непараметрична статистика 51
- •Тема 8. Використання табличного процессору Microsoft Excel для проведення статистичних розрахунків 63
- •Тема 1. Складання варіаційних рядів та їх графічне зображення.
- •Тема 2. Вирахування середньої арифметичної
- •2.1. Вирахування середньої арифметичної прямим способом у малих вибірках.
- •2.2. Обчислення середньої арифметичної у великих вибірках.
- •2.3. Вирахування середньої зваженої.
- •Тема 3. Показники різноманітності ознаки в сукупностях.
- •3.1. Вирахування середнього квадратичного відхилення в малих вибірках.
- •3.2. Вирахування середнього квадратичного відхилення великих вибірках.
- •3.4. Вирахування коефіцієнту варіації.
- •3.5. Вирахування нормованого відхилення.
- •Тема 4. Визначення зв’язку між ознаками
- •4.1 Обчислення коефіцієнту фенотипічної кореляції в малих вибірках.
- •4.2 Обчислення коефіцієнту фенотипічної кореляції у великих вибірках
- •Добові надої (х)‚ жива вага (у) корів
- •Розрахунок коефіцієнту кореляції між добовими надоями та живою вагою корів.
- •4.3 Обчислення коефіцієнту прямолінійної регресії
- •4.4 Обчислення коефіцієнту генетичної кореляції
- •Тема 5. Помилка репрезентативності. Оцінка достовірності вибіркових показників.
- •5.1 Обчислення допустимих границь для середньої арифметичної генеральної сукупності
- •Допустимі ймовірності (ймовірності безпомилкового прогнозу), відповідні їм значення та допустимі границі у великих вибірках *
- •5.2 Обчислення достовірності різниці між середніми арифметичними
- •5.3 Обчислення критерію відповідності.
- •Вирахування критерію χ2
- •5.3.1 Кількісний аналіз успадкування кольору тіла дрозофілами з використанням критерію відповідності
- •Статистична обробка отриманих результатів
- •5.3.2 Використання критерію відповідності при порівнянні двох емпіричних рядів.
- •5.3.3 Застосування критерію відповідності при визначенні достовірності між двома групами тварин
- •Тема 6. Дисперсійний аналіз
- •Приклад розрахунків при дисперсійному аналізі однофакторних комплексів для малих груп ( число ягнят у потомстві овець каракульської породи).
- •6.1 Визначення коефіцієнту спадкування в однофакторному комплексі
- •Тема 7. Непараметрична статистика
- •7.1 Перевірка гіпотез про закон розподілу. Застосування коефіцієнтів асиметрії та ексцесу для перевірки нормальності розподілу
- •7.2 Особливості представлення непараметичних даних
- •7.2.1 Мода та медіана
- •7.2.2 Довірчі імовірності та рівні значущості
- •7.2.3 Довірчій інтервал
- •7.3 Непараметричні критерії
- •Тема 8. Використання табличного процессору Microsoft Excel для проведення статистичних розрахунків
- •8.1 Точкове й інтервальне оцінювання параметрів розподілів
- •8.1.1. Точкове оцінювання
- •8.1.2. Інтервальне оцінювання
- •8.2 Перевірка статистичних гіпотез про вид розподілу
- •8.3 Перевірка гіпотез про рівність дисперсій і математичних очікувань
- •8.3.1. Критерій Фишера для порівняння дисперсій
- •8.3.2. Критерій Ст’юдента порівняння середніх
- •8.4 Основи регресійного й кореляційного аналізу
- •Додатки
- •Стандартні значення критерію t для малих вибірок (за Стьюдентом).
- •Значення χ2 (хі-квадрат), які відповідають різним рівням значимості та ступеням свободи
- •Стандартні значення критерію для дисперсійного аналізу (за н.А. Плохінським)
- •Критичні значення коефіцієнту асиметрії As
- •Критичні значення коефіцієнту ексцесу Ex
- •Критичні точки t-крітерію Ст’юдента
- •Критичні значення критерію u Манна-Уітні
- •Список рекомендованої літератури
- •Основи статистичного аналізу в екології
- •6.070800, 7.070801, 8.070801 — «Екологія та охорона навколишнього середовища»
8.3.2. Критерій Ст’юдента порівняння середніх
Використовується для перевірки припущення про те, що середні значення двох показників, представлених вибірками, суттєво різняться. Існує три різновиди критерію: один — для зв'язаних вибірок, і два для незв'язаних вибірок (з однаковими й різними дисперсіями). Якщо вибірки не зв'язані, то попередньо потрібно перевірити гіпотезу про рівність дисперсій, щоб визначити, який із критеріїв використовувати. Так само як і у випадку порівняння дисперсій є 2 способу розв'язку задачі, які розглянемо на прикладі.
Розбір вирішення задачі
Є дані про врожайність сільськогосподарської культури (ц/га) без використання та із використанням стимулятора росту.
Без використання стимулятора |
16 |
19 |
14 |
15 |
17 |
16 |
19 |
16 |
19 |
14 |
15 |
19 |
13 |
Із використанням стимулятора |
18 |
19 |
21 |
15 |
19 |
18 |
15 |
20 |
17 |
16 |
21 |
15 |
Чи можна з імовірністю 0,99 уважати, що застосування стимулятора росту привело до середнього збільшення врожайності культури?
За умовою р=0,99, α=0,01, вибірки не зв'язані, критерій однобічний, тому що потрібно показати, що середні показника, представленого другий вибіркою, більше чому в першої. Уводимо в комірки A1-M1 і A2-L2 вихідні дані. Т.к. вибірки незв'язані, те попередньо порівнюємо дисперсії. У результаті перевірки дисперсії виявляються рівними.
Перший спосіб розв'язку задачі, як і у випадку дисперсій, використовувати стандартну функцію. Нею є ТТЕСТ(масив1;масив2;хвости;тип), що вирішує задачу по t- критерію Ст’юдента. У комірку В4 уводимо підпис « t-критерій», а в сусідню З4 функцію TTECT (категорія «Статистичні») Аргументи функції:
масив1, масив2 - вихідні дані (посилання на Al-Ml і A2-L2);
хвости - вид критерію: якщо 1 - однобічний критерій, якщо 2 - двосторонній (у нашім випадку ставиться одиниця);
тип - тип критерію: якщо вибірки зв'язані, те 1, для незв'язаних вибірок з рівними дисперсіями - ставимо 2, для незв'язаних вибірок з нерівними дисперсіями ставимо 3. У нашім випадку дисперсії рівні, тому вибираємо 2.
Функція повертає критичне значення рівня значимості, що має зміст помилитися, прийнявши гіпотезу про відмінність середніх. Якщо критичне значення більше заданого, то середні потрібно вважати рівними. Результат у нашому випадку 0,0476828 більше заданого α = 0,01. Отже, застосування стимулятора росту не привело до середнього збільшення врожайності й зміни врожайності, найімовірніше, пов'язане з якимись випадковими факторами.
Другий спосіб - використовувати пакет «Аналіз даних» (Data Analysis). Спосіб виклику й підключення його був описаний у п.2. Залежно від типу критерію вибирається один із трьох: «Парний двовибірковий t-тест для середніх» (t-teat: Paired Two Sample for Means) — для зв'язаних вибірок, і «Двовибірковий t-тест із однаковими дисперсіями» (t-teat: Two Sample Assuming Equal Variances) або «Двовибірковий t-тест із різними дисперсіями» (t-teat: Two Sample Assuming Unequal Variances) - для незв'язаних вибірок. Викличте тест із однаковими дисперсіями, у вікні, що відкрилося, у полях «Інтервал змінної 1» (Variable 1 Range) і «Інтервал змінної 2» (Variable 2 Range) уводять посилання на дані (А 1-М1 і A2-L2, відповідно), якщо є підписи даних, то ставлять прапорець у напису «Мітки» (Label) ( у нас їх ні, тому прапорець не ставиться). Далі вводять рівень значимості в поле «Альфа» (Alpha) - 0,01. Поле «Гіпотетична середня різниця» (Hypothesized Mean Difference) залишають порожнім. У розділі «Параметри висновку» (Output Options) ставлять мітку близько «Вихідний інтервал» (Output Range) і помістивши курсор в, що з'явилося поле напроти напису, клацають лівою кнопкою в гнізді В7. Висновок результату буде здійснюватися починаючи із цього комірки. Нажавши на «ОК» з'являється таблиця результату. Зруште границю між стовпцями В и С, С и D, D і Е, збільшивши ширину стовпців В, С и D так, щоб уміщалися всі написи. Процедура виводить основні характеристики вибірок, t-статистику (t-stat), критичні значення цих статистик і критичні рівні значимості «P(T<=t) однобічне» (P(T<=t) one-tail) і «P(T<=t) двостороннє» (P(T<=t) two-tail). Якщо по модулю t-статистика менше критичного, то середні показники із заданою ймовірністю рівні. У нашім випадку -1,739215668 < 2,499873517, отже, середнє число продажів значиме не збільшилося. Слід зазначити, що якщо обрати рівень значущості α=0,05, то результати дослідження будуть зовсім іншими.