- •6.070800, 7.070801, 8.070801 — «Екологія та охорона навколишнього середовища»
- •Тема 6. Дисперсійний аналіз 46
- •Тема 7. Непараметрична статистика 51
- •Тема 8. Використання табличного процессору Microsoft Excel для проведення статистичних розрахунків 63
- •Тема 1. Складання варіаційних рядів та їх графічне зображення.
- •Тема 2. Вирахування середньої арифметичної
- •2.1. Вирахування середньої арифметичної прямим способом у малих вибірках.
- •2.2. Обчислення середньої арифметичної у великих вибірках.
- •2.3. Вирахування середньої зваженої.
- •Тема 3. Показники різноманітності ознаки в сукупностях.
- •3.1. Вирахування середнього квадратичного відхилення в малих вибірках.
- •3.2. Вирахування середнього квадратичного відхилення великих вибірках.
- •3.4. Вирахування коефіцієнту варіації.
- •3.5. Вирахування нормованого відхилення.
- •Тема 4. Визначення зв’язку між ознаками
- •4.1 Обчислення коефіцієнту фенотипічної кореляції в малих вибірках.
- •4.2 Обчислення коефіцієнту фенотипічної кореляції у великих вибірках
- •Добові надої (х)‚ жива вага (у) корів
- •Розрахунок коефіцієнту кореляції між добовими надоями та живою вагою корів.
- •4.3 Обчислення коефіцієнту прямолінійної регресії
- •4.4 Обчислення коефіцієнту генетичної кореляції
- •Тема 5. Помилка репрезентативності. Оцінка достовірності вибіркових показників.
- •5.1 Обчислення допустимих границь для середньої арифметичної генеральної сукупності
- •Допустимі ймовірності (ймовірності безпомилкового прогнозу), відповідні їм значення та допустимі границі у великих вибірках *
- •5.2 Обчислення достовірності різниці між середніми арифметичними
- •5.3 Обчислення критерію відповідності.
- •Вирахування критерію χ2
- •5.3.1 Кількісний аналіз успадкування кольору тіла дрозофілами з використанням критерію відповідності
- •Статистична обробка отриманих результатів
- •5.3.2 Використання критерію відповідності при порівнянні двох емпіричних рядів.
- •5.3.3 Застосування критерію відповідності при визначенні достовірності між двома групами тварин
- •Тема 6. Дисперсійний аналіз
- •Приклад розрахунків при дисперсійному аналізі однофакторних комплексів для малих груп ( число ягнят у потомстві овець каракульської породи).
- •6.1 Визначення коефіцієнту спадкування в однофакторному комплексі
- •Тема 7. Непараметрична статистика
- •7.1 Перевірка гіпотез про закон розподілу. Застосування коефіцієнтів асиметрії та ексцесу для перевірки нормальності розподілу
- •7.2 Особливості представлення непараметичних даних
- •7.2.1 Мода та медіана
- •7.2.2 Довірчі імовірності та рівні значущості
- •7.2.3 Довірчій інтервал
- •7.3 Непараметричні критерії
- •Тема 8. Використання табличного процессору Microsoft Excel для проведення статистичних розрахунків
- •8.1 Точкове й інтервальне оцінювання параметрів розподілів
- •8.1.1. Точкове оцінювання
- •8.1.2. Інтервальне оцінювання
- •8.2 Перевірка статистичних гіпотез про вид розподілу
- •8.3 Перевірка гіпотез про рівність дисперсій і математичних очікувань
- •8.3.1. Критерій Фишера для порівняння дисперсій
- •8.3.2. Критерій Ст’юдента порівняння середніх
- •8.4 Основи регресійного й кореляційного аналізу
- •Додатки
- •Стандартні значення критерію t для малих вибірок (за Стьюдентом).
- •Значення χ2 (хі-квадрат), які відповідають різним рівням значимості та ступеням свободи
- •Стандартні значення критерію для дисперсійного аналізу (за н.А. Плохінським)
- •Критичні значення коефіцієнту асиметрії As
- •Критичні значення коефіцієнту ексцесу Ex
- •Критичні точки t-крітерію Ст’юдента
- •Критичні значення критерію u Манна-Уітні
- •Список рекомендованої літератури
- •Основи статистичного аналізу в екології
- •6.070800, 7.070801, 8.070801 — «Екологія та охорона навколишнього середовища»
8.3 Перевірка гіпотез про рівність дисперсій і математичних очікувань
8.3.1. Критерій Фишера для порівняння дисперсій
Використовується у випадку, якщо потрібно перевірити чи відрізняється розкид даних (дисперсії) двох вибірок. Для перевірки статистичної гіпотези про рівність дисперсій служить F- критерій Фішера. Основною характеристикою критерію є рівень значущості α, який має змісту ймовірності помилитися, припускаючи, що дисперсії й, отже, точність, різняться. Замість а в задачах також іноді задають довірчу ймовірність р = 1 – α, що має зміст імовірності того, що дисперсії й насправді рівні. Звичайно вибирають критичне значення рівня значимості, наприклад 0,05 або 0,1, і якщо α більше критичного значення, то дисперсії вважаються рівними, а якщо ні, то, різні. При цьому критерій може бути однобічним, коли потрібно перевірити, що дисперсія конкретної виділеної вибірки більше, чим в інший, і двостороннім, коли просто потрібно показати, що дисперсії не рівні. Існує два способи перевірки таких гіпотез. Розглянемо їх на прикладах.
Розбір вирішення задачі
Виміряна довжина передьної кінцівки в представників двох популяцій озерної жаби. Необхідно перевірити, можна чи з імовірністю не менш 0,95 вважати, що довжина кінцівок у них різна.
Популяція 1 |
47,5 |
52,9 |
51,3 |
48,1 |
52,6 |
49,4 |
48,0 |
52,3 |
45,9 |
52,6 |
46,8 |
49,0 |
Популяція 2 |
52.5 |
50,5 |
48,4 |
48,6 |
50,6 |
50,0 |
50,1 |
49,5 |
49,7 |
51,1 |
49,2 |
49,7 |
За умовою задачі критерій двосторонній, тому що потрібно перевірити відмінність дисперсій. Довірча ймовірність задана на рівні р=0,95, отже, рівень значущості α = l – p = 1 – 0,95 = 0,05 . Уводимо дані вибірок (без підписів) у два рядки в комірки A1-L1 і A2-L2 відповідно. Для обчислення рівня значущості двостороннього критерію служить функція ФТЕСТ(масив1;масив2). Уводимо в А4 підпис «Рівень значцщості», а в В4 функцію ФТЕСТ, аргументами якої повинні бути посилання на комірки A1-L1 і A2-L2 відповідно. Результат 0,011591293 говорить про те, що ймовірність помилитися, прийнявши гіпотезу про відмінність дисперсій, близько 0,01, що менше критичного значення, заданого в умові задачі 0,05. Отже, можна говорити що досвідчені дані з великою ймовірністю підтверджують припущення про те, що дисперсії різні й довга кінцівок в особин із двох популяцій озерної жаби різна.
Інший спосіб розв'язку задачі - використовувати надбудову «Аналіз даних» (Data Analysis). Для її підключення потрібно в меню «СЕРВІС» вибрати «НАДБУДОВИ» і поставити прапорець напроти «Пакет аналізу» (Analysis Toolpak). Після цього в меню «СЕРВІС» з'явиться пункт «АНАЛІЗ ДАНИХ» (Data Analysis). Викликавши його, відкриється вікно, у якім потрібно вибрати «Двухвивірковий F-Тест для дисперсій» (F-test Two-Sample for Variances). У вікні, що відкрилося, у полях «Інтервал змінної 1» (Variable 1 Range) і «Інтервал змінної 2» (Variable 1 Range) уводять посилання на дані (A1-L1 і А2- L2, відповідно), якщо є підписи даних, то ставлять прапорець у напису «Мітки» (Label) (у нас вони відсутні, тому прапорець не ставиться). Далі вводять рівень значимості в поле «Альфа» (Alpha) (по умови це 0,05, і дане значення вже зазначене за замовчуванням). У розділі «Параметри висновку» (Output Options) ставлять мітку близько «Вихідний інтервал» (Output Range) і помістивши курсор в, що з'явилося поле напроти напису, клацають лівою кнопкою в гнізді В7. Висновок результату буде здійснюватися починаючи із цього комірки. Нажавши на «ОК» з'являється таблиця результату. Зруште границю між стовпцями В и С, С и D, D і Е, збільшивши ширину стовпчиків В, С и D так, щоб уміщалися всі написи. У таблиці зазначені середні та дисперсії кожної вибірки, значення F-критерію, однобічний критичний рівень значимості в рядку «P(F<=f) однобічне» («P(F<=f) one-tail») і критичне значення F-критерію (F critical one tail). Якщо значення F- критерію ближче до одиниці, чому F-Критичне, то із заданою ймовірністю можна вважати, що дисперсії рівні. Про це ж говорить і те, що критичний рівень значимості «P(F<=f) однобічне» більше заданого значення а. У нашім випадку F-Критерій рівний 5,128330184 а F-Критичне 2,817927225, тобто F-Критерій далі від одиниці, чому критичне значення. Це говорить про те, що дисперсії різні й жаби із двох популяцій дійсно мають різну довжину передніх кінцівок.