- •6.070800, 7.070801, 8.070801 — «Екологія та охорона навколишнього середовища»
- •Тема 6. Дисперсійний аналіз 46
- •Тема 7. Непараметрична статистика 51
- •Тема 8. Використання табличного процессору Microsoft Excel для проведення статистичних розрахунків 63
- •Тема 1. Складання варіаційних рядів та їх графічне зображення.
- •Тема 2. Вирахування середньої арифметичної
- •2.1. Вирахування середньої арифметичної прямим способом у малих вибірках.
- •2.2. Обчислення середньої арифметичної у великих вибірках.
- •2.3. Вирахування середньої зваженої.
- •Тема 3. Показники різноманітності ознаки в сукупностях.
- •3.1. Вирахування середнього квадратичного відхилення в малих вибірках.
- •3.2. Вирахування середнього квадратичного відхилення великих вибірках.
- •3.4. Вирахування коефіцієнту варіації.
- •3.5. Вирахування нормованого відхилення.
- •Тема 4. Визначення зв’язку між ознаками
- •4.1 Обчислення коефіцієнту фенотипічної кореляції в малих вибірках.
- •4.2 Обчислення коефіцієнту фенотипічної кореляції у великих вибірках
- •Добові надої (х)‚ жива вага (у) корів
- •Розрахунок коефіцієнту кореляції між добовими надоями та живою вагою корів.
- •4.3 Обчислення коефіцієнту прямолінійної регресії
- •4.4 Обчислення коефіцієнту генетичної кореляції
- •Тема 5. Помилка репрезентативності. Оцінка достовірності вибіркових показників.
- •5.1 Обчислення допустимих границь для середньої арифметичної генеральної сукупності
- •Допустимі ймовірності (ймовірності безпомилкового прогнозу), відповідні їм значення та допустимі границі у великих вибірках *
- •5.2 Обчислення достовірності різниці між середніми арифметичними
- •5.3 Обчислення критерію відповідності.
- •Вирахування критерію χ2
- •5.3.1 Кількісний аналіз успадкування кольору тіла дрозофілами з використанням критерію відповідності
- •Статистична обробка отриманих результатів
- •5.3.2 Використання критерію відповідності при порівнянні двох емпіричних рядів.
- •5.3.3 Застосування критерію відповідності при визначенні достовірності між двома групами тварин
- •Тема 6. Дисперсійний аналіз
- •Приклад розрахунків при дисперсійному аналізі однофакторних комплексів для малих груп ( число ягнят у потомстві овець каракульської породи).
- •6.1 Визначення коефіцієнту спадкування в однофакторному комплексі
- •Тема 7. Непараметрична статистика
- •7.1 Перевірка гіпотез про закон розподілу. Застосування коефіцієнтів асиметрії та ексцесу для перевірки нормальності розподілу
- •7.2 Особливості представлення непараметичних даних
- •7.2.1 Мода та медіана
- •7.2.2 Довірчі імовірності та рівні значущості
- •7.2.3 Довірчій інтервал
- •7.3 Непараметричні критерії
- •Тема 8. Використання табличного процессору Microsoft Excel для проведення статистичних розрахунків
- •8.1 Точкове й інтервальне оцінювання параметрів розподілів
- •8.1.1. Точкове оцінювання
- •8.1.2. Інтервальне оцінювання
- •8.2 Перевірка статистичних гіпотез про вид розподілу
- •8.3 Перевірка гіпотез про рівність дисперсій і математичних очікувань
- •8.3.1. Критерій Фишера для порівняння дисперсій
- •8.3.2. Критерій Ст’юдента порівняння середніх
- •8.4 Основи регресійного й кореляційного аналізу
- •Додатки
- •Стандартні значення критерію t для малих вибірок (за Стьюдентом).
- •Значення χ2 (хі-квадрат), які відповідають різним рівням значимості та ступеням свободи
- •Стандартні значення критерію для дисперсійного аналізу (за н.А. Плохінським)
- •Критичні значення коефіцієнту асиметрії As
- •Критичні значення коефіцієнту ексцесу Ex
- •Критичні точки t-крітерію Ст’юдента
- •Критичні значення критерію u Манна-Уітні
- •Список рекомендованої літератури
- •Основи статистичного аналізу в екології
- •6.070800, 7.070801, 8.070801 — «Екологія та охорона навколишнього середовища»
7.2 Особливості представлення непараметичних даних
Якщо дані не є нормально розподіленими, а вимірювання, в кращому випадку, містять ранжовану інформацію, то обчислення звичайних описових статистик (наприклад, середнього, стандартного відхилення) не надто інформативно. Наприклад, в психометрії добре відомо, інтенсивність стимулів, що сприймаються (наприклад, яскравість світла) являє собою логарифмічну функцію реальної інтенсивності (яскравості, виміряної в об'єктивних одиницях - люксах). У даному прикладі, звичайна оцінка середнього (сума значень, поділена на число стимулів) не дає вірного уявлення про середнє значення дійсної інтенсивності стимулу. Тому для представлення центральної тенденції не нормально розподілених даних використовують такі статистичні показники як, медіану та моду, а для представлення розсіювання — дисперсію та довірчій інтервал, що дозволяє уявити більш "повну картину" даних.
7.2.1 Мода та медіана
Мода (Мо) - це варіанта, яка найчастіше зустрічається у досліджуваній сукупності. Мода не залежить від крайніх значень варіант і може застосовується для характеристики центру в рядах розподілу з невизначеними межами.
У дискретному варіаційному ряду мода визначається візуально і дорівнює варіанті з найбільшою частотою.
В інтервальних рядах розподілу для знаходження моди спочатку по найбільшої частоті визначають модальний інтервал, тобто інтервал, що містить моду, а потім приблизно розраховують її за формулою:
|
(44) |
де XMo - нижня межа модального інтервалу;
hMo - величина модального інтервалу;
fMo-1, fMo+1 - частоти відповідно в попередньому і наступним за
модальним інтервалах.
Зустрічаються ряди, які мають дві моди (бімодальний ряд) або декілька (полімодальний).
Медіаною (Ме) називають таке значення ознаки, яке припадає на середину рангового ряду і ділить його на дві рівні за кількістю одиниць частини. Таким чином, в ранжированном ряду розподілу одна половина ряду має значення ознаки, що перевищують медіану, інша - менше медіани.
Медіану використовують замість середньої арифметичної, коли крайні варіанти ранжированного ряду (найменша і найбільша) в порівнянні з іншими виявляються надмірно великими або надмірно малими.
У дискретному варіаційному ряду, що містить непарне число одиниць, медіана дорівнює варіанті ознаки, що має номер (N+1)/2:
|
(45) |
де N - число одиниць сукупності.
У дискретному ряду, що складається з парного числа одиниць сукупності, медіана визначається як середня з варіант, що мають номери N/2 та (N+1)/2:
|
(46) |
При обчисленні медіани в інтервальному ряду спочатку знаходять медіанний інтервал, (тобто містить медіану), для чого використовують накопичені частоти. Медіанним є інтервал, накопичена частота якого дорівнює або перевищує половину всього обсягу сукупності. Потім значення медіани розраховується за формулою:
|
(47) |
де xн - нижня межа медіанного інтервалу;
Σfi - накопичена частота інтервалу, що передує медіанному;
fMe - частота медіанного класу;
λ - величина класового інтервалу;
n - загальна кількість спостережень.
Розбір вирішення задач
На основі підрахунку кількості хвостових щитків у 60 змій Lampropeltis getulus був побудований наступний варіаційний ряд. Знайти моду.
Класи |
Частоти (f) |
Накопичені частоти (S) |
40–42 |
8 |
8 |
43–45 |
14 |
22 |
46–48 |
20 |
42 |
49–51 |
9 |
51 |
52–54 |
1 |
52 |
55–57 |
1 |
53 |
58–60 |
1 |
54 |
|
n = 60 |
|
Для ряду розподілу змій по числу хвостових щитків модальним є клас «46-48 щитків». А так як клас тут охоплює кілька значень варіант, то для його характеристики треба обчислити середнє значення класу. Воно дорівнює (46+48)/2 = 47. У такому випадку Мо = 47 щитків.
У 100 особин мавп був виміряний вміст кальцію в сироватці крові (мг %) на підставі чого був складений варіаційний ряд. Завдання полягає в тому, щоб знайти медіану.
Класи за вмістом кальцію в сироватці крові |
Серединні значення класів |
Частоти |
Накопичені частоти |
8,6–9,3 |
9,0 |
2 |
2 |
9,4–10,1 |
9,8 |
6 |
8 |
10,2–10,9 |
10,6 |
15 |
23 |
11,0–11,7 |
11,4 |
23 |
46 |
11,8–12,5 |
12,2 |
25 |
71 |
12,6–13,3 |
13,0 |
17 |
|
13,4–14,1 |
13,8 |
7 |
|
14,2–14,9 |
14,6 |
5 |
|
Сумма |
|
100 |
|
В даному випадку n/2 = 100/2 = 50. Ця величина більше Σfi = 46, але менше Σfi = 71. За Σfi = 71 визначаємо інтервал, в якому знаходиться медіана. Межі цього інтервалу: нижня хН = 11,8 і верхня хв = 12,5; його частота fMe = 25. Класовий інтервал λ = 0,8. Підставляючи ці величини в формулу (47) знаходимо:
Таким чином Ме = 11,93.