- •6.070800, 7.070801, 8.070801 — «Екологія та охорона навколишнього середовища»
- •Тема 6. Дисперсійний аналіз 46
- •Тема 7. Непараметрична статистика 51
- •Тема 8. Використання табличного процессору Microsoft Excel для проведення статистичних розрахунків 63
- •Тема 1. Складання варіаційних рядів та їх графічне зображення.
- •Тема 2. Вирахування середньої арифметичної
- •2.1. Вирахування середньої арифметичної прямим способом у малих вибірках.
- •2.2. Обчислення середньої арифметичної у великих вибірках.
- •2.3. Вирахування середньої зваженої.
- •Тема 3. Показники різноманітності ознаки в сукупностях.
- •3.1. Вирахування середнього квадратичного відхилення в малих вибірках.
- •3.2. Вирахування середнього квадратичного відхилення великих вибірках.
- •3.4. Вирахування коефіцієнту варіації.
- •3.5. Вирахування нормованого відхилення.
- •Тема 4. Визначення зв’язку між ознаками
- •4.1 Обчислення коефіцієнту фенотипічної кореляції в малих вибірках.
- •4.2 Обчислення коефіцієнту фенотипічної кореляції у великих вибірках
- •Добові надої (х)‚ жива вага (у) корів
- •Розрахунок коефіцієнту кореляції між добовими надоями та живою вагою корів.
- •4.3 Обчислення коефіцієнту прямолінійної регресії
- •4.4 Обчислення коефіцієнту генетичної кореляції
- •Тема 5. Помилка репрезентативності. Оцінка достовірності вибіркових показників.
- •5.1 Обчислення допустимих границь для середньої арифметичної генеральної сукупності
- •Допустимі ймовірності (ймовірності безпомилкового прогнозу), відповідні їм значення та допустимі границі у великих вибірках *
- •5.2 Обчислення достовірності різниці між середніми арифметичними
- •5.3 Обчислення критерію відповідності.
- •Вирахування критерію χ2
- •5.3.1 Кількісний аналіз успадкування кольору тіла дрозофілами з використанням критерію відповідності
- •Статистична обробка отриманих результатів
- •5.3.2 Використання критерію відповідності при порівнянні двох емпіричних рядів.
- •5.3.3 Застосування критерію відповідності при визначенні достовірності між двома групами тварин
- •Тема 6. Дисперсійний аналіз
- •Приклад розрахунків при дисперсійному аналізі однофакторних комплексів для малих груп ( число ягнят у потомстві овець каракульської породи).
- •6.1 Визначення коефіцієнту спадкування в однофакторному комплексі
- •Тема 7. Непараметрична статистика
- •7.1 Перевірка гіпотез про закон розподілу. Застосування коефіцієнтів асиметрії та ексцесу для перевірки нормальності розподілу
- •7.2 Особливості представлення непараметичних даних
- •7.2.1 Мода та медіана
- •7.2.2 Довірчі імовірності та рівні значущості
- •7.2.3 Довірчій інтервал
- •7.3 Непараметричні критерії
- •Тема 8. Використання табличного процессору Microsoft Excel для проведення статистичних розрахунків
- •8.1 Точкове й інтервальне оцінювання параметрів розподілів
- •8.1.1. Точкове оцінювання
- •8.1.2. Інтервальне оцінювання
- •8.2 Перевірка статистичних гіпотез про вид розподілу
- •8.3 Перевірка гіпотез про рівність дисперсій і математичних очікувань
- •8.3.1. Критерій Фишера для порівняння дисперсій
- •8.3.2. Критерій Ст’юдента порівняння середніх
- •8.4 Основи регресійного й кореляційного аналізу
- •Додатки
- •Стандартні значення критерію t для малих вибірок (за Стьюдентом).
- •Значення χ2 (хі-квадрат), які відповідають різним рівням значимості та ступеням свободи
- •Стандартні значення критерію для дисперсійного аналізу (за н.А. Плохінським)
- •Критичні значення коефіцієнту асиметрії As
- •Критичні значення коефіцієнту ексцесу Ex
- •Критичні точки t-крітерію Ст’юдента
- •Критичні значення критерію u Манна-Уітні
- •Список рекомендованої літератури
- •Основи статистичного аналізу в екології
- •6.070800, 7.070801, 8.070801 — «Екологія та охорона навколишнього середовища»
Тема 1. Складання варіаційних рядів та їх графічне зображення.
При вивченні сукупності корів за добовим надоєм складена така вибірка чисельність 100 голів (об’єм вибірки n=100).
21,9 |
21,4 |
27,7 |
17,0 |
12,3 |
21,7 |
23,4 |
25,7 |
21,2 |
20,3 |
23,8 |
24,1 |
26,9 |
21,4 |
20,7 |
18,5 |
22,5 |
23,0 |
18,5 |
25,7 |
20,1 |
21,3 |
15,7 |
24,8 |
19,3 |
22,2 |
27,9 |
14,9 |
26,1 |
20,6 |
14,6 |
27,8 |
22,4 |
16,7 |
22,9 |
25,3 |
22,7 |
19,7 |
15,2 |
21,3 |
22,1 |
20,5 |
19,7 |
24,5 |
29,6 |
23,3 |
19,1 |
23,5 |
25,9 |
17,2 |
15,5 |
18,1 |
23,9 |
25,4 |
20,4 |
13,2 |
19,6 |
24,4 |
18,2 |
24,8 |
24,2 |
20,9 |
20,1 |
16,5 |
20,9 |
23,2 |
27,2 |
21,1 |
26,3 |
18,6 |
17,2 |
17,8 |
25,0 |
31,2 |
20,7 |
18,3 |
23,7 |
16,1 |
16,2 |
21,6 |
23,0 |
20,7 |
25,3 |
23,9 |
17,3 |
21,8 |
14,1 |
19,0 |
21,9 |
18,77 |
25,8 |
21,2 |
19,9 |
24,8 |
22,7 |
16,4 |
20,6 |
23,5 |
22,2 |
19,5 |
При вирахуванні середньої арифметичної непрямим способом необхідно групувати результати вимірів і складати варіаційний ряд.
Щоб побудувати варіаційний ряд перш за все треба знайти ліміти, тобто мінімальні та максимальні значення варіант. У наведеній вибірці вони виділені. У даному випадку мінімальна варіанта Хmin – 12,3 кг, максимальна Хmax – 31,2 кг.
Для складання варіаційного ряду потрібно знайти величину класного проміжку, що визначається таким чином:
Кількість класів визначають у залежності від ступеня точності, з якою ведеться обробка, і кількості об’єктів в виборці. Вважається зручним при виборці в межах від 30 до 60 варіант розподіляти їх на 6 - 8 класів, при виборці від 60 до 100 варіант – на 7 - 8 класів, при виборці від 100 і більше варіант – на 9 - 17 класів. У нашому прикладі вибрано 10 класів. Звідси:
У даному випадку величина класного проміжку видалась дробною, що незручно при розрахунках. Зручно округлити її до цілого числа і отримаємо k=2.
Округлюють для зручності часто і недробну величину класного проміжку. Наприклад, при обробці живої ваги тварин k видалась 17 кг; цю величину зручніше округлити до 15 або до 20 кг. Класний проміжок по надою за лактацію, рівний 939 кг, можна округлити до 1000 кг. Таке округлення може впливати на кількість класів: при збільшенні величини класного проміжку кількість класів може зменшитись, а при її зменшенні - збільшуватись.
Класи складають таким чином: мінімальну величину – х min, що дорівнює в нашому прикладі 12,3, треба округлити до найближчого найменшого круглого числа 12, яке буде служити нижньою границею першого класу. Додавши до неї величину класного проміжку 2 , знаходимо нижню границю другого класу 14. Таким же чином знаходимо нижні границі наступних класів: 12, 14, 16, 18, 20 тощо.Щоб варіанта не потрапила на границю між двома класами, умовно позначають, до якого класу відноситься погранична величина. З цією метою зменшують верхню межу кожного класу на величину рівну 0,1 точності виміру ознаки. Зменшивши верхні границі на 0,1 кг, отримаємо границі першого класу 12,0-13,9; другого 14,0-15,9 і т.д. потім треба визначити середини класів (W). Вони будуть дорівнювати напівсумі нижніх границь даного та наступного класів:
Встановивши границі класів, приступають до розноски варіант за класами, для чого складають таблицю з чотирьох граф і числа з рядків, рівного числу класів. У першу чергу вписують границі класів, у другу – середини класів, третя служить для розноски варіант, а в четвертій дані розноски сумують для встановлення кількості варіант у кожному класі. Число варіант в класі називають частотами і позначають символом f.
З метою розноски почергово читають кожну варіанту і відмічають її в графі “розноска”, в рядку відповідного класу за допомогою точок та тире так:
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
● ● ● ● |
● ● ● ● |
● ● ● ● |
● ● ● ● |
● ● ● ● |
● ● ● ● |
● ● ● ● |
● ● ● ● |
● ● ● ● |
● ● ● ● |
Розноска за класами даних добового надою корів наведена в таблиці 1. Таблиця 1
Розноска за класами добових надоїв 100 корів господарства
Границі класів |
Середина класів W |
Розноска |
Частоти, f |
||
12,3-13,9 |
13 |
● ● ● ● |
|
|
3 |
14,0-15,9 |
15 |
● ● ● ● |
|
|
6 |
16,0-17,9 |
17 |
● ● ● ● |
|
|
10 |
18,0-19,9 |
19 |
● ● ● ● |
|
|
15 |
20,0-21,9 |
21 |
● ● ● ● |
● ● ● ● |
● ● ● ● |
24 |
22,0-23,9 |
23 |
● ● ● ● |
● ● ● ● |
|
19 |
24,0-25,9 |
25 |
● ● ● ● |
● ● ● ● |
|
14 |
26,0-27,9 |
27 |
● ● ● ● |
|
|
6 |
28,0-29,9 |
29 |
● ● ● ● |
|
|
2 |
30,0-31,9 |
31 |
● ● ● ● |
|
|
1 |
∑f=n=100 |
Щоб перевірити, чи не пропущені при цій розносці окремі варіанти, треба підсумувати всі показники графи “Частоти”. Їх сума повинна дорівнювати загальному числу варіант у вибірці n. У нашому випадку ∑f=n=100.
Подвійний ряд цифр, що відображає розподіл варіант за класами, називають варіаційним рядом. У розібраному вище прикладі варіаційний ряд можна записати так:
W |
13 |
15 |
17 |
19 |
21 |
23 |
25 |
27 |
29 |
31 |
f |
3 |
6 |
10 |
15 |
24 |
19 |
14 |
6 |
2 |
1 |
Розглянемо другий приклад. На звірофермі була вивчена плодовитість 80 сріблясто-чорних лисиць, що визначалась за кількістю щенят у виводку окремих самиць. На основі цих даних складена така вибірка:
Число щенят у виводку 80 сріблясто-чорних лисиць
4 |
5 |
3 |
4 |
6 |
7 |
8 |
3 |
1 |
4 |
6 |
4 |
4 |
3 |
2 |
5 |
3 |
4 |
5 |
4 |
5 |
3 |
4 |
5 |
4 |
4 |
4 |
6 |
5 |
7 |
6 |
4 |
5 |
4 |
4 |
4 |
4 |
2 |
3 |
4 |
5 |
5 |
4 |
4 |
4 |
6 |
4 |
5 |
4 |
4 |
4 |
8 |
6 |
5 |
4 |
9 |
4 |
3 |
4 |
4 |
5 |
4 |
7 |
4 |
4 |
3 |
4 |
4 |
4 |
2 |
4 |
4 |
5 |
6 |
4 |
3 |
3 |
4 |
2 |
4 |
Загальне число варіант n=80. Мінімальні і максимальні значення варіант lim=9 та lim=1. В даному випадку дуже легко встановити число класів та їх значення. До першого класу повинні бути віднесені лисиці, у виводку яких було одне щеня, до другого класу – лисиці з двома щенятами у виводку і т.д., усього 9 класів.
Зробимо розноску варіант за класами тим же способом, що був застосований у попередньому випадку. Тоді отримаємо варіаційний ряд:
Класи за чисельністю щенят у виводку |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
Число виводків |
1 |
4 |
10 |
39 |
13 |
7 |
3 |
2 |
1 |
Відмітимо суттєву різницю між двома розглянутими варіантами (варіаційний ряд розподілу корів за величиною добового надою і варіаційний ряд розподілу лисиць за числом щенят у виводку). В першому випадку варіанта (добовий надій) може приймати будь-які значення між лімітами, тобто окрему варіанту в залежності від точності вимірювання можна записати, наприклад, як 19 кг, або при великій точності 19,1 або 19,2. Ознака, яку вивчають, варіює безперервно. У другому випадку ознака змінюється переривчасто (дискретно), тобто число щенят у посліді окремої самиці може бути тільки цілим числом.
Варіаційні ряди можна зображати графічно або у вигляді лінійної кривої (гістограма або полігон розподілу відповідно). Для цього, використовуючи систему координат, будуємо графік: на горизонтальній осі (ординат) відкладаємо границі класів, а на вертикальній – частоти. Зобразимо частоти кожного класу у вигляді стовпчиків, отримаємо ступінчасту фігуру – гістограму (рис. 1.). У другому випадку на перехресті перпендикулярів, відновлених з максимальним значенням класів, ставлять точки, що потім поєднують ламаною лінією–отримують полігон розподілу (рис. 2).
Рис. 1. Графічне зображення варіаційного ряду. Гістограма розподілу 100 корів за добовим надоєм
Рис. 2. Графічне зображення варіаційного ряду. Лінійна крива розподілу 80 сріблясто-бурих лисиць за плодовитістю.