- •Г усак в.В., Господарьов д.В., Лущак в.І. Статистика в біології: обробка даних малих вибірок
- •Розділ 1. Сукупність, вибірка і типи даних
- •1.1. Генеральні та вибіркові сукупності
- •1.2. Уявлення про малу вибірку
- •1.3. Типи даних
- •1.4. Структура даних
- •1.5. Заокруглення даних
- •Розділ 2. Показники варіації
- •2.1. Середні величини та медіана
- •2.2. Стандартне відхилення, дисперсія та коефіцієнт варіації
- •2.3. Варіація і розподіл
- •Розділ 3. Похибки оцінювання параметрів вибірки
- •3.1. Помилка середньої арифметичної величини
- •3.2. Довірчий інтервал
- •3.3. Неузгодженості у записах при використанні стандартної похибки середнього
- •Розділ 4. Аналіз даних, які випадають в ході досліджень (промахи і систематичні похибки)
- •4.1. Критерій Шовене
- •4.3. Критерій Романовського
- •4.4. Критерій Ірвіна
- •4.5. Критерій Аббе
- •Розділ 5. Перевірка вибірки на нормальність розподілу даних
- •5.1. Загальні уявлення про критерії перевірки вибірки на нормальний розподіл даних
- •5.2. Складовий критерій d
- •5.3. Статистичний критерій w (критерій Шапіро-Уілка)
- •5.4. Коефіцієнт асиметрії та ексцесу
- •Асиметрії та ексцесу
- •1. Первинні дані та допоміжні величини оформлюємо у вигляді таблиці:
- •6.1. Вибір статистичного критерію
- •6.2. Порівняння двох груп між собою
- •6.2.1. Непарний та парний критерії Стьюдента
- •6.2.2. Тест Уелча як модифікація тесту Стьюдента та u-критерій Манна-Уітні як непараметричний аналог непарного критерію Стьюдента
- •6.3. Порівняння трьох і більше груп між собою: доцільність використання параметричних чи непараметричних критеріїв
- •6.3.1. Критерій Ньюмена-Коулса
- •6.3.2. Критерій Даннета: порівняння декількох груп з контрольною
- •6.3.3. Непараметричний критерій Данна для порівняння декількох груп між собою
- •Розділ 7. Взаємозв'язки між групами: кореляційно-регресійний аналіз
- •7.1. Кореляційний аналіз
- •7.2. Парний регресійний аналіз
- •1.1. Рівняння лінійної регресії
- •1.2. Лінійне рівняння з логарифмуванням факторної ознаки (напівлогарифмічне)
- •1.3. Рівняння гіперболічної регресії
- •1.4. Показникове рівняння кривої
- •Розділ 8. Програми для статистичної обробки даних
- •Узагальнення
- •Рекомендована література
- •Тлумачний словник термінів
3.3. Неузгодженості у записах при використанні стандартної похибки середнього
Дуже часто в статтях і дисертаціях зустрічається запис «M ± m», який, як припускається, пояснює тип представлення даних. Автори під M розуміють середню арифметичну величину, а під m – стандартну похибку середнього. Втім, якщо немає деталізації, то лишається не зрозумілим, що саме дослідник вкладає у символи M та m. Для того, щоб запис не залишав сумнівів, ми рекомендуємо в публікаціях давати повне пояснення на кшталт «Всі значення представлені у вигляді середньої ± стандартне відхилення» (у англомовній літературі Mean ± Standart Deviation (M ± S.D.)) чи «Вибіркові характеристики представлені у вигляді середньої ± помилка середньої». (у англомовній літетарурі Mean ± Standart Error of Mean (M ± S.E.M. або M ± S.E.)).
Розділ 4. Аналіз даних, які випадають в ході досліджень (промахи і систематичні похибки)
Значення, які потрапляють у вибірку, можуть дуже істотно відрізнятись за величиною (неоднорідні дані). Візьмемо наш приклад зі зростом 992 осіб. Вибірка може виглядати по-різному: може включати осіб зі зростом 145, 147, 154 та 199 см, або 145, 165, 181 та 193 см. Звичайно, що у першій вибірці значення 199 см виглядає сумнівним, але зрозуміло, що помилку у вимірюванні зросту важко допустити. В таких випадках кажуть, що вибірка не є репрезентативною, тобто якимось чином у неї потрапили тільки люди низького росту.
Коли дослідник отримує неоднорідні дані, то завжди перед ним стоїть питання: які ж дані слід брати до уваги – одні чи інші? В такому випадку часто самовільно викидаються ті дані, які дослідник вважає невдалими – занадто великими, чи занадто малими, тобто малоправдоподібними. Але такий підхід є неправильним і часто приводить до хибності отриманих результатів.
Щоб таких помилок не було треба скористатись статистичними критеріями. Розглянемо деякі із них.
4.1. Критерій Шовене
Цей
критерій для виключення промахів є
досить простим. Для його обчислення,
крім значень
і
s,
потрібно знайти величину коефіцієнта
u
(різниця
між найбільшою (або найменшою) варіантою
і середнім арифметичним, поділена на
стандартне відхилення):
(18)
або
(19)
Після цього обчислення отриманий коефіцієнт співставляють з критичним значенням uкр для n значень. Якщо u≥uкр, то це значення виключають із подальших обрахунків. Величини uкр наведені в таблиці 2.
Таблиця 2. Величини коефіцієнта uкр
n |
uкр |
n |
uкр |
n |
uкр |
3 |
1,61 |
10 |
1,96 |
17 |
2,19 |
4 |
1,64 |
11 |
2,00 |
18 |
2,20 |
5 |
1,68 |
12 |
2,03 |
20 |
2,24 |
6 |
1,73 |
13 |
2,07 |
22 |
2,28 |
7 |
1,79 |
14 |
2,10 |
24 |
2,31 |
8 |
1,86 |
15 |
2,13 |
26 |
2,36 |
9 |
1,92 |
16 |
2,16 |
30 |
2,39 |
Якщо у
варіаційному ряді є декілька величин,
що різко відрізняються від інших, то
можна застосовувати інший підхід. За
наведеною вище таблицею залежно від
числа варіант визначають uкр
і
обчислюють
та
.
Якщо значення, яке вважають ймовірним
промахом, не входить в інтервал цих
обчислень, воно дійсно є промахом і
відкидається.
Приклад 13. Використавши критерій Шовене, перевіримо наступні дані: 14,8; 14,2; 14,8; 33,6; 14,1 на наявність промахів.
і s для цієї вибірки будуть дорівнювати, відповідно, 18,3 і 8,6.
Оскільки кількість варіант дорівнює 5, то, використовуючи таблицю 2, отримаємо uкр = 1,68. Далі обчислюємо:
=
18,3+8,6×1,68=32,7
Оскільки 33,6>32,7, то значення варіанти 33,6 є промахом його виключається з наступних обчислень. Тобто, заново обчислюють і s і в кінцевому варіанті як характеристики вибірки використовують обчислені заново параметри.
4.2. Q-критерій Діксона
При його використанні отримані результати вимірювань записують у варіаційний ряд за збільшенням:
(x1<x2<…<xn)
Даний критерій визначається як:
(для
мінімального значення)
(20)
або
(для
максимального значення)
(21).
Проте розрахунок за цими формулами буде коректним тільки для n=3-7. При n=8-10 в знаменнику повинна стояти різниця між вірогідним промахом і значенням, найближчим до максимального (або мінімального) значення:
(для
мінімального значення)
(22);
(для
максимального значення)
(23).
Значення Q порівнюють з критичним значенням критерію, наведеним у таблиці 3. Якщо критичне значення менше дослідного, то вірогідний промах є істинним. При цьому як рівень статистичної значущості p беруть 0,10, а не 0,05. Зазвичай на промахи перевіряють мінімальне і максимальне значення. Після відкидання промахів знову повторюють обчислення.
Таблиця 3. Критичні значення Qкр при різних рівнях статистичної значущості p і числі вимірювань n
n |
Рівень статистичної значущості p |
||
0,10 |
0,05 |
0,01 |
|
3 |
0,941 |
0,970 |
0,994 |
4 |
0,765 |
0,829 |
0,926 |
5 |
0,642 |
0,710 |
0,821 |
6 |
0,560 |
0,625 |
0,740 |
7 |
0,507 |
0,568 |
0,680 |
8 |
0,468 |
0,526 |
0,634 |
9 |
0,437 |
0,493 |
0,598 |
10 |
0,412 |
0,466 |
0,568 |
Приклад 14. Використавши критерій Діксона, перевіримо на наявність промахів наступні дані: 14,8; 14,2; 14,8; 33,6; 14,1. і s для цієї вибірки будуть дорівнювати, відповідно, 18,3 і 8,6.
1) із поданих даних формуємо варіаційний ряд:
14,1; 14,2; 14,8; 14,8; 33,6
2) за формулою (23) обчислюємо Q:
Порівнюючи Q, яке ми отримали в результаті обчислень (0,964), з критичним значенням Qкр (0,642) при n=5 і рівні статистичної значущості p<0,10 (таблиця 3), значення 33,6 є промахом.
