- •Г усак в.В., Господарьов д.В., Лущак в.І. Статистика в біології: обробка даних малих вибірок
- •Розділ 1. Сукупність, вибірка і типи даних
- •1.1. Генеральні та вибіркові сукупності
- •1.2. Уявлення про малу вибірку
- •1.3. Типи даних
- •1.4. Структура даних
- •1.5. Заокруглення даних
- •Розділ 2. Показники варіації
- •2.1. Середні величини та медіана
- •2.2. Стандартне відхилення, дисперсія та коефіцієнт варіації
- •2.3. Варіація і розподіл
- •Розділ 3. Похибки оцінювання параметрів вибірки
- •3.1. Помилка середньої арифметичної величини
- •3.2. Довірчий інтервал
- •3.3. Неузгодженості у записах при використанні стандартної похибки середнього
- •Розділ 4. Аналіз даних, які випадають в ході досліджень (промахи і систематичні похибки)
- •4.1. Критерій Шовене
- •4.3. Критерій Романовського
- •4.4. Критерій Ірвіна
- •4.5. Критерій Аббе
- •Розділ 5. Перевірка вибірки на нормальність розподілу даних
- •5.1. Загальні уявлення про критерії перевірки вибірки на нормальний розподіл даних
- •5.2. Складовий критерій d
- •5.3. Статистичний критерій w (критерій Шапіро-Уілка)
- •5.4. Коефіцієнт асиметрії та ексцесу
- •Асиметрії та ексцесу
- •1. Первинні дані та допоміжні величини оформлюємо у вигляді таблиці:
- •6.1. Вибір статистичного критерію
- •6.2. Порівняння двох груп між собою
- •6.2.1. Непарний та парний критерії Стьюдента
- •6.2.2. Тест Уелча як модифікація тесту Стьюдента та u-критерій Манна-Уітні як непараметричний аналог непарного критерію Стьюдента
- •6.3. Порівняння трьох і більше груп між собою: доцільність використання параметричних чи непараметричних критеріїв
- •6.3.1. Критерій Ньюмена-Коулса
- •6.3.2. Критерій Даннета: порівняння декількох груп з контрольною
- •6.3.3. Непараметричний критерій Данна для порівняння декількох груп між собою
- •Розділ 7. Взаємозв'язки між групами: кореляційно-регресійний аналіз
- •7.1. Кореляційний аналіз
- •7.2. Парний регресійний аналіз
- •1.1. Рівняння лінійної регресії
- •1.2. Лінійне рівняння з логарифмуванням факторної ознаки (напівлогарифмічне)
- •1.3. Рівняння гіперболічної регресії
- •1.4. Показникове рівняння кривої
- •Розділ 8. Програми для статистичної обробки даних
- •Узагальнення
- •Рекомендована література
- •Тлумачний словник термінів
6.3.3. Непараметричний критерій Данна для порівняння декількох груп між собою
Як аналог до вищевказаних параметричних критеріїв (Ньюмена-Коулса, Тюкі та Даннета) можна використати непараметричний критерій Данна (Dunn's test). Чому ми зупинились саме на цьому критерії? Перш за все це пов’язано із тим, що його можна використовувати для порівняння вибірок як рівного, так і різного об’єму, а також порівнювати контрольну групу із дослідними, що є досить зручним.
Критерій Данна визначається за формулою:
(68)
де
і
–
середні
ранги двох вибірок, що порівнюються
(
).
Для обчислення середнього рангу значення
порівнюваних вибірок об’єднуються в
один ряд і розміщуються від меншого до
більшого в порядку зростання; найменше
значення буде мати ранг 1. Потім отримані
ранги вже сумуються окремо для кожної
вибірки і діляться на кількість значень
у вибірці.
nA і nB – об’єми вибірок, що порівнюються;
Ri – це ранг будь-якого значення в об’єднаному ряді даних, які порівнюються;
N – загальний об’єм всіх вибірок, що порівнюються.
Критичне значення Qкр наведені в таблиці 21. Порівняння вибірок проводиться за таким самим алгоритмом, як це робиться при використанні критерію Ньюмена-Коулса. Якщо Q>Qкр, то групи даних достовірно відрізняються між собою при вибраному рівні статистичної значущості p.
Таблиця 21. Критичні значення Qкр для попарного порівняння груп
Кількість вибірок, які порівнюються k |
Рівень статистичної значущості p |
|
0,05 |
0,01 |
|
2 |
1,960 |
2,576 |
3 |
2,394 |
2,936 |
4 |
2,639 |
3,144 |
5 |
2,807 |
3,291 |
6 |
2,936 |
3,403 |
7 |
3,038 |
3,494 |
8 |
3,124 |
3,570 |
9 |
3,197 |
3,635 |
10 |
3,261 |
3,692 |
11 |
3,317 |
3,743 |
12 |
3,368 |
3,789 |
13 |
3,414 |
3,830 |
14 |
3,456 |
3,868 |
15 |
3,494 |
3,902 |
При порівнянні дослідної групи із контрольною формула для Q залишається незмінною, тільки критичне значення Qкр потрібно взяти із таблиці 22.
Таблиця 22. Критичні значення Qкр для порівняння з контрольною групою
Кількість вибірок, які порівнюються k |
Рівень статистичної значущості p |
|
0,05 |
0,01 |
|
2 |
1,960 |
2,576 |
3 |
2,242 |
2,807 |
4 |
2,394 |
2,936 |
5 |
2,498 |
3,024 |
6 |
2,576 |
3,091 |
7 |
2,639 |
3,144 |
8 |
2,690 |
3,189 |
9 |
2,735 |
3,227 |
10 |
2,773 |
3,261 |
11 |
2,807 |
3,291 |
12 |
2,838 |
3,317 |
13 |
2,866 |
3,342 |
14 |
2,891 |
3,364 |
15 |
2,914 |
3,384 |
Приклад 25. Порівняємо дані з прикладу 23 за критерієм Данна порівняємо дослідні групи між собою і з контрольною групою.
1. Початкові дані оформлюємо у вигляді таблиці:
Показник |
Контроль |
10 мг/л Ni2+ |
25 мг/л Ni2+ |
50 мг/л Ni2+ |
||||
АСОД, Од/мг білка |
Ранг |
АСОД, Од/мг білка |
Ранг |
АСОД, Од/мг білка |
Ранг |
АСОД, Од/мг білка |
Ранг |
|
xi (Ri) |
51,6 |
10 |
68,5 |
15 |
55,8 |
11 |
41,4 |
3,5 |
48,2 |
9 |
78,5 |
21 |
41,4 |
3,5 |
43,7 |
7 |
|
69,4 |
16 |
78,2 |
20 |
56,2 |
12 |
37,9 |
2 |
|
104 |
24 |
74,5 |
18 |
65,8 |
14 |
42,4 |
6 |
|
92,0 |
23 |
76,7 |
19 |
42,0 |
5 |
27,3 |
1 |
|
87,9 |
22 |
74,1 |
17 |
60,0 |
13 |
46,4 |
8 |
|
|
104 |
110 |
58,5 |
27,5 |
||||
|
17,3 |
18,3 |
9,75 |
4,58 |
||||
n |
6 |
6 |
6 |
6 |
||||
N |
24 |
|||||||
2.1. За формулою (67), порівнюючи контрольну групу із тією групою, яка найбільш від неї відрізняється (в даному випадку з групою риб, які перебували у воді з концентрацією йонів нікелю 50 мг/л Ni2+), обчислюємо Q:
2.2. При рівні статистичної значущості p<0,05 та кількості вибірок k=4, Qкр=2,394 (таблиця 22).
2.3. Умова Q>Qкр виконується, оскільки 3,116>2,394. Тому групи даних: «Контроль» і «50 мг/л Ni2+» достовірно між собою відрізняються при p<0,05.
3.1. Порівнюємо між собою групи даних: «Контроль» і «25 мг/л Ni2+»:
3.2. Умова Q>Qкр не виконується, оскільки 1,850<2,394. Тому групи даних: «Контроль» і «25 мг/л Ni2+» між собою не відрізняються, а, отже, не відрізняються між собою також і групи даних: «Контроль» та «10 мг/л Ni2+».
4.1. Порівнюємо між собою групи даних: «10 мг/л Ni2+» і «50 мг/л Ni2+»:
4.2. Умова Q>Qкр виконується, оскільки 3,361>2,394. Тому групи даних: «10 мг/л Ni2+» і «50 мг/л Ni2+» достовірно між собою відрізняються при p<0,05.
5.1. Порівнюємо між собою групи даних: «10 мг/л Ni2+» і «25 мг/л Ni2+»:
5.2. Умова Q>Qкр не виконується, оскільки 2,095<2,394. Тому групи даних: «10 мг/л Ni2+» і «25 мг/л Ni2+» між собою статистично не відрізняються.
6.1. Порівнюємо між собою групи даних: «25 мг/л Ni2+» і «50 мг/л Ni2+»:
6.2. Умова Q>Qкр не виконується, оскільки 1,266<2,394. Тому групи даних: «25 мг/л Ni2+» і «50 мг/л Ni2+» між собою статистично не відрізняються.
Висновки. Результати обчислень за непараметричним критерієм Данна (приклад 25) повністю відтворили результати обчислень за параметричним критерієм Стьюдента-Ньюмена-Коулса (приклад 23). Тому ми також рекомендуємо використання непараметричного критерію Данна для порівняння груп даних з малим числом повторів (n<15) поряд з вище розглянутими параметричними критеріями.
