- •Г усак в.В., Господарьов д.В., Лущак в.І. Статистика в біології: обробка даних малих вибірок
- •Розділ 1. Сукупність, вибірка і типи даних
- •1.1. Генеральні та вибіркові сукупності
- •1.2. Уявлення про малу вибірку
- •1.3. Типи даних
- •1.4. Структура даних
- •1.5. Заокруглення даних
- •Розділ 2. Показники варіації
- •2.1. Середні величини та медіана
- •2.2. Стандартне відхилення, дисперсія та коефіцієнт варіації
- •2.3. Варіація і розподіл
- •Розділ 3. Похибки оцінювання параметрів вибірки
- •3.1. Помилка середньої арифметичної величини
- •3.2. Довірчий інтервал
- •3.3. Неузгодженості у записах при використанні стандартної похибки середнього
- •Розділ 4. Аналіз даних, які випадають в ході досліджень (промахи і систематичні похибки)
- •4.1. Критерій Шовене
- •4.3. Критерій Романовського
- •4.4. Критерій Ірвіна
- •4.5. Критерій Аббе
- •Розділ 5. Перевірка вибірки на нормальність розподілу даних
- •5.1. Загальні уявлення про критерії перевірки вибірки на нормальний розподіл даних
- •5.2. Складовий критерій d
- •5.3. Статистичний критерій w (критерій Шапіро-Уілка)
- •5.4. Коефіцієнт асиметрії та ексцесу
- •Асиметрії та ексцесу
- •1. Первинні дані та допоміжні величини оформлюємо у вигляді таблиці:
- •6.1. Вибір статистичного критерію
- •6.2. Порівняння двох груп між собою
- •6.2.1. Непарний та парний критерії Стьюдента
- •6.2.2. Тест Уелча як модифікація тесту Стьюдента та u-критерій Манна-Уітні як непараметричний аналог непарного критерію Стьюдента
- •6.3. Порівняння трьох і більше груп між собою: доцільність використання параметричних чи непараметричних критеріїв
- •6.3.1. Критерій Ньюмена-Коулса
- •6.3.2. Критерій Даннета: порівняння декількох груп з контрольною
- •6.3.3. Непараметричний критерій Данна для порівняння декількох груп між собою
- •Розділ 7. Взаємозв'язки між групами: кореляційно-регресійний аналіз
- •7.1. Кореляційний аналіз
- •7.2. Парний регресійний аналіз
- •1.1. Рівняння лінійної регресії
- •1.2. Лінійне рівняння з логарифмуванням факторної ознаки (напівлогарифмічне)
- •1.3. Рівняння гіперболічної регресії
- •1.4. Показникове рівняння кривої
- •Розділ 8. Програми для статистичної обробки даних
- •Узагальнення
- •Рекомендована література
- •Тлумачний словник термінів
1.3. Типи даних
У багатьох випадках дослідник має справу з числами. Багато показників, таких як концентрація речовин, оптична густина, розміри, маса, можуть бути виміряні з великою точністю і мати певне числове значення. В інших випадках показники є цілими числами – кількість листків на деревах, кількість відкладених яєць або лялечок комах. Інші ознаки – стать, стан (норма або мутація), колір. Часто, коли технічно неможливо зробити вимір і отримати певне числове значення у початківців опускаються руки. Проте багато ознак, які на перший погляд не виражаються числами, можна «оцифрувати», статистично обробити, а отже, отримати значущу інформацію про явище.
Ознаки поділяють на якісні та кількісні. Кількісні ознаки можна виміряти, порахувати і виразити в тих чи інших одиницях виміру. За якісними ознаками об’єкти можна поділити на чіткі категорії. Якісна ознака може мати декілька станів. Так, вовна тварини може бути чорною, білою, коричневою, рудою; колір очей – чорним, карим, сірим, зеленим, блакитним і т.д. Деякі якісні ознаки мають два стани, наприклад, стать, ген (мутантний або нормальний), обстежуваний (здоровий чи хворий). Такі якісні ознаки називаються альтернативними. У свою чергу, кількісні ознаки поділяють неперервні, подані дійсними числами (наприклад, зріст, маса тіла, концентрація речовин), та дискретні, подані цілими числами (наприклад, кількість тварин в певній дослідній групі). Якісні ознаки поділяють на категоріальні та порядкові або рангові. Категоріальні ознаки – це, наприклад, стать, вікові групи. Якщо категорій тільки дві – мутантний або нормальний, присутній або відсутній, живий – мертвий, і т. ін., то ознаки називають дихотомічними. Інколи доводиться мати справу з ознаками, які можна описати за допомогою фізичних величин. Ступінь розвитку таких ознак суб’єктивно оцінюється описом «краще» або «гірше», «більше» або «менше». У таких випадках об’єктові присвоюють ранг – умовне числове значення, яке описує ступінь розвитку ознаки. Тому такі ознаки називаються ранговими.
Розрізняють також декілька шкал вимірювання, за якими класифікують типи даних. Так, виділяють інтервальну шкалу (в цій шкалі виражаються такі вимірювання як температура або час), шкалу найменувань, або номінальну (статі, номери телефонів), порядкову (оцінки успішності – «задовільно», «добре», «відмінно») та шкалу відношень (відсотки, долі одиниці).
1.4. Структура даних
Дані можуть бути первинними і вторинними. Первинні дані – це результати безпосередніх вимірів. Вторинні дані утворюються усередненням первинних даних. Наприклад, необхідно дізнатись масу тіла людини та з’ясувати рівень глюкози у неї в крові. Одноразове зважування дає досить точний результат і його, як правило, не повторюють. Методика визначення концентрації глюкози в крові складніша і дає менш точний результат. Тому роблять декілька паралельних визначень, за результатами яких обраховується середнє арифметичне. Паралельні виміри є первинними даними, а усереднений результат – вторинним.
Якщо один і той самий об’єкт вимірюється двічі (у різних експериментальних умовах), то отримані дані утворюють пари. Пари даних отримуються також у тому випадку, коли кожному об’єктові однієї вибірки відповідає цілком певний об’єкт з іншої вибірки. Такі дані є попарно зв’язані.
