Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Statistika_Husak_VL_DG_2015_16_06_2015.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
2.9 Mб
Скачать

125

Г усак в.В., Господарьов д.В., Лущак в.І. Статистика в біології: обробка даних малих вибірок

ЗМІСТ

ВСТУП…………………………………………………………………………….4

РОЗДІЛ 1. СУКУПНІСТЬ, ВИБІРКА І ТИПИ ДАНИХ …………………...6

1.1. Генеральні та вибіркові сукупності..……………….………………….6

1.2. Уявлення про малу вибірку ……………………...…….……………....7

1.3. Типи даних ……………………………………………………………...8

1.4. Структура даних ………………………………………………………10

1.5. Заокруглення даних …………..……………………………………….10

РОЗДІЛ 2. ПОКАЗНИКИ ВАРІАЦІЇ ………………………………………..13

2.1. Середні величини та медіана …………………………………………13

2.2. Стандартне відхилення, дисперсія та коефіцієнт варіації.................18

2.3. Варіація і розподіл …………………………………………………….20

РОЗДІЛ 3. ПОХИБКИ ОЦІНЮВАННЯ ПАРАМЕТРІВ ВИБІРКИ……..24

3.1. Помилка середньої арифметичної величини.………………………...24

3.2. Довірчий інтервал …………………………………………………......25

3.3. Неузгодженості у записах при використанні стандартної похибки середнього………………………………………………………..……29

РОЗДІЛ 4. АНАЛІЗ ДАНИХ, ЩО ВИПАДАЮТЬ В ХОДІ ДОСЛІДЖЕНЬ (ПРОМАХИ І СИСТЕМАТИЧНІ ПОХИБКИ)…………………………30

4.1. Критерій Шовене……………………………………………………....30

4.2. Q-критерій Діксона……………………………………………………32

4.3. Критерій Романовського………………………………………………33

4.4. Критерій Ірвіна………………………………………………………...34

4.5. Критерій Аббе………………………………………………………….36

РОЗДІЛ 5. ПЕРЕВІРКА ВИБІРКИ НА НОРМАЛЬНІСТЬ РОЗПОДІЛУ ДАНИХ ………………………………………………...……….……………38

5.1. Загальні уявлення про критерії перевірки вибірки на нормальний розподіл даних………………………………………………………...38

5.2. Складовий критерій d……………………………………………….…39

5.3. Статистичний критерій W (критерій Шапіро-Уілка)………………..40

5.4. Коефіцієнт асиметрії та ексцесу……………………………………...42

РОЗДІЛ 6. ПОРІВНЯННЯ ДВОХ І БІЛЬШЕ ГРУП МІЖ СОБОЮ…….49

6.1. Вибір статистичного критерію………………………………………..49

6.2. Порівняння двох груп між собою……………………………………..52

6.2.1. Непарний та парний критерії Стьюдента……………………….52

6.2.2. Тест Уелча як модифікація непарного критерію Стьюдента та U-критерій Манна-Уітні як непараметричний аналог непарного критерію Стьюдента…………………………………………….62

6.2.3. W-критерій Уілкоксона: непараметричний аналог парного критерію Стьюдента……………………………………...……..66

6.3. Порівняння трьох і більше груп між собою: доцільність використання параметричних чи непараметричних критеріїв……..68

6.3.1. Критерій Ньюмена-Коулса……………………………………….68

6.3.2. Критерій Даннета: порівняння декількох груп з контрольною..74

6.3.3. Непараметричний критерій Данна для порівняння декількох груп між собою…………………………………………………..77

РОЗДІЛ 7. ВЗАЄМОЗВ'ЯЗКИ МІЖ ГРУПАМИ: КОРЕЛЯЦІЙНО-РЕГРЕСІЙНИЙ АНАЛІЗ……………………………………………………...82

7.1. Кореляційний аналіз…………………………………………………...82

7.2. Парний регресійний аналіз……………………………………………88

РОЗДІЛ 8. ПРОГРАМИ ДЛЯ СТАТИСТИЧНОЇ ОБРОБКИ ДАНИХ...108

УЗАГАЛЬНЕННЯ…………………………………………………………….112

РЕКОМЕНДОВАНА ЛІТЕРАТУРА………………………………………..114

ТЛУМАЧНИЙ СЛОВНИК ТЕРМІНІВ ………………………………...…121

ВСТУП

Математична статистика вже давно і успішно використовується у біології. Втім, завжди існують початківці, для яких доцільність певних способів обробки, аналізу, представлення даних, а також вибір тестів для статистичних порівнянь не очевидні. Різнобій у подачі числових даних та їх обробки часто зустрічається навіть у рецензованих наукових статтях, а також дисертаціях. Це є свідченням того, що для частини тих, хто сьогодні займається наукою, статистична обробка залишається «незвіданою територією», або неоднозначною частиною знань.

Під час керівництва студентською науковою роботою ми виявили низку проблем, які найчастіше виникають перед початківцями. Перша проблема психологічна – страх перед усім, що стосується математики як дуже складної для розуміння дисципліни. Насправді, коло завдань, які стоять перед дослідником щодо обробки даних, набагато вужче, ніж таке для спеціалістів-математиків. Для найпростішого статистичного аналізу потрібні лишень базові, по суті шкільні знання математики. На сьогодні, більшість необхідних обрахунків не потрібно проводити вручну. Існує багато комп’ютерних статистичних програм, які виконують всі розрахунки за долі секунди. Завдання дослідника – знати алгоритми обрахунку і критерії вибору тестів для порівнянь. Завдяки цьому можна правильно «пояснити» машині, що саме рахувати, і розуміти той результат, який видається на екран монітора. Звісно, для глибокого статистичного аналізу потрібні спеціальні ґрунтовні знання з окремих математичних дисциплін. Інколи це стає незалежною метою – зрозуміти біологічне явище з математичної точки зору, створити модель процесу. Такий підхід вже приніс багато користі і продовжує успішно розвиватись. Існують навіть спеціалізовані періодичні видання, які зосереджуються саме на біометриці (або біометрії) – науці, яка застосовує статистику, а також інших розділах математики для розв’язання біологічних проблем.

Друга проблема початківців – у формальному відношенні до статистики і надмірній вірі у «всемогутність» статистичних програм. Дійсно, сучасні комп’ютерні програми дозволяють заощадити багато часу, проте вони є тільки допоміжним інструментом. Алгоритм обробки даних, їх аналіз і подача залежать від рішення самого дослідника. При правильному застосуванні статистичний аналіз суттєво допомагає зрозуміти досліджуване явище, при неправильному – ускладнює розуміння і сприйняття даних, а іноді призводить до невірних висновків. Тому за використанням комп’ютерних програм має бути глибоке усвідомлення тих операцій, які виконуються з введеними в програму числами, і того, про що свідчитиме результат. Приємно згадувати, що колись (ці часи ще застали авторів даного посібника) доводилось самостійно складати алгоритми розрахунків на програмованому калькуляторі чи комп’ютері або й без них. У цьому випадку дослідник мусів розуміти саму суть обробки даних.

На сьогодні, цілком природним є бажання лідера дослідницької команди (студентської чи аспірантської), щоб кожен у ній був самостійним у статистиці, міг коректно і правдиво представляти свою частину результатів. Тому метою даного посібника є не тільки ознайомлення дослідників-початківців з найбільш розповсюдженими методами статистичного аналізу, а також попередження можливих помилок.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]