- •Г усак в.В., Господарьов д.В., Лущак в.І. Статистика в біології: обробка даних малих вибірок
- •Розділ 1. Сукупність, вибірка і типи даних
- •1.1. Генеральні та вибіркові сукупності
- •1.2. Уявлення про малу вибірку
- •1.3. Типи даних
- •1.4. Структура даних
- •1.5. Заокруглення даних
- •Розділ 2. Показники варіації
- •2.1. Середні величини та медіана
- •2.2. Стандартне відхилення, дисперсія та коефіцієнт варіації
- •2.3. Варіація і розподіл
- •Розділ 3. Похибки оцінювання параметрів вибірки
- •3.1. Помилка середньої арифметичної величини
- •3.2. Довірчий інтервал
- •3.3. Неузгодженості у записах при використанні стандартної похибки середнього
- •Розділ 4. Аналіз даних, які випадають в ході досліджень (промахи і систематичні похибки)
- •4.1. Критерій Шовене
- •4.3. Критерій Романовського
- •4.4. Критерій Ірвіна
- •4.5. Критерій Аббе
- •Розділ 5. Перевірка вибірки на нормальність розподілу даних
- •5.1. Загальні уявлення про критерії перевірки вибірки на нормальний розподіл даних
- •5.2. Складовий критерій d
- •5.3. Статистичний критерій w (критерій Шапіро-Уілка)
- •5.4. Коефіцієнт асиметрії та ексцесу
- •Асиметрії та ексцесу
- •1. Первинні дані та допоміжні величини оформлюємо у вигляді таблиці:
- •6.1. Вибір статистичного критерію
- •6.2. Порівняння двох груп між собою
- •6.2.1. Непарний та парний критерії Стьюдента
- •6.2.2. Тест Уелча як модифікація тесту Стьюдента та u-критерій Манна-Уітні як непараметричний аналог непарного критерію Стьюдента
- •6.3. Порівняння трьох і більше груп між собою: доцільність використання параметричних чи непараметричних критеріїв
- •6.3.1. Критерій Ньюмена-Коулса
- •6.3.2. Критерій Даннета: порівняння декількох груп з контрольною
- •6.3.3. Непараметричний критерій Данна для порівняння декількох груп між собою
- •Розділ 7. Взаємозв'язки між групами: кореляційно-регресійний аналіз
- •7.1. Кореляційний аналіз
- •7.2. Парний регресійний аналіз
- •1.1. Рівняння лінійної регресії
- •1.2. Лінійне рівняння з логарифмуванням факторної ознаки (напівлогарифмічне)
- •1.3. Рівняння гіперболічної регресії
- •1.4. Показникове рівняння кривої
- •Розділ 8. Програми для статистичної обробки даних
- •Узагальнення
- •Рекомендована література
- •Тлумачний словник термінів
1.1. Рівняння лінійної регресії
1.1.1. Формуємо таблицю з первинних даних та обчислень допоміжних величин для обчислення коефіцієнтів a і b даного рівняння:
АЛДГ |
Лактат |
(xi)2 |
yi xі |
Y x |
yi–yx |
(yi–yx)2 |
yi2 |
Xi |
Yi |
||||||
6,28 |
5,11 |
39,438 |
32,091 |
7,027 |
-1,917 |
3,673 |
26,112 |
6,89 |
5,82 |
47,472 |
40,100 |
7,128 |
-1,308 |
1,712 |
33,872 |
7,34 |
6,96 |
53,876 |
51,086 |
7,203 |
-0,243 |
0,059 |
48,442 |
7,92 |
7,39 |
62,726 |
58,529 |
7,300 |
0,090 |
0,008 |
54,612 |
8,26 |
7,07 |
68,228 |
58,398 |
7,357 |
-0,287 |
0,082 |
49,985 |
8,74 |
7,73 |
76,388 |
67,560 |
7,437 |
0,293 |
0,086 |
59,753 |
8,39 |
7,81 |
70,392 |
65,526 |
7,379 |
0,431 |
0,186 |
60,996 |
8,34 |
7,56 |
69,556 |
63,050 |
7,370 |
0,190 |
0,036 |
57,154 |
8,74 |
8,00 |
76,388 |
69,920 |
7,437 |
0,563 |
0,317 |
64,000 |
9,72 |
8,45 |
94,478 |
82,134 |
7,600 |
0,850 |
0,722 |
71,403 |
14,0 |
8,77 |
196,000 |
122,78 |
8,314 |
0,456 |
0,208 |
76,913 |
15,6 |
9,01 |
243,360 |
140,56 |
8,581 |
0,429 |
0,184 |
81,180 |
17,7 |
9,13 |
313,290 |
161,60 |
8,931 |
0,199 |
0,039 |
83,357 |
18,5 |
9,45 |
342,250 |
174,83 |
9,065 |
0,385 |
0,148 |
89,303 |
20,1 |
9,77 |
404,010 |
196,38 |
9,332 |
0,438 |
0,192 |
95,453 |
22,9 |
10,1 |
524,410 |
231,29 |
9,799 |
0,301 |
0,091 |
102,01 |
24,8 |
10,6 |
615,040 |
262,88 |
10,116 |
0,484 |
0,235 |
112,36 |
31,3 |
10,8 |
979,690 |
338,04 |
11,200 |
-0,400 |
0,160 |
116,64 |
36,2 |
11,3 |
1310,44 |
409,06 |
12,017 |
-0,717 |
0,514 |
127,69 |
39,9 |
12,4 |
1592,01 |
494,76 |
12,634 |
-0,234 |
0,055 |
153,76 |
Σ xi |
Σ yi |
Σ(xi)2 |
Σyi xi |
Σyx |
Σ( yi–yx) |
Σ(yi–yx)2 |
Σ yi2 |
321,62 |
173,23 |
7179,441 |
3120,564 |
173,228 |
0,001784 |
8,708 |
1565,0 |
За допомогою вказаної вище таблиці та формул (89) і (90) отримуємо коефіцієнти регресії:
a = 5,9791,
b = 0,1668.
Тоді рівняння регресії матиме наступний вигляд:
y = 0,167 x + 5,979
1.1.2. За формулою (104) обчислюємо величину середньої помилки апроксимації :
Отже, апроксимація даних наведеним вище рівнянням регресії є статистично значущою, оскільки 6,89 < 15%.
1.1.3. За допомогою формул (106) і (73) обчислюємо величини індексу кореляції та коефіцієнту детермінації:
R2=0,932×100%=86%
1.1.4 За формулою (107) обчислюємо фактичне значення F-критерію Фішера. При цьому порівнюємо загальну дисперсію Sy2 (108) із залишковою S2зал (109).
S y2 = (1565,0 – 1500,43) / 19 = 3,3984.
S 2зал = 8,708 / 18 = 0,4838,
Тоді за формулою (107):
F ф = 3,3984 / 0,4838 = 7,02.
Рис. 8. Лінійна регресія
При рівні статистичної значущості Р=0,05 Fф>Fкр=2,22. Тому лінійне рівняння регресії адекватно описує фактичний взаємозв’язок між вмістом лактату і активністю ЛДГ. При цьому значення Fф=7,02 вказує на те, що рівняння лінії в сім разів краще описує даний взаємозв’язок, ніж середнє значення залежної змінної.
Отже, за результатами регресійного аналізу можна зробити висновок про те, що отримане лінійне рівняння, яке за експериментальними даними має вигляд: y = 0,167 x + 5,979 (Рис. 8: пряма лінія) в 7,02 рази краще описує зміни залежної змінної (вміст лактату), ніж середнє значення аргументу.
