
Биометрия методичка
.pdf
Рис. 4.1 – Диалоговое окно инструмента «Описательная статистика»
В результате получаем окно с итоговой таблицей, показанное на Рис. 4.2:
в 1-й строчке данной таблицы стоит M – среднее выборочное значение надоя;
во 2-й строчке – ошибка среднего m;
в 3-й и 4-й – медиана Ме и мода Мо распределения признака соответственно;
в 5-й – среднее квадратическое отклонение σ;
в 6-й – варианса σ2;
в 7-й и 8-й – асимметрия А и эксцесс Е – показатели, которые характеризуют отличие распределения признака Y в выборке от нормального;
в 9-й строчке – лимит L, т. е. интервал вариабельности признака Y;
в 10-й и 11-й – минимальное и максимальное значение признака;
в 12-й – сумма всех значений признака по выборке;
21

в 13-й – объем выборки n;
в 14-й – значение абсолютной ошибки измерений признака M на уровне значимости p < 0,05, которое равно:
M = m t (ν; p), где t (ν; p) = t (29; 0,05) – коэффициент |
|
Стьюдента |
для ν = 19 степеней свободы (ν = 20 – 1) |
науровне |
доверительной вероятности P > 0,95 (или |
на уровне значимости p < 0,05).
Рис. 4.2 – Окно итоговой Таблицы описательной статистики
К сожалению, инструмент «Описательная статистика» не предусматривает вычисление коэффициента вариации CV. Ноего можно легко вычислить по формуле CV = σ/ M · 100 %. Это можно выполнить в ячейке Е19 итоговой таблицы описательной статистики при помощи формулы = E9 * 100 / E5. Получим значение: CV = 11,241075819 %, которое указывает на близость вариабельности признака (надоя) к средней
(10 %).
22

Проверка гипотезы о соответствии распределения признака в выборке нормальному распределению
Вернемся к предыдущему примеру. Необходимо выяснить, соответствует ли распределение признака Y в выборке нормальному закону распределения. Для решения этого вопроса существует несколько подходов. На первом этапе проанализируем значения асимметрии А и эксцесса Е из итоговой таблицы (Рис. 4.2).
Рассчитаем коэффициенты асимметрии KA и эксцесса KE поформулам(4.1) и (4.2):
| |
| |
|
, |
(4.1) |
| |
| |
, |
(4.2) |
где А – асимметрия (|A| = 0,48569149);
K – эксцесс (|Е| = –0,6230734); n – объем выборки (n = 18).
Для проведения расчетов вернемся к итоговой таблице описательной статистики (Рис. 4.2). Программируем в ячейке Е20: = ABC (E12) / КОРЕНЬ (6/18) и нажимаем «Enter».
Имеем KA = 0,841753. Далее программируем в ячейке Е21: = ABC (E11) / КОРЕНЬ (24/18) и нажимаем «Enter». Имеем KE = 0,539597.
Оба коэффициента оказались меньше 3, что не отвергает гипотезу о соответствии распределения признака Y в выборке нормальному распределению. Для более убедительного доказательства можно применить более мощные критерии проверки статистических гипотез, например, критерий хи-квадрат или критерий Пирсона.
Задания Задание 1. Получены данные по длине тела плотвы озе-
ра Белое (Таблица 4.2).
Необходимо провести анализ данных с помощью инструмента «Описательная статистика».
23

Таблица 4.2 – Длина тела плотвы озера Белое (в мм)
143 |
133 |
148 |
153 |
150 |
142 |
164 |
139 |
139 |
132 |
143 |
120 |
144 |
130 |
138 |
124 |
127 |
137 |
139 |
129 |
128 |
95 |
120 |
138 |
130 |
114 |
126 |
138 |
117 |
132 |
130 |
145 |
140 |
153 |
137 |
142 |
145 |
137 |
141 |
125 |
148 |
138 |
140 |
136 |
135 |
139 |
125 |
137 |
131 |
120 |
94 |
118 |
120 |
132 |
134 |
111 |
132 |
133 |
100 |
140 |
143 |
134 |
138 |
130 |
135 |
133 |
134 |
154 |
107 |
110 |
127 |
118 |
142 |
148 |
136 |
165 |
172 |
132 |
157 |
124 |
Задание 2. Подсчитано число лучей в хвостовых плавниках щуки (Таблица 4.3).
Необходимо провести анализ данных с помощью инструмента «Описательная статистика».
Таблица 4.3 – Число лучей в хвостовых плавниках щуки
53 |
51 |
52 |
55 |
56 |
49 |
51 |
52 |
54 |
56 |
54 |
53 |
52 |
53 |
51 |
55 |
53 |
55 |
53 |
54 |
51 |
51 |
56 |
54 |
54 |
53 |
54 |
54 |
55 |
53 |
52 |
55 |
53 |
53 |
56 |
53 |
52 |
56 |
52 |
52 |
56 |
55 |
50 |
54 |
49 |
54 |
54 |
55 |
54 |
55 |
52 |
51 |
55 |
52 |
55 |
54 |
51 |
54 |
53 |
54 |
54 |
56 |
54 |
55 |
53 |
53 |
56 |
55 |
54 |
53 |
55 |
52 |
53 |
52 |
51 |
55 |
53 |
54 |
51 |
50 |
53 |
54 |
55 |
52 |
55 |
52 |
53 |
50 |
53 |
52 |
58 |
57 |
57 |
58 |
56 |
57 |
56 |
58 |
57 |
57 |
24

Лабораторная работа № 5 Техники сравнительного анализа данных
Проверка гипотезы относительно достоверности различия двух средних выборочных. Т-критерий Стьюдента
Если имеется две или более выборочных совокупностей, то возникает вопрос, относятся ли они к одной генеральной совокупности или к разным. Если средние выборочные существенно отличаются, то применяют критерий проверки достоверности различия средних выборочных или t-критерий Стьюдента. Заметим, что перед применением данного критерия необходимо убедиться в том, что распределение признака в каждой из сравниваемых выборок близко к нормальному.
Пример. В две группы были отобраны поросята из двух пород свиней – Белорусская белая и Ландрас (Таблица 5.1).
Таблица 5.1 – Динамика живой массы поросят
|
Белорусская белая |
|
|
|
Ландрас |
|
|
|
Живая масса |
|
|
|
Живая масса |
|
|
№ поросенка |
при рождении в 1 мес. в 3 мес. № поросенка |
при рождении в 1 мес. в 3 мес. |
|||||
1 |
0,9 |
8,8 |
38,2 |
1 |
0,8 |
8,6 |
37,8 |
2 |
1,0 |
9,2 |
38,7 |
2 |
0,9 |
8,5 |
38,0 |
3 |
0,8 |
9,0 |
38,8 |
3 |
0,8 |
8,6 |
38,1 |
4 |
1,1 |
8,7 |
39,0 |
4 |
0,7 |
8,4 |
38,4 |
5 |
0,8 |
8,9 |
38,6 |
5 |
0,9 |
8,5 |
38,0 |
6 |
1,0 |
9,0 |
38,7 |
6 |
0,8 |
8,8 |
37,8 |
7 |
0,8 |
9,1 |
38,8 |
7 |
1,0 |
8,7 |
37,9 |
8 |
0,9 |
8,9 |
38,8 |
8 |
0,8 |
8,6 |
37,8 |
9 |
1,0 |
9,0 |
38,9 |
9 |
0,7 |
8,8 |
38,0 |
10 |
1,1 |
8,7 |
39,0 |
10 |
0,8 |
8,7 |
38,1 |
11 |
0,9 |
8,8 |
38,6 |
11 |
0,9 |
8,4 |
38,1 |
12 |
0,8 |
9,1 |
38,6 |
12 |
0,8 |
8,4 |
37,8 |
13 |
0,8 |
9,0 |
38,5 |
13 |
0,8 |
8,5 |
37,6 |
14 |
0,9 |
8,8 |
38,7 |
14 |
0,7 |
8,6 |
37,8 |
15 |
1,1 |
8,9 |
38,7 |
15 |
0,9 |
8,7 |
37,7 |
16 |
1,0 |
8,9 |
38,6 |
16 |
0,7 |
8,7 |
38,0 |
17 |
0,8 |
9,1 |
38,5 |
17 |
1,0 |
8,8 |
37,7 |
18 |
0,9 |
9,0 |
38,8 |
18 |
0,7 |
8,6 |
37,6 |
19 |
0,8 |
9,1 |
39,0 |
19 |
0,8 |
8,5 |
37,8 |
20 |
1,0 |
8,8 |
38,7 |
20 |
0,8 |
8,4 |
38,0 |
21 |
0,9 |
8,7 |
38,6 |
21 |
0,9 |
8,5 |
37,8 |
22 |
0,8 |
9,0 |
38,8 |
22 |
0,7 |
8,6 |
37,6 |
23 |
0,9 |
9,1 |
39,1 |
23 |
0,8 |
8,5 |
37,9 |
24 |
0,8 |
9,0 |
– |
24 |
– |
8,4 |
38,0 |
25 |
1,0 |
– |
– |
25 |
– |
– |
37,6 |
25

В Таблице 5.1 приведены значения измерений живой массы поросят при рождении, в 1 месяц и в 3 месяца. Необходимо убедиться в достоверности различий средних значений живой массы поросят двух пород.
Решение. Открываем новую книгу (новый рабочий лист) вППП Excel и копируем Таблицу5.1. Нужно убедиться в близости распределения живой массы ягнят в каждой выборке к нормальномураспределению – воспользуемсяинструментом «Описательная статистика». Результаты приведены в Таблице 5.2.
Таблица 5.2 – Итоговая статистика
|
|
Белорусская белая |
|
|
|
При рождении |
В 1 месяц |
|
В 3 месяца |
|
|
Среднее |
0,912 |
Среднее |
8,94166 |
Среднее |
38,726 |
Стандартная |
0,02107 |
Стандартная |
0,029437 |
Стандартная |
0,0418 |
ошибка |
ошибка |
ошибка |
|||
Медиана |
0,9 |
Медиана |
9 |
Медиана |
38,7 |
Мода |
0,8 |
Мода |
9 |
Мода |
38,7 |
Стандартное |
0,10535 |
Стандартное |
0,14421 |
Стандартное |
0,20049 |
отклонение |
|
отклонение |
|
отклонение |
|
Дисперсия |
0,0111 |
Дисперсия |
0,02079 |
Дисперсия |
0,04019 |
выборки |
|
выборки |
|
выборки |
|
Эксцесс |
–1,01543 |
Эксцесс |
–0,88504 |
Эксцесс |
1,00126 |
Асимметричность |
0,44018 |
Асимметричность |
–0,24556 |
Асимметричность |
–0,35591 |
Интервал |
0,3 |
Интервал |
0,5 |
Интервал |
0,9 |
Минимум |
0,8 |
Минимум |
8,7 |
Минимум |
38,2 |
Максимум |
1,1 |
Максимум |
9,2 |
Максимум |
39,1 |
Сумма |
22,8 |
Сумма |
214,6 |
Сумма |
890,7 |
Счет |
25 |
Счет |
24 |
Счет |
23 |
Уровень |
0,04348 |
Уровень |
0,06089 |
Уровень |
0,0867 |
надежности (95,0) |
надежности (95,0) |
надежности (95,0) |
|
|
Ландрас |
|
|
|
|
При рождении |
В 1 месяц |
|
В 3 месяца |
|
||
Среднее |
0,81304 |
Среднее |
8,575 |
Среднее |
|
37,876 |
Стандартная |
0,01917 |
Стандартная |
0,02708 |
Стандартная |
|
0,039277 |
ошибка |
|
ошибка |
|
ошибка |
|
|
Медиана |
0,8 |
Медиана |
8,6 |
Медиана |
|
37,8 |
Мода |
0,8 |
Мода |
8,6 |
Мода |
|
37,8 |
Стандартное |
0,09197 |
Стандартное |
0,13269 |
Стандартное |
|
0,196384 |
отклонение |
|
отклонение |
|
отклонение |
|
|
Дисперсия |
0,00845 |
Дисперсия |
0,01760 |
Дисперсия |
|
0,038567 |
выборки |
|
выборки |
|
выборки |
|
|
Эксцесс |
–0,35988 |
Эксцесс |
–0,96808 |
Эксцесс |
|
0,533587 |
Асимметричность |
0,49066 |
Асимметричность |
0,25880 |
Асимметричность |
|
0,54409 |
Интервал |
0,3 |
Интервал |
0,4 |
Интервал |
|
0,8 |
Минимум |
0,7 |
Минимум |
8,4 |
Минимум |
|
37,6 |
Максимум |
1 |
Максимум |
8,8 |
Максимум |
|
38,4 |
Сумма |
18,7 |
Сумма |
205,8 |
Сумма |
|
946,9 |
Счет |
23 |
Счет |
24 |
Счет |
|
25 |
Уровень |
0,03977 |
Уровень |
0,05603 |
Уровень |
|
0,081063 |
надежности (95,0) |
|
надежности (95,0) |
|
надежности (95,0) |
|
|
26

На первом этапе рассчитаем для каждой выборки на основании данных Таблицы 5.2 коэффициенты асимметрии KA и эксцесса KE по формулам (5.1) и (5.2):
|
|
|
|
|
|
| |
| |
, |
|
|
|
|
(5.1) |
|
где А – асимметрия; |
|
|
| |
| |
, |
|
|
|
|
(5.2) |
||||
|
|
|
|
|
|
|
|
|
|
|
||||
Е – эксцесс; |
|
|
|
|
|
|
|
|
|
|
|
|||
n – объем выборки. |
|
|
|
|
|
|
|
|
|
|||||
Для |
этого в произвольной |
ячейке |
программируем |
|||||||||||
для KA |
= |
ABS (A) / КОРЕНЬ (6/n) и нажимаем «Enter»; |
||||||||||||
для KE = ABC (E)| / КОРЕНЬ (24/n) и также нажимаем «Enter». |
||||||||||||||
Результаты расчетов приведены в Таблице 5.3. |
|
|||||||||||||
Таблица 5.3 |
– Результаты расчетов коэффициентов асимметрии |
|||||||||||||
и эксцесса |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Коэффициенты |
|
Белорусская белая |
|
|
|
|
|
|
Ландрас |
|
||||
|
при рождении |
в 1 мес. |
|
в 3 мес. |
|
при рождении |
в 1 мес. |
в 3 мес. |
||||||
Асимметрии KA |
|
0,89814 |
0,49112 |
|
0,69683 |
|
0,96068 |
|
0,51761 |
1,11061 |
||||
Эксцесса KE |
|
|
1,03636 |
0,88504 |
|
0,98018 |
|
0,35230 |
|
0,96808 |
0,54459 |
Данные Таблицы 5.3 свидетельствуют о том, что все коэффициенты имеют значения меньше 3, поэтому в первом приближении можно принять гипотезу о близости распределения признака во всех выборках к нормальному. Далее переходим к проверке критерия Стьюдента и выполняем команды Данные/ Анализ данных/ Двухвыборочный t-тест с различными дисперсиями. Появляется диалоговое окно, показанное на Рис. 5.1 (см. ниже). Сначала в окошко «Интервал переменной 1» вводим живую массу поросят 1-й группы при рождении, обводя курсором ячейки В2 : В27, а в окошко «Интервал переменной 2» вводим живую массу поросят 2-й группы при рождении, обводя курсором ячейки F2 : F25.
27

Рис. 5.1 – Диалоговое окно инструмента «Двухвыборочный t-тест с различными дисперсиями»
Затем в окошко «Гипотетическая средняя разность» вводим «0». В окошке «Метки» ставим значок, а в окошке «Альфа» указываем максимальное значение достоверности различия 0,05. Выделяем курсором выходной интервал (например, J4) и нажимаем «ОК». Аналогично поступаем для поросят в 1-месячном и 3-месячном возрасте.
Результаты объединены в Таблице 5.4. В этой таблице приводятся:
средние значения живой массы поросят каждой группы для разного возраста («Среднее»);
варианты («Дисперсия»);
объемы выборок («Наблюдения»);
число степеней свободы («df»);
фактические значения t-критерия («t-статистика»);
реальный уровень значимости t-критерия («P (T <= t) двухстороннее»);
28

критические значения t-критерия на уровне значимости p < 0,05 («t критическое двухстороннее»).
Двухсторонняя критическая область рассматривается потому, что заранее неизвестно, какая средняя выборочная больше.
Таблица 5.4 – Двухвыборочный t-тест с различными дисперсиями
Двухвыборочный t-тест с различными дисперсиями
|
При рождении |
|
Среднее |
0,912 |
0,813043478 |
Дисперсия |
0,0111 |
0,008458498 |
Наблюдения |
25 |
23 |
Гипотетическая разность средних |
0 |
|
df |
46 |
|
t-статистика |
3,47320477 |
|
P(T<=t) одностороннее |
0,00056563 |
|
t критическое одностороннее |
1,67866041 |
|
P(T<=t) двухстороннее |
0,00113125 |
|
t критическое двухстороннее |
2,0128956 |
|
Двухвыборочный t-тест с различными дисперсиями |
||
|
В 1 месяц |
|
Среднее |
8,94166667 |
8,575 |
Дисперсия |
0,0207971 |
0,017608696 |
Наблюдения |
24 |
24 |
Гипотетическая разность средних |
0 |
|
df |
46 |
|
t-статистика |
9,16597482 |
|
P(T<=t) одностороннее |
3,0112E-12 |
|
t критическое одностороннее |
1,67866041 |
|
P(T<=t) двухстороннее |
6,0224E-12 |
|
t критическое двухстороннее |
2,0128956 |
|
Двухвыборочный t-тест с различными дисперсиями |
||
|
В 3 месяца |
|
Среднее |
38,726087 |
37,876 |
Дисперсия |
0,04019763 |
0,038566667 |
Наблюдения |
23 |
25 |
Гипотетическая разность средних |
0 |
|
df |
45 |
|
t-статистика |
14,8197094 |
|
P(T<=t) одностороннее |
3,1523E-19 |
|
t критическое одностороннее |
1,67942739 |
|
P(T<=t) двухстороннее |
6,3045E-19 |
|
t критическое двухстороннее |
2,01410339 |
|
Данные Таблицы 5.4 свидетельствуют о том, что существуют достоверные различия между живой массой поросят 1-й и 2-й групп, уже начиная с рождения (P(T <= t) двухсто-
роннее < 0,05 и равен 0,00113125).
29

Начиная с 1-го месяца жизни, разница средних значений живоймассыпоросятстановитсяещёболеедостоверной, аименно:
в 1 месяц значимость р < 6,0224 · 10–12;
в 3 месяца р < 6,3045 · 10–19.
Это говорит о том, что поросята двух пород свиней принадлежат к двум различным генеральным совокупностям.
Задание. Были проведены исследования по влиянию комплексного удобрения на размер ягод ежевики. Для этого были сформированы два варианта растений ежевики сорта Рубен по 25 единиц в каждой группе. В стандартном варианте удобрения вносили по традиционной схеме, в опытном варианте вносили дополнительно комплексное удобрение.
В Таблице 5.5 приведены результаты взвешивания ягод ежевики в период плодоношения. Необходимо убедиться в достоверности различий средних значений опытного и стандартного вариантов.
Таблица 5.5 – Результаты взвешивания ягод ежевики
Стандартный вариант |
|
Опытный вариант |
|
№ |
Масса, г |
№ |
Масса, г |
1 |
10,2 |
1 |
15,2 |
2 |
14,0 |
2 |
12,5 |
3 |
11,5 |
3 |
15,1 |
4 |
8,7 |
4 |
16,2 |
5 |
10,8 |
5 |
15,9 |
6 |
10,9 |
6 |
8,9 |
7 |
9,4 |
7 |
10,6 |
8 |
10,3 |
8 |
12,8 |
9 |
13,1 |
9 |
12,6 |
10 |
7,9 |
10 |
15,3 |
11 |
11,8 |
11 |
19,0 |
12 |
14,7 |
12 |
11,2 |
13 |
14,6 |
13 |
17,3 |
14 |
9,3 |
14 |
10,1 |
15 |
12,0 |
15 |
16,8 |
16 |
9,9 |
16 |
15,5 |
17 |
8,2 |
17 |
18,9 |
18 |
11,1 |
18 |
16,0 |
19 |
9,8 |
19 |
12,2 |
20 |
19,6 |
20 |
13,9 |
21 |
8,2 |
21 |
15,7 |
22 |
7,4 |
22 |
15,2 |
23 |
11,9 |
23 |
12,1 |
24 |
10,3 |
24 |
10,7 |
25 |
13,8 |
25 |
15,3 |
30