
Биометрия методичка
.pdf
Рис. 2.1 – Инструмент «Выборка».
В результате работы инструмента «Выборка» MS Excel разместил в указанном столбце 18 значений, выбранных случайных образом из диапазона A2 : J17. При необходимости количество случайных значений можно установить даже больше, чем значений в исходной совокупности (конечно же, при этом будут повторы).
Выборка с определенной периодичностью
С помощью инструмента «Выборка» можно осуществить выборку из генеральной совокупности с определенной заданной периодичностью. В этом случае исследователь должен сам убедиться, что данная выборка будет репрезентативной.
11

Для этого следует отметить метод выборки Периодический. Установить в поле Период, например, значение «4».
Инструмент «Выборка» выведет каждое четвертое зна-
чение из Входного интервала (Рис. 2.2).
Рис. 2.2 – Методвыборки«Периодический» инструмента«Выборка»
В поле Выходной интервал достаточно ввести ссылку на верхнюю ячейку диапазона с результатами (укажем ячейку М2). Нажимаем ОК.
Если исходная генеральная совокупность имеет цикличность и упорядочена, то можно создать выборку, содержащую значения только из отдельной части цикла. Например, если входной диапазон содержит данные по квартальным учетам продаж минеральных удобрений за несколько лет, то создание выборки с периодом, равным 3, разместит в выходном интервале значения продаж только из заданного квартала.
Задания Задание 1. Получены данные по массе плодов грецкого
ореха четырёх сортов – Нежный, Совершенный, Минский, Волховский (Таблица 2.2).
12

Таблица 2.2 – Масса плодов грецкого ореха четырех сортов
|
Масса плода, г |
|
|
Нежный |
Совершенный |
Минский |
Волховский |
47,7 |
49,4 |
55,6 |
52,4 |
54,6 |
50,5 |
55,0 |
49,4 |
53,7 |
52,3 |
46,9 |
51,7 |
50,4 |
58,0 |
52,9 |
54,3 |
47,2 |
50,2 |
48,5 |
55,6 |
53,0 |
50,0 |
53,8 |
51,2 |
52,7 |
53,3 |
56,7 |
51,1 |
54,1 |
46,7 |
48,3 |
49,8 |
50,2 |
53,2 |
50,9 |
51,7 |
49,0 |
53,6 |
50,5 |
54,0 |
52,9 |
51,8 |
50,9 |
48,5 |
56,2 |
53,8 |
52,5 |
49,5 |
55,2 |
49,7 |
49,7 |
52,7 |
56,1 |
50,4 |
58,0 |
51,2 |
45,5 |
52,6 |
53,0 |
55,3 |
55,7 |
56,7 |
52,6 |
49,4 |
47,9 |
51,0 |
54,4 |
51,1 |
52,8 |
49,2 |
52,1 |
50,0 |
48,7 |
49,2 |
52,2 |
52,8 |
56,9 |
48,1 |
48,4 |
52,2 |
49,2 |
50,9 |
51,7 |
52,1 |
51,5 |
56,0 |
50,6 |
54,7 |
51,1 |
53,8 |
55,9 |
52,4 |
50,7 |
50,3 |
54,2 |
47,9 |
53,7 |
50,0 |
56,9 |
48,5 |
52,1 |
49,9 |
55,3 |
54,1 |
51,0 |
52,3 |
56,9 |
53,7 |
50,2 |
47,7 |
55,1 |
53,2 |
54,8 |
51,9 |
50,5 |
53,1 |
49,9 |
49,8 |
52,6 |
53,9 |
55,6 |
57,1 |
52,8 |
53,4 |
51,6 |
55,6 |
53,3 |
53,9 |
54,8 |
51,0 |
54,0 |
53,3 |
51,8 |
52,8 |
52,4 |
54,3 |
52,3 |
50,8 |
47,3 |
49,0 |
52,3 |
56,7 |
53,9 |
59,4 |
53,3 |
50,4 |
51,4 |
46,5 |
53,6 |
48,2 |
54,2 |
49,1 |
53,1 |
48,1 |
51,1 |
48,7 |
55,5 |
52,2 |
52,0 |
50,9 |
Из указанной генеральной совокупности необходимо с периодом в шесть значений отобрать репрезентативную выборочную совокупность.
Задание 2. Получены данные по массе колосьев ячменя сорта Янтарный (Таблица2.3). Из указанной генеральной совокупности необходимо случайным образом отобрать репрезентативнуювыборочнуюсовокупностьвколичестве22 вариант.
13

Таблица 2.3 – Масса колосьев ячменя сорта Янтарный
|
|
|
Масса колосьев, г |
|
|
|
||
62,86 |
59,90 |
60,48 |
62,37 |
63,43 |
63,87 |
68,84 |
67,26 |
63,90 |
63,25 |
62,38 |
62,65 |
56,90 |
63,55 |
66,02 |
64,37 |
62,83 |
68,46 |
67,98 |
65,26 |
58,53 |
58,99 |
60,85 |
66,50 |
58,37 |
64,17 |
63,50 |
67,68 |
62,47 |
64,97 |
59,43 |
63,48 |
62,88 |
63,61 |
61,45 |
65,80 |
63,16 |
60,21 |
66,37 |
63,99 |
66,83 |
65,01 |
65,53 |
63,89 |
62,51 |
59,70 |
60,40 |
59,93 |
63,38 |
55,33 |
65,13 |
62,63 |
58,02 |
59,65 |
59,52 |
61,69 |
67,85 |
63,23 |
63,20 |
64,28 |
61,11 |
64,78 |
60,18 |
57,88 |
60,09 |
67,38 |
65,42 |
64,34 |
62,06 |
62,47 |
63,83 |
58,16 |
61,20 |
67,93 |
62,40 |
62,77 |
63,40 |
61,07 |
65,94 |
65,65 |
66,58 |
66,04 |
62,48 |
65,17 |
62,66 |
66,54 |
67,35 |
67,01 |
65,79 |
61,67 |
58,08 |
64,88 |
68,59 |
62,21 |
61,04 |
59,70 |
67,83 |
60,29 |
67,53 |
62,19 |
58,71 |
65,12 |
61,28 |
60,21 |
57,90 |
62,86 |
63,00 |
63,84 |
65,95 |
65,63 |
62,50 |
67,31 |
67,05 |
62,46 |
62,06 |
64,82 |
63,05 |
67,39 |
59,57 |
62,43 |
63,07 |
66,02 |
70,89 |
65,76 |
65,21 |
61,66 |
67,13 |
62,54 |
61,21 |
60,95 |
61,35 |
63,57 |
59,26 |
68,27 |
65,14 |
64,06 |
63,34 |
63,70 |
63,26 |
65,40 |
61,27 |
58,17 |
62,43 |
62,39 |
59,16 |
63,84 |
61,35 |
63,02 |
68,12 |
61,16 |
69,45 |
61,79 |
66,14 |
65,29 |
63,02 |
65,08 |
62,44 |
62,93 |
62,87 |
60,56 |
64,04 |
67,27 |
14
Лабораторная работа № 3 Группировка данных и анализ распределений
Группировка данных – процесс систематизации первичных биометрических данных в целях обнаружения закономерности, которой подчиняется исследуемое явление или процесс. Группировка бывает простая (по одному признаку) и сложная (по нескольким признакам). Форма группировки данных – статистическая таблица и вариационный ряд.
Любой вариационный ряд характеризуется двумя элементами:
1)варианта (хi) – это отдельные значения признака единиц выборочной совокупности. Для вариационного ряда варианта принимает числовые значения, для атрибутивного – качественные;
2)частота (ni) – число, показывающее, сколько раз встречается то или иное значение признака в вариационном ряду.
Вариационный ряд называют интервальным, когда определены границы «от» и «до» для непрерывно варьируемого признака. Интервальный ряд также строят, если множество значений дискретно варьируемого признака велико.
Интервальный ряд можно строить как с интервалами равной длины (равноинтервальный ряд) так и с неодинаковыми интервалами, если это необходимо по условиям статистического исследования. Если цель исследования не определяет способ построения интервального ряда, то строят равноинтервальный ряд, число интервалов в котором определяют по формуле Стерджесса (формула 3.1):
|
k = 1 + 3,322 lg (n), |
(3.1) |
где k |
– число интервалов; |
|
n |
– объем выборки. |
|
Пример. Получены данные о массе плодов голубики сорта Блюголд (Таблица 3.1).
Необходимо составить равноинтервальный ряд, построить гистограмму.
15

Таблица 3.1 – Масса плодов голубики сорта Блюголд
|
|
Масса плодов голубики сорта Блюголд, г |
|
|
||
10,3 |
11,0 |
6,9 |
11,0 |
11,8 |
11,8 |
8,2 |
8,3 |
9,9 |
4,4 |
9,2 |
8,6 |
13,7 |
8,4 |
6,2 |
11,1 |
11,7 |
11,2 |
7,6 |
13,2 |
9,9 |
7,6 |
6,8 |
4,7 |
14,5 |
15,2 |
8,6 |
11,8 |
Алгоритм построения равноинтервального ряда
1)Внесем массив данных в лист Excel, он займет диапазон А2 : G5.
2)Подсчитаем объем выборки n – число выборочных данных, для этого в ячейку В7 введем формулу = СЧЁТ (А2 : G5). Чтобы в формулу ввести нужный диапазон, необязательно вводить его обозначение с клавиатуры – достаточно его выделить.
3)Определим минимальное и максимальное значение в вы-
борке, введя в ячейку В8 формулу = МИН (А2 : G5)
ив ячейку В9 = МАКС (А2 : G5).
4)Вычислим числоинтерваловk поформулеСтерджесса. Для этоговячейкуВ10 введемформулу= 1 + 3,322 * LOG10 (B7).
5)Полученное значение не является целым, оно равно 5,80746. При округлении этого числа получим 6, вводим это значение в ячейку С10.
6)Длину интервала d вычислим в ячейке В11, введя формулу = (В9 – В8) / С10. При округлении этого числа получим 1,8, вводим это значение в ячейку С11.
7)Зададим массив интервалов, указывая для каждого из 6 интервалов верхнюю границу. Для этого в ячейке D9 вычислим верхнюю границу первого интервала, введя формулу = B8 + C11; в ячейке D9 верхнюю границу второго интервала, введя формулу = D8 + C11. Для вычисления оставшихся значений верхних границ интервалов зафиксируем номер ячейки C11 во введенной формуле при помощи знака $ так, что формула в ячейке D9 примет вид = D8 + C$11,
ископируем содержимое ячейки D9 в ячейки D10 – D14. Последнее полученное значение равно вычисленному ранее в ячейке В9 максимальному значению в выборке.
16

8)Теперь заполним массив «карманов» при помощи функции ЧАСТОТА. Поскольку результатом является столбец частот, введение функции следует завершить нажатием сочетания клавиш CTRL + SHIFT + ENTER (Рис. 3.1).
Рис. 3.1 – Построение равноинтервального ряда
По полученному вариационном ряду построим гистограмму: выделим столбец частот и выберем на вкладке «Вставка» «Гистограмма». Получив гистограмму, изменим в ней подписи горизонтальной оси на значения в диапазоне интервалов, для этого выберем опцию «Выбрать данные» вкладки «Конструктор». В появившемся окне выберем команду «Изменить» для раздела «Подписи горизонтальной оси» и введем диапазон необходимых значений D9 : D14, выделив его «мышью».
17

Задания:
1)сгруппировать данные, представленные в Таблице 3.2, в вариационный ряд;
2)построить гистограмму;
3)данные обработать по двум квадратам отдельно и сравнить полученные вариационные ряды.
Таблица 3.2 – Первичные данные о длине листьев садовой земляники сорта Фестивальная (в см)
6,9 |
7,2 |
9,9 |
6,5 |
9,6 |
7,2 |
7,2 |
7 |
7,5 |
9,7 |
9 |
6 |
7,6 |
8,1 |
11,8 |
5,8 |
9,3 |
7,3 |
8,9 |
7,2 |
7,2 |
6,4 |
7,7 |
9 |
8,1 |
7,1 |
7,1 |
8,8 |
8,4 |
9,9 |
7,5 |
6,8 |
9,8 |
6,4 |
7,4 |
8,7 |
6,3 |
6,8 |
8,8 |
10 |
7 |
7,1 |
8,7 |
6,3 |
8,6 |
7,7 |
7,3 |
8 |
8,4 |
7,1 |
7,3 |
6 |
7,7 |
6,1 |
9,6 |
7,4 |
6,6 |
7,2 |
8,7 |
7,5 |
9,1 |
6,4 |
8,3 |
7,4 |
8,2 |
6,4 |
6,9 |
6,9 |
8,2 |
9 |
7,4 |
8 |
8,4 |
7 |
8 |
7,4 |
6,6 |
6,4 |
8,3 |
7,9 |
8,3 |
9,7 |
5,6 |
6,6 |
6,6 |
7,7 |
8,7 |
5,6 |
7,5 |
5,7 |
8,2 |
7,4 |
7,2 |
6,2 |
6,9 |
6,8 |
9,2 |
9,2 |
7,1 |
6,5 |
5,2 |
8 |
7,1 |
8,4 |
8,1 |
6,8 |
6,1 |
6,8 |
7,9 |
8 |
5,6 |
7,8 |
7,2 |
8,8 |
6,6 |
6,6 |
5,6 |
8,1 |
9 |
8,4 |
8 |
7,4 |
8,7 |
10,3 |
7,8 |
7 |
8,6 |
9,7 |
7 |
8,9 |
6,4 |
8,6 |
7,8 |
5,7 |
8,5 |
10,4 |
7,8 |
7,7 |
8,9 |
8,2 |
8,5 |
7,8 |
7,9 |
7,5 |
8,5 |
7 |
7,9 |
8,1 |
8,7 |
7,2 |
8,1 |
6,2 |
6,8 |
8,2 |
7,2 |
7,9 |
9,8 |
7,6 |
7 |
7 |
7,7 |
8,1 |
7,3 |
7 |
7,4 |
7,6 |
8,4 |
7,3 |
5,9 |
9,4 |
7,8 |
7 |
7,6 |
6,6 |
7,5 |
9,8 |
8,1 |
7,4 |
8,6 |
8,9 |
8 |
7 |
7 |
10,2 |
6,3 |
9,6 |
8,4 |
8,4 |
8 |
7,4 |
7,1 |
7,8 |
7,8 |
8,9 |
6,7 |
7,3 |
8,6 |
7,5 |
8,2 |
6,8 |
18
Лабораторная работа № 4 Расчет основных показателей описательной статистики
Основное назначение описательной статистики (Descriptive statistics) заключается в применении определенных математических подходов для обобщения результатов, полученных в ходе наблюдений и экспериментов, к нескольким итоговым параметрам. Как мы уже выяснили, это можно сделать путем группировки данных в вариационный ряд и последующего графического его изображения. Гистограммы, диаграммы, графики являются достаточно мощным инструментом представления первичной информации собранных данных и позволяют исследователю сделать определенные заключения по поводу свойств изучаемой совокупности.
Различные способы графического представления собранных данных наглядно демонстрируют варьирование признаков, но они недостаточны для полного описания варьирующих объектов и полезны лишь в качестве отправной точки. Обычно требуется более глубокое изучение свойств выборки. Для этой цели служат особые логически и теоретически обоснованные числовые показатели, называемые статистическими характеристиками. При изучении каких-либо биологических объектов не всегда возможно проведение исследования всех членов генеральной совокупности, поэтому ее характеризуют на основании выборки.
Основные выборочные параметры подразделяются на три группы:
1)показатели, описывающие центральную тенденцию в совокупности;
2)показатели, характеризующие степень изменчивости (вариабельность, разброс) изучаемого признака;
3)показатели формы распределения.
Простейшее обобщение любого набора данных представляет собой единственное число, которое наилучшим образом отражает все значения. Существует три вида такой обобщающей меры: среднее, медиана, мода. Среднее арифметиче-
19

ское является обобщающей величиной, которая как бы «впитывает» в себя свойства всей совокупности в целом. Важно понимать, что численное значение средней как таковой может в выборке и не встречаться. Но в то же время оно конкретно и выражается в тех же единицах измерения, что и варианты ряда.
Рассмотрим следующий пример. В хозяйстве содержатся 18 коров черно-пестрой породы. Распределение значений среднесуточного надоя Y (в литрах) представлено в Таблице 4.1. Необходимо провести первичную статистическую обработку данной выборки.
Таблица 4.1 – Среднесуточный надой коров черно-пестрой породы
№ коровы |
Надой, л |
1 |
18 |
2 |
17 |
3 |
21 |
4 |
22 |
5 |
19 |
6 |
20 |
7 |
18 |
8 |
22 |
9 |
24 |
10 |
21 |
11 |
18 |
12 |
17 |
13 |
20 |
14 |
17 |
15 |
19 |
16 |
21 |
17 |
24 |
18 |
19 |
Решение. Открываем новый рабочий лист или новую книгу MS Excel и создаем таблицу данных. В меню инструментов «Анализ данных» выбираем инструмент Описательная статистика. Появляется диалоговое окно, показанное на Рис. 4.1.
В этом диалоговом окне курсором выделяем входной интервал В2 – В32; группирование делаем «по столбцам»; ставим флажки в окошках «метки в первой строке» (при этом в итоговой таблице будет надпись «Y, л»), «итоговая статистика» и минимальный «уровень надежности 95 %» (т. е. доверительная вероятность Р > 0,95, либо значимость p < 0,05). Далее курсором выделяем произвольный выходной интервал (например, D3) и нажимаем на кнопку «OK».
20