Добавил:
chemist5734494@gmail.com Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Биометрия методичка

.pdf
Скачиваний:
11
Добавлен:
29.06.2024
Размер:
2.04 Mб
Скачать

Рис. 2.1 – Инструмент «Выборка».

В результате работы инструмента «Выборка» MS Excel разместил в указанном столбце 18 значений, выбранных случайных образом из диапазона A2 : J17. При необходимости количество случайных значений можно установить даже больше, чем значений в исходной совокупности (конечно же, при этом будут повторы).

Выборка с определенной периодичностью

С помощью инструмента «Выборка» можно осуществить выборку из генеральной совокупности с определенной заданной периодичностью. В этом случае исследователь должен сам убедиться, что данная выборка будет репрезентативной.

11

Для этого следует отметить метод выборки Периодический. Установить в поле Период, например, значение «4».

Инструмент «Выборка» выведет каждое четвертое зна-

чение из Входного интервала (Рис. 2.2).

Рис. 2.2 – Методвыборки«Периодический» инструмента«Выборка»

В поле Выходной интервал достаточно ввести ссылку на верхнюю ячейку диапазона с результатами (укажем ячейку М2). Нажимаем ОК.

Если исходная генеральная совокупность имеет цикличность и упорядочена, то можно создать выборку, содержащую значения только из отдельной части цикла. Например, если входной диапазон содержит данные по квартальным учетам продаж минеральных удобрений за несколько лет, то создание выборки с периодом, равным 3, разместит в выходном интервале значения продаж только из заданного квартала.

Задания Задание 1. Получены данные по массе плодов грецкого

ореха четырёх сортов – Нежный, Совершенный, Минский, Волховский (Таблица 2.2).

12

Таблица 2.2 – Масса плодов грецкого ореха четырех сортов

 

Масса плода, г

 

Нежный

Совершенный

Минский

Волховский

47,7

49,4

55,6

52,4

54,6

50,5

55,0

49,4

53,7

52,3

46,9

51,7

50,4

58,0

52,9

54,3

47,2

50,2

48,5

55,6

53,0

50,0

53,8

51,2

52,7

53,3

56,7

51,1

54,1

46,7

48,3

49,8

50,2

53,2

50,9

51,7

49,0

53,6

50,5

54,0

52,9

51,8

50,9

48,5

56,2

53,8

52,5

49,5

55,2

49,7

49,7

52,7

56,1

50,4

58,0

51,2

45,5

52,6

53,0

55,3

55,7

56,7

52,6

49,4

47,9

51,0

54,4

51,1

52,8

49,2

52,1

50,0

48,7

49,2

52,2

52,8

56,9

48,1

48,4

52,2

49,2

50,9

51,7

52,1

51,5

56,0

50,6

54,7

51,1

53,8

55,9

52,4

50,7

50,3

54,2

47,9

53,7

50,0

56,9

48,5

52,1

49,9

55,3

54,1

51,0

52,3

56,9

53,7

50,2

47,7

55,1

53,2

54,8

51,9

50,5

53,1

49,9

49,8

52,6

53,9

55,6

57,1

52,8

53,4

51,6

55,6

53,3

53,9

54,8

51,0

54,0

53,3

51,8

52,8

52,4

54,3

52,3

50,8

47,3

49,0

52,3

56,7

53,9

59,4

53,3

50,4

51,4

46,5

53,6

48,2

54,2

49,1

53,1

48,1

51,1

48,7

55,5

52,2

52,0

50,9

Из указанной генеральной совокупности необходимо с периодом в шесть значений отобрать репрезентативную выборочную совокупность.

Задание 2. Получены данные по массе колосьев ячменя сорта Янтарный (Таблица2.3). Из указанной генеральной совокупности необходимо случайным образом отобрать репрезентативнуювыборочнуюсовокупностьвколичестве22 вариант.

13

Таблица 2.3 – Масса колосьев ячменя сорта Янтарный

 

 

 

Масса колосьев, г

 

 

 

62,86

59,90

60,48

62,37

63,43

63,87

68,84

67,26

63,90

63,25

62,38

62,65

56,90

63,55

66,02

64,37

62,83

68,46

67,98

65,26

58,53

58,99

60,85

66,50

58,37

64,17

63,50

67,68

62,47

64,97

59,43

63,48

62,88

63,61

61,45

65,80

63,16

60,21

66,37

63,99

66,83

65,01

65,53

63,89

62,51

59,70

60,40

59,93

63,38

55,33

65,13

62,63

58,02

59,65

59,52

61,69

67,85

63,23

63,20

64,28

61,11

64,78

60,18

57,88

60,09

67,38

65,42

64,34

62,06

62,47

63,83

58,16

61,20

67,93

62,40

62,77

63,40

61,07

65,94

65,65

66,58

66,04

62,48

65,17

62,66

66,54

67,35

67,01

65,79

61,67

58,08

64,88

68,59

62,21

61,04

59,70

67,83

60,29

67,53

62,19

58,71

65,12

61,28

60,21

57,90

62,86

63,00

63,84

65,95

65,63

62,50

67,31

67,05

62,46

62,06

64,82

63,05

67,39

59,57

62,43

63,07

66,02

70,89

65,76

65,21

61,66

67,13

62,54

61,21

60,95

61,35

63,57

59,26

68,27

65,14

64,06

63,34

63,70

63,26

65,40

61,27

58,17

62,43

62,39

59,16

63,84

61,35

63,02

68,12

61,16

69,45

61,79

66,14

65,29

63,02

65,08

62,44

62,93

62,87

60,56

64,04

67,27

14

Лабораторная работа № 3 Группировка данных и анализ распределений

Группировка данных – процесс систематизации первичных биометрических данных в целях обнаружения закономерности, которой подчиняется исследуемое явление или процесс. Группировка бывает простая (по одному признаку) и сложная (по нескольким признакам). Форма группировки данных – статистическая таблица и вариационный ряд.

Любой вариационный ряд характеризуется двумя элементами:

1)варианта (хi) – это отдельные значения признака единиц выборочной совокупности. Для вариационного ряда варианта принимает числовые значения, для атрибутивного – качественные;

2)частота (ni) – число, показывающее, сколько раз встречается то или иное значение признака в вариационном ряду.

Вариационный ряд называют интервальным, когда определены границы «от» и «до» для непрерывно варьируемого признака. Интервальный ряд также строят, если множество значений дискретно варьируемого признака велико.

Интервальный ряд можно строить как с интервалами равной длины (равноинтервальный ряд) так и с неодинаковыми интервалами, если это необходимо по условиям статистического исследования. Если цель исследования не определяет способ построения интервального ряда, то строят равноинтервальный ряд, число интервалов в котором определяют по формуле Стерджесса (формула 3.1):

 

k = 1 + 3,322 lg (n),

(3.1)

где k

– число интервалов;

 

n

– объем выборки.

 

Пример. Получены данные о массе плодов голубики сорта Блюголд (Таблица 3.1).

Необходимо составить равноинтервальный ряд, построить гистограмму.

15

Таблица 3.1 – Масса плодов голубики сорта Блюголд

 

 

Масса плодов голубики сорта Блюголд, г

 

 

10,3

11,0

6,9

11,0

11,8

11,8

8,2

8,3

9,9

4,4

9,2

8,6

13,7

8,4

6,2

11,1

11,7

11,2

7,6

13,2

9,9

7,6

6,8

4,7

14,5

15,2

8,6

11,8

Алгоритм построения равноинтервального ряда

1)Внесем массив данных в лист Excel, он займет диапазон А2 : G5.

2)Подсчитаем объем выборки n – число выборочных данных, для этого в ячейку В7 введем формулу = СЧЁТ (А2 : G5). Чтобы в формулу ввести нужный диапазон, необязательно вводить его обозначение с клавиатуры – достаточно его выделить.

3)Определим минимальное и максимальное значение в вы-

борке, введя в ячейку В8 формулу = МИН (А2 : G5)

ив ячейку В9 = МАКС (А2 : G5).

4)Вычислим числоинтерваловk поформулеСтерджесса. Для этоговячейкуВ10 введемформулу= 1 + 3,322 * LOG10 (B7).

5)Полученное значение не является целым, оно равно 5,80746. При округлении этого числа получим 6, вводим это значение в ячейку С10.

6)Длину интервала d вычислим в ячейке В11, введя формулу = (В9 – В8) / С10. При округлении этого числа получим 1,8, вводим это значение в ячейку С11.

7)Зададим массив интервалов, указывая для каждого из 6 интервалов верхнюю границу. Для этого в ячейке D9 вычислим верхнюю границу первого интервала, введя формулу = B8 + C11; в ячейке D9 верхнюю границу второго интервала, введя формулу = D8 + C11. Для вычисления оставшихся значений верхних границ интервалов зафиксируем номер ячейки C11 во введенной формуле при помощи знака $ так, что формула в ячейке D9 примет вид = D8 + C$11,

ископируем содержимое ячейки D9 в ячейки D10 – D14. Последнее полученное значение равно вычисленному ранее в ячейке В9 максимальному значению в выборке.

16

8)Теперь заполним массив «карманов» при помощи функции ЧАСТОТА. Поскольку результатом является столбец частот, введение функции следует завершить нажатием сочетания клавиш CTRL + SHIFT + ENTER (Рис. 3.1).

Рис. 3.1 – Построение равноинтервального ряда

По полученному вариационном ряду построим гистограмму: выделим столбец частот и выберем на вкладке «Вставка» «Гистограмма». Получив гистограмму, изменим в ней подписи горизонтальной оси на значения в диапазоне интервалов, для этого выберем опцию «Выбрать данные» вкладки «Конструктор». В появившемся окне выберем команду «Изменить» для раздела «Подписи горизонтальной оси» и введем диапазон необходимых значений D9 : D14, выделив его «мышью».

17

Задания:

1)сгруппировать данные, представленные в Таблице 3.2, в вариационный ряд;

2)построить гистограмму;

3)данные обработать по двум квадратам отдельно и сравнить полученные вариационные ряды.

Таблица 3.2 – Первичные данные о длине листьев садовой земляники сорта Фестивальная (в см)

6,9

7,2

9,9

6,5

9,6

7,2

7,2

7

7,5

9,7

9

6

7,6

8,1

11,8

5,8

9,3

7,3

8,9

7,2

7,2

6,4

7,7

9

8,1

7,1

7,1

8,8

8,4

9,9

7,5

6,8

9,8

6,4

7,4

8,7

6,3

6,8

8,8

10

7

7,1

8,7

6,3

8,6

7,7

7,3

8

8,4

7,1

7,3

6

7,7

6,1

9,6

7,4

6,6

7,2

8,7

7,5

9,1

6,4

8,3

7,4

8,2

6,4

6,9

6,9

8,2

9

7,4

8

8,4

7

8

7,4

6,6

6,4

8,3

7,9

8,3

9,7

5,6

6,6

6,6

7,7

8,7

5,6

7,5

5,7

8,2

7,4

7,2

6,2

6,9

6,8

9,2

9,2

7,1

6,5

5,2

8

7,1

8,4

8,1

6,8

6,1

6,8

7,9

8

5,6

7,8

7,2

8,8

6,6

6,6

5,6

8,1

9

8,4

8

7,4

8,7

10,3

7,8

7

8,6

9,7

7

8,9

6,4

8,6

7,8

5,7

8,5

10,4

7,8

7,7

8,9

8,2

8,5

7,8

7,9

7,5

8,5

7

7,9

8,1

8,7

7,2

8,1

6,2

6,8

8,2

7,2

7,9

9,8

7,6

7

7

7,7

8,1

7,3

7

7,4

7,6

8,4

7,3

5,9

9,4

7,8

7

7,6

6,6

7,5

9,8

8,1

7,4

8,6

8,9

8

7

7

10,2

6,3

9,6

8,4

8,4

8

7,4

7,1

7,8

7,8

8,9

6,7

7,3

8,6

7,5

8,2

6,8

18

Лабораторная работа № 4 Расчет основных показателей описательной статистики

Основное назначение описательной статистики (Descriptive statistics) заключается в применении определенных математических подходов для обобщения результатов, полученных в ходе наблюдений и экспериментов, к нескольким итоговым параметрам. Как мы уже выяснили, это можно сделать путем группировки данных в вариационный ряд и последующего графического его изображения. Гистограммы, диаграммы, графики являются достаточно мощным инструментом представления первичной информации собранных данных и позволяют исследователю сделать определенные заключения по поводу свойств изучаемой совокупности.

Различные способы графического представления собранных данных наглядно демонстрируют варьирование признаков, но они недостаточны для полного описания варьирующих объектов и полезны лишь в качестве отправной точки. Обычно требуется более глубокое изучение свойств выборки. Для этой цели служат особые логически и теоретически обоснованные числовые показатели, называемые статистическими характеристиками. При изучении каких-либо биологических объектов не всегда возможно проведение исследования всех членов генеральной совокупности, поэтому ее характеризуют на основании выборки.

Основные выборочные параметры подразделяются на три группы:

1)показатели, описывающие центральную тенденцию в совокупности;

2)показатели, характеризующие степень изменчивости (вариабельность, разброс) изучаемого признака;

3)показатели формы распределения.

Простейшее обобщение любого набора данных представляет собой единственное число, которое наилучшим образом отражает все значения. Существует три вида такой обобщающей меры: среднее, медиана, мода. Среднее арифметиче-

19

ское является обобщающей величиной, которая как бы «впитывает» в себя свойства всей совокупности в целом. Важно понимать, что численное значение средней как таковой может в выборке и не встречаться. Но в то же время оно конкретно и выражается в тех же единицах измерения, что и варианты ряда.

Рассмотрим следующий пример. В хозяйстве содержатся 18 коров черно-пестрой породы. Распределение значений среднесуточного надоя Y (в литрах) представлено в Таблице 4.1. Необходимо провести первичную статистическую обработку данной выборки.

Таблица 4.1 – Среднесуточный надой коров черно-пестрой породы

№ коровы

Надой, л

1

18

2

17

3

21

4

22

5

19

6

20

7

18

8

22

9

24

10

21

11

18

12

17

13

20

14

17

15

19

16

21

17

24

18

19

Решение. Открываем новый рабочий лист или новую книгу MS Excel и создаем таблицу данных. В меню инструментов «Анализ данных» выбираем инструмент Описательная статистика. Появляется диалоговое окно, показанное на Рис. 4.1.

В этом диалоговом окне курсором выделяем входной интервал В2 – В32; группирование делаем «по столбцам»; ставим флажки в окошках «метки в первой строке» (при этом в итоговой таблице будет надпись «Y, л»), «итоговая статистика» и минимальный «уровень надежности 95 %» (т. е. доверительная вероятность Р > 0,95, либо значимость p < 0,05). Далее курсором выделяем произвольный выходной интервал (например, D3) и нажимаем на кнопку «OK».

20

Соседние файлы в предмете Биологическая статистика
  • #
  • #
    29.06.202452.9 Кб3БИОМЕТРИЯ.xlsx
  • #
    29.06.202428.24 Кб3Голуб С.В. 23Х-1 1 вариант.xlsx
  • #
    29.06.20241.53 Mб1ответы.docx
  • #
    29.06.202424.18 Кб1Петрович В.А 21БХ-1 2 вариант.xlsx
  • #
    29.06.202426.32 Кб1Петрович В.А 21БХ-1 3 вариант.xlsx