Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Задачник по биометрии.doc
Скачиваний:
24
Добавлен:
25.08.2019
Размер:
2.13 Mб
Скачать

Рубежный контроль

Цена одной задачи – 5 баллов

Оценка освоения материала студентами в зависимости от количества набранных баллов

Количество баллов

Оценка

Менее 45

Неудовлетворительно (2)

От 45 до 70

Удовлетворительно (3)

От 70 до 100

Хорошо (4)

Свыше 100

Отлично (5)

Модуль 5 расчет показателей корреляции

Цель – познакомить студентов с основными способами расчета показателей корреляции.

В отличие от функциональной связи, когда одному значению аргумента (х) соответствует определенное значение функции (у), при корреляционной связи – одному конкретному значению аргумента соответствует приближенное, или некоторое множество значений функции. Близость этого множества значений функции к друг другу соответствует понятию силы или тесноты корреляционной связи.

Биологические объекты всегда в той или иной степени неоднородны по своим наследственным особенностям и, кроме того, в любом, даже тщательно спланированном эксперименте его объекты испытывают не учитываемые воздействия факторов внешней среды.

При изучении корреляционных связей возникают два основных вопроса – о тесноте связи и о форме связи. Для измерения тесноты и формы связи используют специальные статистические методы, называемые корреляцией и регрессией. По форме корреляция может быть линейной и криволинейной, по направлению прямой и обратной. В пособии рассматривается только случай линейной корреляции как наиболее простой.

Под линейной корреляцией между двумя признаками X и Y понимают такую зависимость, которая носит линейный характер и выражается уравнением прямой линии Y = a + bX. Это уравнение называется уравнением регрессии Y по X, а соответствующая ему прямая линия – выборочной линией регрессии.

Пример 5.1. Изучали зависимость между массой тела гамадрилов-матерей и их новорожденных детенышей. Под наблюдением находилось 20 обезьян. Результаты наблюдений приведены в первых двух столбцах таблицы.

Масса тела матерей , кг

Масса тела детенышей , кг

10,0

0,70

– 1,87

0

0

10,8

0,73

–1,07

0,03

–0,0320

11,3

0,75

–0,57

0,05

–0,0285

10,0

0,70

–1,87

0

0

10,1

0,65

–1,77

–0,05

0,0885

11,1

0,65

–0,77

–0,05

0,0385

11,3

0,70

–0,57

0

0

10,2

0,61

–1,67

–0,09

0,1503

13,5

0,70

1,63

0

0

12,3

0,63

0,43

–0,07

–0,0301

14,5

0,70

2,63

0

0

11,0

0,65

–0,87

–0,05

0,0435

12,0

0,72

0,13

0,02

0,0026

11,8

0,69

–0,07

–0,01

0,0070

13,4

0,78

1,53

0,08

0,1224

11,4

0,70

–0,47

0

0

12,0

0,60

0,13

–0,10

–0,0130

15,6

0,85

3,73

0,15

0,5595

13,0

0,80

1.13

0,10

0,1130

12,1

0,75

0,23

0,05

0,0115

= 237,4

14,06

+1,0332

Необходимо установить тесноту и направление связи между этими признаками.

Для этого наиболее приемлемой статистикой является коэффициент корреляции, который вычисляется по формуле:

Коэффициент вариации это отвлеченное число, лежащее в интервалах от – 1 до + 1. При независимом варьировании признаков, когда связь между ними полностью отсутствует, = 0. Чем сильнее сопряженность между признаками, тем выше значение коэффициента корреляции. При положительной или прямой связи, когда большим значениям одного признака соответствует большее же значение другого, коэффициент корреляции имеет положительный знак, при отрицательной или обратной связи, когда большим значениям одного признака соответствуют меньшие значения другого, коэффициент корреляции сопровождается отрицательным знаком.

Для расчета коэффициента корреляции нам необходимо найти значения средних арифметических для анализируемой пары признаков. Они равны = 11,87 и = 0,70.

Далее находим значения средних квадратических отклонений, по формулам известным из предыдущих модулей задачника. Они равны = 1,516 и = 0,063.

Рассчитаем значение . Оно равно + 1,0332. Подставим полученные промежуточные статистики в формулу:

Таким образом, полученная величина эмпирического коэффициента вариации указывает на наличие положительной средней силы корреляционной связи между массой тела гамадрилов матерей и массой тела их детенышей.

Эмпирический коэффициент корреляции служит оценкой своего генерального параметра (генерального коэффициента корреляции ) и как величина случайная сопровождается ошибкой:

= 0,198

Отношение выборочного коэффициента корреляции к своей ошибке служит критерием для проверки нулевой гипотезы – предположения, что в генеральной совокупности этот показатель равен нулю, т.е. = 0. Нулевую гипотезу отвергают на принятом уровне доверительной вероятности, если:

Рассчитаем фактический критерий Стьюдента:

.

По таблице значений критерия Стьюдента находим при k = 20 –1 = 18 и P = 95%, который равен 2,10.

Таким образом, нулевая гипотеза отвергается при доверительной вероятности P = 95%.

После того как установлено наличие корреляционной связи между двумя изученными признаками, можно установить закономерность количественного изменения одного из признаков (функция) при изменении другого (аргумент). С этой целью изучаемую связь выражают аналитически – в виде соответствующего уравнения регрессии и графически – с вычислением точек теоретической кривой по найденному уравнению.

Пример 5.2. Необходимо рассчитать уравнение линейной регрессии отражающую зависимость между массой тела гамадрилов-матерей и их новорожденных детенышей и выразить его графически (по данным примера 5.1.).

Уравнение регрессии может быть записано следующим образом:

и , где – свободный член уравнения, b – коэффициент регрессии, определяющий наклон линии регрессии по отношению к осям прямоугольных координат. Коэффициент регрессии показывает, насколько в среднем величина одного признака изменяется на единицу меры другого. Этот показатель определяется по формуле: или .

Найдем значение .

Используя уравнение , найдем значение , подставив в формулу ранее найденные значения средних арифметических обоих признаков и значение коэффициента регрессии: откуда = 0,70 – 0,267 = 0,433

В результате уравнение регрессии будет выглядеть следующим образом:

Г рафическое выражение рассчитанной регрессии представлено на рисунке.

На рисунке прямая – теоретическая линия прямолинейной регрессии расположена на фоне эмпирических значений функции.

Ошибка уравнения прямолинейной регрессии (ли криволинейной) вычисляется по формуле: , где y – эмпирическое значение функции; – теоретическое значение функции; n – число точек эмпирической линии регрессии; k – число коэффициентов уравнения, включая свободный член (для линейной регрессии 2).

Необходимые для определения ошибки регрессии, предварительные расчеты приведены в таблице

Масса тела матерей

Масса тела детенышей

Теоретические значения функции

10,0

0,70

0,658

0,002

10,8

0,73

0,676

0,003

11,3

0,75

0,687

0,004

10,0

0,70

0,658

0,002

10,1

0,65

0,660

0,0001

11,1

0,65

0,683

0,001

11,3

0,70

0,687

0,0003

10,2

0,61

0,663

0,003

13,5

0,70

0,737

0,001

12,3

0,63

0,710

0,006

14,5

0,70

0,759

0,004

11,0

0,65

0,681

0,001

12,0

0,72

0,703

0,0003

11,8

0,69

0,699

0,0001

13,4

0,78

0,735

0,002

11,4

0,70

0,690

0,0001

12,0

0,60

0,703

0,011

15,6

0,85

0,784

0,066

13,0

0,80

0,726

0,0006

12,1

0,75

0,705

0,002

0,1115

Подставим полученные результаты в формулу .

Коэффициент регрессии – основной параметр уравнения прямой линии, поэтому необходимо оценивать достоверность отличия коэффициента b от нуля ( : b = 0).

Критерий Стьюдента рассчитывается по формуле: , где – коэффициент при аргументе в уравнении прямой линии; – среднее квадратическое отклонение ряда аргумента; – ошибка уравнения регрессии; n – объем выборки (количество пар).

Фактическое значение коэффициента Стьюдента сравнивается с при числе степеней свободы k = n – 2; если вычисленная величина больше табличной, то связь между x, y и значение достоверны, а если вычисленная меньше табличной величины, то связь данных признаков и значение недостоверны. Для данного примера

По таблице при P = 95% = 2,093, так как , нулевая гипотеза остается в силе. Действительно, для таких экспериментов выборка объемом 20 объектов является недостаточной.

Пример 5.3. Требуется объективно подобрать из числа опытных специалистов группу экспертов для оценки сортов декоративных растений. Для этого двум специалистам предлагается оценить 13 сортов одной цветочной культуры. Оценка ведется по комплексу признаков и выражается в виде суммы балов.

В этом случае может быть использован показатель корреляции рангов по Спирмэну. Сила корреляционной связи между двумя признаками при помощи этого показателя измеряется в основном для небольших невзвешенных рядов, которые представляют собой качественные оценки признаков.

Необходимые данные для расчета показателя корреляции рангов между оценками двух экспертов приведены в таблице.

Сумма баллов первого эксперта, х

Сумма баллов второго эксперта, у

Ранг, х

Ранг, у

Разность рангов,

72

62

1

10

9

81

67

60

2

12

10

100

64

70

3,5

3,5

0

0

64

72

3,5

1

2,5

6,25

63

57

5

13

8

64

56

61

6

11

5

25

54

68

7

5

2

4

53

66

8,5

6

2,5

6,25

53

65

8,5

7

1,5

2,25

52

64

10

8

2

4

44

70

11

3,5

7,5

56,25

34

63

12

9

3

9

33

71

13

2

11

121

Показатель корреляции рангов по Спирмэну рассчитывается по формуле:

, где n – число пар вариант корреляционных рядов, – сумма квадратов попарных разностей рангов.

Последовательность действий при расчете показателя корреляции рангов следующая:

Ранжируем данные рядов Х и У от большего к меньшему, присваивая вариантам порядковый номер. Варианта 72 ряда Х получает ранг 1, варианта 67 – ранг 2, варианты 64 и 64 должны были бы получить ранги 3 и 4, но так как они имеют равное значение, то берется средний ранг для обеих вариант: (3+4)/2 = 3,5. Остальные ранги рядов присваиваются по аналогии и представлены в таблице;

Получаем разность рангов без учета их знаков;

Возводим разности в квадрат и суммируем, получаем = 479;

Подставляем полученные значения в формулу

= – 0,32.

Достоверность показателя корреляции рангов оценивается по формуле

.

Подставим имеющиеся данные и найдем . При Р = 95% и k = n -- 2 = 13 – 2 = 11, =2,201.

Следовательно, полученный показатель корреляции рангов статистически недостоверен и кандидаты на должность эксперта не подходят или не подходит один из них.

Пример 5.4. Необходимо установить связь между плодовитостью самок кролика в системе «родители – дети»

Число детенышей в помете у «матерей», х

Число детенышей в помете у «дочерей», у

Ранг, х

Ранг, у

Разность рангов,

12

10

1

2

1

1

10

13

2

1

1

1

8

8

3

3

0

0

7

6

4

5

1

1

4

7

5

4

1

1

В этом случае показатель наследуемости может служить коэффициент корреляции рангов Спирмэна, способ расчета которого приведен в примере 5.3.

Подставим имеющиеся значения в формулу: = = +0,80. Полученный коэффициент указывает на тесную и прямую зависимость между плодовитостью «матерей» и «дочерей».

Достоверность показателя наследуемости (корреляции рангов) оценим по формуле . Подставим имеющиеся данные и найдем . При Р = 95% и k = n – 2 = 5 – 2 = 3, = 3,182. Так как, > , нулевая гипотеза отвергается и связь между плодовитостью «матерей» и «дочерей» считается статистически доказанной.

Вопросы для самоконтроля:

  1. Что такое корреляция?

  2. Какая разница между корреляционной и функциональной зависимостью?

  3. Какая разница между положительной и отрицательной корреляциями?

  4. Что такое корреляционная решетка? Объясните как она строится. Можно ли судить о характере корреляции по расположению данных в корреляционной решетке?

  5. Каковы возможные значения коэффициента корреляции? Какие значения коэффициента корреляции следует считать высокими, средними и почему?

  6. Всегда ли при r = 0 корреляционная связь отсутствует?

  7. Чему равен коэффициент корреляции при полной корреляционной связи?

Задачи для самостоятельного решения.

  1. Длины первого (х) и второго (у) молярного зубов у ископаемого млекопитающего Phenacodus primaevus оказались следующими (в мм):

х

10,7

10,8

10,6

11,4

12,1

12,3

12,9

12,8

13,1

13,3

13,3

13,4

13,5

у

11,2

10,5

9,6

11,2

11,3

13,4

12,6

12,2

12,0

11,2

11,4

11,3

13,6

Определите коэффициент корреляции, оцените его достоверность и установите доверительные границы при Р = 0,99.

  1. У окуня озера Баторино были измерены длина головы х и длина грудного плавника y:

х

66

61

67

73

51

59

48

47

58

44

41

54

52

47

51

45

у

38

31

36

43

29

33

28

25

36

26

21

30

28

27

28

26

Рассчитайте коэффициент корреляции между этими признаками.

  1. Надо было установить, есть ли корреляция между высотой головы (x) и длиной 3-го членика усика (y) у Drosophila funebris. Для этого с помощью окуляр - микрометра получены следующие данные по х и у (в делениях окулярмикрометра):

х

16

15

16

15

15

16

16

17

18

18

17

17

17

15

16

15

13

15

у

33

29

31

32

33

32

33

33

36

36

35

35

35

35

33

33

30

32

х

15

16

15

15

16

15

16

15

16

14

15

15

13

15

16

14

15

15

у

33

33

32

30

33

33

33

30

31

31

31

33

30

30

33

30

33

31

х

15

15

15

16

18

15

14

15

15

14

16

17

15

15

15

14

15

14

у

31

31

32

33

35

32

32

32

31

31

33

35

32

31

34

30

33

32

х

15

17

15

14

15

18

17

17

18

17

17

16

17

18

18

16

16

17

у

31

36

33

33

33

35

36

34

35

33

32

34

34

34

35

35

33

34

Вычислите коэффициент корреляции и определите его достоверность.

  1. Между живым и убойным весом свиней на материале 533 голов был получен = 0.986. Каковы доверительные границы этого коэффициента корреляции при доверительной вероятности 0.95?

  2. Получены следующие данные о продолжительности беременности у кроликов породы шиншилла при различном количестве крольчат в помете (число крольчат в помете х и длительность беременности в днях у):

х

4

1

8

3

5

7

8

4

8

3

4

4

8

8

5

7

6

6

5

у

31

32

32

31

32

31

31

30

31

31

32

31

30

32

32

31

31

31

32

х

6

9

6

6

5

7

8

10

6

7

6

7

6

5

10

7

8

8

6

у

31

31

31

32

32

31

30

32

31

31

31

32

32

31

31

31

31

31

32

х

6

5

4

6

8

6

5

8

7

6

5

9

5

3

4

7

8

9

5

у

33

33

30

31

31

31

32

31

31

32

33

32

31

31

31

31

30

31

32

Есть ли корреляция между продолжительностью беременности и численностью детенышей?

  1. Учитывали плодовитость самок серебристо-черных лисиц х в совхозе «Белорусский» и плодовитость их дочерей у:

х

6

7

5

6

5

5

4

5

5

4

6

7

6

5

6

у

4

5

4

4

6

2

3

3

2

6

6

9

7

2

4

Есть ли корреляция между плодовитостью матерей и плодовитостью их дочерей?

  1. Были получены следующие данные о весе ягнят (одинцов) у и весе баранов – их отцов х (в кг):

х

48,5

76,6

72,2

67,0

66,5

63,3

65,4

63,9

у

4,03

4,56

4,79

4,49

4,32

4,59

4,25

4,67

х

63,1

63,0

62,5

62,2

61,0

60,2

60,0

59,6

у

4,29

4,57

4,20

4,12

4,13

4,70

3,80

4,23

Есть ли корреляция между массой тех и других?

  1. При объединении ряда данных о корреляции между длиной крыла и длиной хоботка у пчел = 0.721 (n = 126 пчелам). Каковы его доверительные границы при Р = 99%?

  2. У серебристо-черных лисиц были измерены длина туловища (х) и длина хвоста (у):

х

65

70

65

66

65

71

68

64

57

66

65

67

62

67

62

у

41

40

40

40

40

40

42

39

38

41

43

39

45

43

38

х

63

57

64

66

69

58

63

67

67

67

65

65

67

70

65

у

40

40

41

45

43

37

45

38

39

37

42

38

38

38

38

х

71

69

64

64

66

69

72

66

66

67

66

76

68

71

71

у

40

39

43

43

42

40

41

47

47

40

40

41

40

41

34

Есть ли корреляция между длиной туловища и длиной хвоста у лисиц? Если коэффициент корреляции окажется достоверный, определите доверительные границы для него при Р = 0,95.

  1. Были получены следующие данные о массе х (в кг) и длине туловища у (в см) серебристых лисиц:

х

65

70

65

66

65

71

68

64

57

66

65

67

62

67

62

у

41

40

40

40

40

40

42

39

38

41

43

39

45

43

38

х

63

57

64

66

69

58

63

67

67

67

65

65

67

70

65

у

40

40

41

45

43

37

45

38

39

37

42

38

38

38

38

Есть ли корреляция между массой и длиной туловища у лисиц?

  1. Были получены следующие данные о массе х (в г) левой камеры сердца и размеру клеточных ядер у μ) в мышцах сердца:

х

632

207

221

256

262

273

289

292

304

328

372

397

460

291

у

28,4

16,6

18,0

15,9

20,7

19,4

19,8

21,0

23,0

13,6

19,6

22,9

19,4

11,7

Ввиду резко асимметричного распределения вариант по ряду х примените для установления связи коэффициент ранговой корреляции.

  1. На 12 экземплярах солонгая (Mustela altaica) были получены следующие данные о длине тела х (в мм), хвоста у (в мм) и общей массе z (в г):

х

172

175

163

165

161

174

159

154

163

172

164

172

у

81

90

74

78

70

86

80

70

79

81

77

81

z

83

110

72

84

86

130

116

80

122

83

94

83

Определите путем вычисления коэффициента ранговой корреляции, есть ли связь между длиной тела и хвоста и длиной тела и массой солонгаев. Оцените степень достоверности полученных коэффициентов ранговой корреляции.

  1. Были получены следующие данные о массе х (в кг) и размерах шкурки – длина у и ширина z (в см) – бобров, добытых в октябре – декабре:

x

8,9

13,3

14,35

19,0

29,6

5,4

6,45

7,0

11,1

y

76

92

85

104

105

69

71

83

85

z

37

49

48

54

44

35

35

42

42

Определите частные коэффициенты корреляции между этими признаками.

  1. У 25 экземпляров днепровского ерша были изучены: длина тела х (в см), масса у (в г) и масса гонад z (в г):

х

10

10

10,4

10,4

10,5

10,5

10,6

10,7

10,7

10,7

10,8

10,8

10,9

у

19,0

20,0

28,0

35,0

27,0

26,0

28,0

28,0

30,0

27,0

29,0

27,0

31,0

z

2,2

2,1

3,1

4,4

3,5

2,9

3,8

3,2

2,1

2,6

3,4

2,8

3,2

х

11,0

11,0

11,0

11,0

11,1

11,2

11,3

11,3

11,5

12,5

12,6

13,6

у

27,0

31,0

30,0

28,0

32,0

45,0

31,0

35,0

37,0

49,0

54,0

56,0

z

3,2

3,3

4,0

3,4

2,6

3,2

2,8

4,6

3,8

6,7

7,0

8,7

Определите коэффициенты корреляции между этими признаками и значения средних арифметических с их ошибками.

  1. У 16 экземпляров щук были измерены длина тела х (в см), масса у (в г) и масса икры z (в г):

х

33,4

32,8

38,0

33,4

42,5

90,0

38,0

67,0

у

456

375

484

456

788

7900

9581

3550

z

32

34

24

19

126

744

42

579

х

35,4

42,8

36,0

50,5

53,4

62,0

64,0

71,0

у

478

783

365

1300

1998

2320

3650

3450

z

49

138

22

110

287

149

461

202

Определите коэффициенты корреляции между этими признаками.

  1. Коровы холмогорские помеси 2-го поколения по высоте в холке х, глубине груди у и ширине в моклоках z были следующими:

х

125

126

133

130

126

132

130

130

122

133

131

у

69

69

70

71

68

73

72

72

66

76

70

z

56

52

49

53

42

56

53

53

51

57

50

х

131

138

132

127

125

122

123

128

126

126

124

у

57

73

71

71

68

67

69

70

70

65

68

z

55

50

54

53

50

50

49

52

52

51

52

Вычислите rxy, rxz, r yz . Определите также , .

  1. В опытах по кормлению крыс в течение 28 дней были получены следующие данные (в г) (начальная масса x1, количество скормленной пищи х2, конечная масса у):

x1,

16,9

12,2

13,4

15,0

13,8

17,8

20,4

7,9

16,0

12,8

х2

105

96

90

24

153

82

88

66

118

135

у

20,2

20,5

18,9

26,4

25,4

9,4

21,2

9,2

41,1

31,3

x1,

25,8

15,8

18,1

13,3

20,1

10,1

17,1

21,0

23,7

11,2

х2

98

116

104

99

153

98

103

112

133

80

у

14,8

9,7

11,3

26,0

44,7

21,0

25,2

13,7

38,5

5,8

Вычислите коэффициенты корреляции: 1) между х1 и х2; 2) между х1 и у; 3) между х2 и у.

  1. В 12 анализах крови определяли: х – число эритроцитов (в миллионах), у – содержание гемоглобина (в %) и z – оседание крови за 24 часа (в мм):

х

0,80

0,71

2,63

3,19

2,80

3,14

3,21

3,28

3,63

3,30

4,10

3,29

у

22

45

61

66

72

83

73

82

78

82

81

82

z

8

18

24

26

28

29

30

30

30

30

32

32

Определите коэффициент корреляции rxy, rxz, ryz.

  1. Изучали зависимость между массой тела гамадрилов-матерей и их новорожденных детенышей. Под наблюдением находилось 10 обезьян. Результаты наблюдений приведены в таблице:

Масса тела

гамадрилов-

матерей xi, кг

10,0

10,8

11,3

10,0

10,1

11,1

11,3

10,2

13,5

12,3

Масса тела

детенышей, yi, кг

0,70

0,73

0,75

0,70

0,65

0,65

0,70

0,61

0,70

0,63

Рассчитайте коэффициент корреляции между массой тела матерей и массой тела детенышей.

  1. Изучали зависимость между массой живого тела и содержанием гемоглобина (по Сали) в крови павианов-гамадрилов. Результаты наблюдений приведены в таблице:

Номера исследований

Масса х, кг

Содержание гемоглобина, у

1

17

70

2

18

74

3

18

78

4

19

72

5

19

77

6

20

76

7

21

88

8

22

80

9

23

77

10

25

86

Рассчитайте ранговый коэффициент корреляции.

  1. Определите, есть ли корреляция между высотой растений в см (x) и длиной максимального стеблевого листа в мм (y) у нивяника обыкновенного:

    х

    48

    48

    40

    44

    45

    66

    60

    54

    69

    33

    45

    43

    44

    48

    37

    50

    38

    43

    y

    18

    13

    11

    12

    14

    18

    20

    21

    22

    12

    16

    13

    13

    18

    14

    14

    12

    14

  2. Изучали зависимость окраски стебля нивяника обыкновенного в популяции от географической широты. Были получены следующие данные:

х

56,0

56,1

57,5

58,5

59,2

60,2

61,0

62,0

63,0

64,5

y

0,0

4,0

4,5

6,0

7,0

11,0

14,0

25,0

24,0

26,0

где, х = процент растений со стеблем, интенсивно окрашенным антоцианом,

у = географическая широта в градусах. Определите, существует ли корреляция между этими данными?

  1. Коррелирован ли состав флоры двух территорий (х и у), описанный по содержанию видов (в % от общего числа) следующих семейств: сложноцветные (1), бобовые (2), злаки (3), крестоцветные (4), губоцветные (5), гвоздичные (6), зонтичные (7), норичниковые (8), лилейные (9), бурачниковые (10), осоковые (11), маревые (12)?:

1

2

3

4

5

6

7

8

9

10

11

12

х

10,7

12,5

11,8

6,6

3,0

4,6

2,4

2,5

3,1

2,6

3,0

3,6

у

12,9

13,2

5,1

5,4

7,3

4,2

5,6

4,1

4,8

3,4

1,1

2,0