Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Биометрическая обработка данных на основе компь...doc
Скачиваний:
31
Добавлен:
11.11.2019
Размер:
1.7 Mб
Скачать

Раздел 4. Корреляционный анализ

Задачей корреляционного анализа является решение вопроса о наличии связи между значениями признаков в генеральной совокупности. Оценка связи между признаками включает: определение типа (прямолинейная, криволинейная), направления (положительная, отрицательная), величины достоверности.

Под корреляцией (correlatio лат. – соотношение, взаимная связь, взаимозависимость) понимается зависимость, при которой определенному значению независимой переменной (х) соответствует совокупность значений зависимой переменной (у). Корреляции следует отличать от так называемых функциональных связей, когда при изменении одного признака на определенную величину другой показатель также изменяется на определенную величину. Коррелятивные связи отличаются тем, что при изменении одного признака другой признак, может иметь варьирующие величины у особей данной совокупности. Так, при одном том же значении линейного промера у животных наблюдается разная масса. Изучение связи между признаками имеет важное значение при решении селекционных вопросов.

При установлении связи между признаками можно проводить косвенную селекцию, т.е. отбирая особей по какому-либо желательному признаку, можно косвенно осуществлять отбор по другому признаку, связанному с основным селекционным признаком. Показатели корреляции позволяют: определить долю влияния наследственности отца и матери на генотип и фенотип потомства; прогнозировать изменение взаимосвязанных признаков.

По направлению корреляции бывают: положительными и отрицательными. При положительной корреляции увеличение (или уменьшение) одного признака сопровождается таким же изменением другого признака. При отрицательной корреляции увеличение одного признака происходит при уменьшении другого.

Корреляционная связь между признаками бывает линейная (или прямолинейная) и нелинейная (криволинейная). Тип связи устанавливают на основе функционального графика.

При линейной корреляции парные значения, представленные как х и у координаты, группируются около некоторой прямой. Величина связи оценивается на основе параметрической корреляции Пирсона.

При нелинейной корреляции оценка зависимости производится на основе непараметрических показателей.

4.1. Параметрические показатели связи

Для оценки линейной связи между признаками, в совокупностях, имеющих нормальное распределение, определяют коэффициент корреляции (r) Пирсона или параметрическую корреляцию по формуле:

r=

Достоверность выборочной корреляции Пирсона оценивается на основе:

- сравнения с критическим значением (табл. 16);

- расчета статистики Стьюдента – Тфакт. по формуле

Т= r ;

рассчитанный показатель сравнивается со стандартным показателем для уровня Р≤0,05, с учетом числа степеней свободы = n - 2 (табл. 16). Если Тфакт. больше Тst., коэффициент корреляции достоверен, зависимость наблюдается и в генеральной совокупности. Если Тфакт. меньше Тst., коэффициент корреляции недостоверен, зависимость не наблюдается в генеральной совокупности;

- сравнения уровня значимости статистики Стьюдента с уровнем 0,05; если значение уровня значимости статистики Стьюдента больше 0,05 коэффициент корреляции признается незначимым, принимается нулевая гипотеза коэффициент корреляции не отличен от нуля; если уровень значимости статистики Стьюдента меньше 0,05, принимается гипотеза об отличии коэффициента корреляции от нуля.

В случае нескольких выбранных переменных выдается диагональная матрица коэффициентов корреляции с указанием критического значения rо и числа значимых коэффициентов корреляции (r > rо). Эта матрица по подтверждению может быть сохранена в электронной таблице для последующего использования (например, в многомерной статистике).

Если значение коэффициента корреляции близкое к +1 или к - 1 , это говорит о сильной положительной или сильной отрицательной связи. Если значение коэффициента корреляции близкое к 0 это указывает на отсутствие линейной связи, но не исключает возможность нелинейной связи между признаками. Поэтому коэффициент корреляции оценивают совместно с функциональным графиком.

Пример 1.

Переменные LC1, LC2 содержат данные о массе жабр (мг) и массе тела (г) крабов Pachygrapsus crassipes:

LC1: 384 210 80 45 100 320 100 159 179 220 230 320

LC2: 22,7 14,9 2,5 1,41 4,59 17,29 9,52 11,3 14,4 15,2 15.39 15,81

Определите степень и достоверность корреляции оцениваемых признаков.

Порядок выполнения. После выбора значений Таблицы данных на основе графика рассеяния определяют тип связи. Между значениями установлена линейная связь. Величина связи определяется на основе параметрической корреляции (корреляции Пирсона). Метод определения параметрической корреляции Correlation Matrices приведен в разделе Основные статистики/Таблицы (Basic Statistics/Tables). Между массой жабер и массой тела крабов установлена тесная зависимость r=0,92>0,58 (Табл.16, =12-2=10); Р=0,000012<0,05). Зависимость между признаками достоверна.

Коэффициент детерминации (r²=0,86) показывает, что 86% вариации массы жабр зависит от варьирования массы тела. Зависимость между признаками оценивается уравнениями: У=1,0622 + 0,056*Х; Х=10,15 + 15,34*У.

Задания для самостоятельной работы

Задание 1. По данным задания оцените коэффициент корреляции Пирсона. Перед расчетом коэффициента корреляции Пирсона убедитесь, что распределение по оцениваемым признаками нормальное; характер связи между признаками прямолинейный.

Рост обезьян (горилл), см: 165 166 167 168 169 169 169 170 172 173 175 175 176 176 176 177 178 179 180 182

Вес обезьян (горилл), кг: 56 57 61 61 60 62 64 63 68 72 70 75 71 71 75 75 76 76 80 82

Таблица 16

Критические значения коэффициента корреляции

Степени

Свободы

= n -2

Уровни значимости

Степени

Свободы

= n – 2

Уровни значимости

0,05

0,01

0,05

0,01

5

0,75

0,87

27

0,37

0,47

6

0,71

0,83

28

0,36

0,46

7

0,67

0,80

29

0,36

0,46

8

0,63

0,77

30

0,35

0,45

9

0,60

0,74

35

0,33

0,42

10

0,58

0,71

40

0,30

0,39

11

0,55

0,68

45

0,29

0,37

12

0,53

0,66

50

0,27

0,35

13

0,51

0,64

60

0,25

0,33

14

0,50

0,62

70

0,23

0,30

15

0,48

0,61

80

0,22

0,28

16

0,47

0,59

90

0,21

0,27

17

0,46

0,58

100

0,20

0,25

18

0,44

0,56

125

0,17

0,23

19

0,43

0,55

150

0,16

0,21

20

0,42

0,54

200

0,14

0,18

21

0,41

0,53

300

0,11

0,15

22

0,40

0,52

400

0,10

0,13

23

0,40

0,51

500

0,09

0,12

24

0,39

0,50

700

0,07

0,10

25

0,38

0,49

900

0,06

0,09

26

0,37

0,48

1000

0,06

0,09

Задание 2. На 20 павианах гамадрилах изучалась зависимость между массой матерей, измеренной в начале беременности (кг) – выборка 1и массой новорожденных детенышей (кг) – выборка 2.

Выборка 1. 10,0 10,8 11,3 10,0 10,1 11,1 11,3 10,2 13,5 12,3 14,5 11,0 12,0 11,8 13,4 11,4 12,0 15,6 13,0 12,1

Выборка 2. 0,70 0,73 0,75 0,70 0,65 0,65 0,70 0,61 0,70 0,63 0,70 0,65 0,72 0,69 0,78 0,70 0,60 0,85 0,80 0,75

По данным задания оцените коэффициент корреляции Пирсона. Перед расчетом коэффициента корреляции Пирсона убедитесь, что распределение по оцениваемым признаками нормальное; характер связи между признаками прямолинейный.