Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Чернов книга Полный вариант книги Методика плю...doc
Скачиваний:
7
Добавлен:
01.05.2025
Размер:
33.02 Mб
Скачать

Коэффициент корреляции для больших выборок

Составление корреляционной решетки заключается в группировке данных в сопряженные между собой взвешенные ряды. Перед началом группировки следует выбрать независимую переменную (аргумент “X”) и зависимую переменную (функцию “Y”). Выбор аргумента и функции является довольно условным, так как иногда сложно установить, какой признак является причиной взаимного влияния, а какой следствием. Например, в корреляционной связи диаметра и высоты ствола, длины подземной части сеянцев и высоты их надземной части тот и другой признак парной связи может служить и аргументом, и функцией.

В случае затруднений в выборе аргумента и функции ориентируются по корреляционному отношению прямой и обратной связи двух коррелируемых признаков. Если обратное корреляционное отношение больше прямого, то за аргумент принимают другой признак. Вариационный ряд, принимаемый за аргумент, располагается в горизонтальном ряду графика, а принятый за функцию – в вертикальном.

Необходимо иметь ввиду, что корреляционные связи, не слишком отклоняющиеся от прямолинейных, могут быть удовлетворительно оценены коэффициентом корреляции, вычисление которого значительно проще вычисления корреляционного отношения; допустимая степень отклонения корреляционной связи от прямолинейной определяется с помощью критерия криволинейности.

Рассмотрим особенности парной корреляционной связи на примере измерений диаметра ствола D1,3 и высоты Н в 19-летних культурах сосны, полученных на опытных участках Уральского учебно-научного лесокультурного полигона в Учебно-опытном лесхозе УГЛТУ. Было измерено 66 деревьев, результаты занесены в корреляционную решетку (табл. 55).

После построения корреляционной решетки необходимо установить степень криволинейности изучаемой связи. Это можно сделать визуально, построив на корреляционной решетке график эмпирической зависимости, или аналитическим путем. Визуальная оценка свидетельствует о возможном наличии кривизны связи, хотя и слабо выраженной. В этом случае допускается вычисление коэффициента корреляции вместо корреляционного отношения, так как, во-первых, значительно упрощаются вычисления, и, во-вторых, значение коэффициента корреляции будет незначительно отличаться от значения корреляционного отношения и,следовательно, достаточно точно оценивать тесноту связи изучаемых признаков.

Таблица 55

Корреляционная решетка распределения диаметров (х) и высоты (у) ствола 19-летних культур сосны

Y(H) \ X(D)

2

3

4

5

6

7

8

9

10

11

12

Итого ny

ау

ay*ny

*ny

7

 

 

 

 

 

 

 

8

 

16

20

3

4

+12

16

48

 

 

 

 

 

 

 

1

 

1

1

6,5

 

 

 

 

 

0

6

18

 

 

15

7

3

+21

9

63

 

 

 

 

 

1

2

3

 

 

1

6

 

 

 

 

 

0

6

12

12

16

20

13

2

+26

4

52

 

 

 

 

 

1

3

3

2

2

2

5,5

 

 

 

 

-3

0

2

 

2

4

 

8

1

+8

1

8

 

 

 

 

3

1

2

 

1

1

 

5

 

 

 

0

0

0

0

 

 

 

 

9

0

0

0

0

 

 

 

1

2

5

1

 

 

 

 

4,5

 

 

3

2

1

0

 

 

 

 

 

6

-1

-6

1

6

 

 

1

1

1

3

 

 

 

 

 

4

 

8

6

8

2

0

 

 

 

 

 

6

-2

-12

4

24

 

1

1

2

1

1

 

 

 

 

 

3,5

 

12

18

 

3

 

 

 

 

 

 

4

-3

-12

9

36

 

1

2

 

1

 

 

 

 

 

 

3

 

48

 

 

 

 

 

 

 

 

 

3

-4

-12

16

48

 

3

 

 

 

 

 

 

 

 

 

2,5

100

20

 

 

 

 

 

 

 

 

 

5

-5

-25

25

125

4

1

 

 

 

 

 

 

 

 

 

2

30

24

 

 

 

 

 

 

 

 

 

2

-6

-12

36

72

1

1

 

 

 

 

 

 

 

 

 

Итого nx

5

7

4

4

8

12

8

7

3

4

4

66

 

-12

 

482

ax

-5

-4

-3

-2

-1

0

1

2

3

4

5

 

 

 

 

 

ax*nx

-25

-28

-12

-8

-8

0

8

14

9

16

20

-14

 

 

 

 

25

16

9

4

1

0

1

4

9

16

25

 

 

 

 

 

*nx

125

112

36

16

8

0

8

28

27

64

100

524

 

 

 

 

Σ nxy*ax*ay

130

112

27

10

3

0

14

38

14

36

55

439

 

 

 

 

При проведении вычислений (табл. 55) произвольно выбирают условную средину горизонтального и вертикального рядов распределения. Условная средина должна быть по возможности ближе к середине ряда и совпадать с клеткой, в которой содержится наибольшая частота. Условные отклонения в приведенном примере по горизонтали ах изменяются в пределах от–5 до + 5, по вертикали ау от – 6 до +4. Далее условные отклонения ах умножают на сумму частот горизонтального ряда nxи отклонение вертикального ряда аyна сумму частот вертикального ряда ny. Далее квадраты условных отклонений и умножают на условные отклонения ах и ау, соответственно.

Находят произведения условных отклонений между собой и на совместную для них частоту nху · ах · ау: В первом столбце (–5)· 4 ·(–5)= 100; (–5)·1· (–6)= 30. Полученные произведения суммируют в столбцах с соблюдением знаков 100 + 30 = 130, и так по каждому столбцу.

В итоге вычислений получают суммы по строкам (х) и по столбцам (у):

∑nx = Nx = 66; ∑ ax nx = –14; ∑ a2x nx = 524

∑ny = Ny = 66; ∑ ay ny = – 12; ∑ a2y ny = 482

∑ nxy·ax·ay = 439.

Далее находят стандартное отклонение горизонтального и вертикального коррелируемых рядов распределения по формуле 52:

Коэффициент корреляции находят по формуле:

Ошибка достоверности коэффициента корреляции определяется по формуле:

где t – критерий Стьюдента при числе степеней свободы у = N – 2=

= 66 – 2 = 64.

Объем выборки, достаточный для достоверности коэффициента корреляции, определяют по табл. 56. На уровне значимости 0,05 значение коэффициента корреляции 0,88 достоверно при объеме выборки N, равном 5.Вприведенном примере N = 66, следовательно, значениеr = 0,88 статистически достоверно с осень высокой степенью вероятности.

Таблица 56

Объем выборки, достаточный для достоверности коэффициента корреляции на уровне доверительной вероятности Р1 = 0,95

r

N

r

N

r

N

r

N

r

N

r

N

0,01

38407

0,16

151

0,31

40

0,46

19

0,61

11

0,76

7

0,02

9603

0,17

133

0,32

38

0,47

18

0,62

10

0,77

7

0,03

4269

0,18

119

0,33

36

0,48

17

0,63

10

0,78

7

0,04

2403

0,19

107

0,34

34

0,49

16

0,64

10

0,79

6

0,05

1539

0,2

97

0,35

32

0,5

16

0,65

9

0,8

6

0,06

1069

0,21

87

0,36

30

0,51

15

0,66

9

0,81

6

0,07

787

0,22

80

0,37

28

0,52

15

0,67

9

0,82

6

0,08

604

0,23

73

0,38

27

0,53

14

0,68

9

0,83

6

0,09

477

0,24

68

0,39

26

0,54

14

0,69

8

0,84

6

0,1

383

0,25

62

0,4

24

0,55

13

0,7

8

0,85

5

0,11

317

0,26

57

0,41

23

0,56

13

0,71

8

0,86

5

0,12

267

0,27

53

0,42

22

0,57

12

0,72

8

0,87

5

0,13

228

0,28

49

0,43

21

0,58

12

0,73

7

0,88

5

0,14

196

0,29

46

0,44

20

0,59

11

0,74

7

0,89

5

0,15

171

0,3

43

0,45

19

0,6

11

0,75

7

0,9

5

Полученное значение коэффициента корреляции r =0,88 свидетельствует о тесной связи диаметра и высоты ствола 19-летних культур сосны. Возведя коэффициент корреляции rв квадрат, получают коэффициент детерминации r2, свидетельствующий о силе связи, о взаимообусловленности изменчивости двух показателей: r2= 0,882=77%. В приведенном примере 77% общей изменчивости высоты ствола дерьевьев сосны определяются (обуславливаются) изменчивостью диаметра ствола; остальная доля изменчивости 23% обусловлена действием других, неизвестных (неустановленных в опыте), факторов.

Коэффициент детерминации является более важным показателем связи в сравнении с коэффициентом корреляции.