Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
методичка ППД для СП.doc
Скачиваний:
165
Добавлен:
13.11.2019
Размер:
5.4 Mб
Скачать

Тема 33. Установление корреляционных зависимостей и их интерпретация

Корреляция представляет собой меру зависимости переменных. Наиболее известна корреляция Пирсона. При вычислении корреляции Пирсона предполагается, что переменные измерены, как минимум, в интервальной шкале. Некоторые другие коэффициенты корреляции могут быть вычислены для менее информативных шкал. Коэффициенты корреляции изменяются в пределах от -1.00 до +1.00. Обратите внимание на крайние значения коэффициента корреляции. Значение -1.00 означает, что переменные имеют строгую отрицательную корреляцию. Значение +1.00 означает, что переменные имеют строгую положительную корреляцию. Отметим, что значение 0.00 означает отсутствие корреляции.

Наиболее часто используемый коэффициент корреляции Пирсона r называется также линейной корреляцией, т.к. измеряет степень линейных связей между переменными.

Простая линейная корреляция (Пирсона r). Корреляция Пирсона (далее называемая просто корреляцией) предполагает, что две рассматриваемые переменные измерены, по крайней мере, в интервальной шкале (см. Элементарные понятия статистики). Она определяет степень, с которой значения двух переменных "пропорциональны" друг другу. Важно, что значение коэффициента корреляции не зависит от масштаба измерения. Например, корреляция между ростом и весом будет одной и той же, независимо от того, проводились измерения в дюймах и фунтах или в сантиметрах и килограммах. Пропорциональность означает просто линейную зависимость. Корреляция высокая, если на графике зависимость "можно представить" прямой линией (с положительным или отрицательным углом наклона). Различные варианты линейной зависимости можно проследить на графиках в рисунке 1.

Рисунок 1

Проведенная прямая называется прямой регрессии или прямой, построенной методом наименьших квадратов. Последний термин связан с тем, что сумма квадратов расстояний (вычисленных по оси Y) от наблюдаемых точек до прямой является минимальной. Заметим, что использование квадратов расстояний приводит к тому, что оценки параметров прямой сильно реагируют на выбросы.

Как интерпретировать значения корреляций. Коэффициент корреляции Пирсона (r) представляет собой меру линейной зависимости двух переменных. Если возвести его в квадрат, то полученное значение коэффициента детерминации r2) представляет долю вариации, общую для двух переменных (иными словами, "степень" зависимости или связанности двух переменных). Чтобы оценить зависимость между переменными, нужно знать как "величину" корреляции, так и ее значимость.

Значимость корреляций. Уровень значимости, вычисленный для каждой корреляции, представляет собой главный источник информации о надежности корреляции. Как объяснялось выше, значимость определенного коэффициента корреляции зависит от объема выборок. Критерий значимости основывается на предположении, что распределение остатков (т.е. отклонений наблюдений от регрессионной прямой) для зависимой переменной y является нормальным (с постоянной дисперсией для всех значений независимой переменной x). Исследования методом Монте-Карло показали, что нарушение этих условий не является абсолютно критичным, если размеры выборки не слишком малы, а отклонения от нормальности не очень большие.

Формула корреляции выглядит следующим образом:

, где

- знамение фактора на одной выборке

- значение фактора на другой выборке

Пример:

Необходимо выявить корреляционную связь между уровнем тревожности ребенка и степенью родительского контроля над его поведением.

Данные полученные по результатам методик представлены в табл. 3 в первом и во втором столбцах. Но в методике тревожности данные варьируются от 0 до 100 баллов, когда как максимальный балл по другой методике 7 баллов. Сопоставлять такие результаты будет неправильно, поэтому надо привести значения обеих методик к одной шкале. Для этого все значения переводятся в проценты, и последующие корреляционные исчисления делаются же с ними.

Так выглядит таблица подсчета линейной корреляции между различными факторами (таблица 3)

Таблица 3 Подсчет корреляции между уровнем тревожности и контролем над поведением ребенка

ФИО

Xi

Yi

Xi (%)

Yi (%)

Х - Хср

Y - Yср

(Х-Хср)2

(Y - Yсредн)2

(Х - Хср)(Y-Yср)

Тест тревожности

Уровень контроля

Тест тревожности %

Контроль %

1

60

6,5

60

92,9

25,2

20,3

637,1

411,5

512,0

2

30

5

30

71,4

-4,8

-1,1

22,7

1,3

5,4

3

42

6

42

85,7

7,2

13,1

52,4

172,7

95,2

15

3

15

42,9

-19,8

-29,7

390,5

882,9

587,2

54

7,5

54

107,1

19,2

34,6

370,2

1195,2

665,2

12

4

12

57,1

-22,8

-15,4

518,0

238,0

351,2

84

7

84

100,0

49,2

27,4

2424,6

752,3

1350,6

41

6

41

85,7

6,2

13,1

38,9

172,7

82,0

18

3,5

18

50,0

-16,8

-22,6

280,9

509,5

378,3

72

6,5

72

92,9

37,2

20,3

1386,8

411,5

755,4

10

4

10

57,1

-24,8

-15,4

613,1

238,0

382,0

39

5

39

71,4

4,2

-1,1

18,0

1,3

-4,8

9

5

9

71,4

-25,8

-1,1

663,6

1,3

29,4

63

7

63

100,0

28,2

27,4

797,5

752,3

774,6

28

5,5

28

78,6

-6,8

6,0

45,7

36,0

-40,6

17

3,5

17

50,0

-17,8

-22,6

315,4

509,5

400,9

58

6,5

58

92,9

23,2

20,3

540,1

411,5

471,4

37

5

37

71,4

2,2

-1,1

5,0

1,3

-2,6

20

3

20

42,9

-14,8

-29,7

217,9

882,9

438,6

39

5,5

39

78,6

4,2

6,0

18,0

36,0

25,4

57

6,5

57

92,9

22,2

20,3

494,6

411,5

451,2

13

4

13

57,1

-21,8

-15,4

473,5

238,0

335,7

26

4,5

26

64,3

-8,8

-8,3

76,7

68,7

72,6

14

4

14

57,1

-20,8

-15,4

431,0

238,0

320,3

25

11

3

11

42,9

-23,8

-29,7

564,5

882,9

706,0

 

 

 

 

 

 

 

 

 

сумма

 

 

 

 

0,0

0,0

11396,6

9457,1

9142,6

среднее

 

 

34,8

72,6

 

 

 

 

 

значение

max 100

max 7

Таким образом, коэффициент корреляции будет:

Коэффициент корреляции близок к единице. Это значит, что существует высокая прямая корреляционная связь между уровнем тревожности и родительским контролем.