Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
3_раздел(коррект).doc
Скачиваний:
91
Добавлен:
18.03.2015
Размер:
1.01 Mб
Скачать

3. 4. Понятие корреляции

Корреляционная зависимость

Корреляционная зависимость – взаимосвязь между переменными (признаками), при которой в зависимости от изменения одной переменной меняются значения другой переменной.

В основе корреляционного анализа лежат представления о типе, форме и тесноте (плотности) связи. По типу корреляционные связи дифференцируются на прямые и обратные. При прямой связи (рис. 3.6) с увеличением (уменьшением) значений одной переменной значения другой переменной также возрастают (убывают). При обратной связи (рис. 3.7) увеличение (уменьшение) одной переменной вызывает уменьшение (увеличение) другой.

Рис. 3.6 Рис. 3.7

По форме корреляционные связи делятся на линейные и нелинейные. Например, при нелинейной корреляционной связи относительное увеличение (уменьшение) одной переменной влечет за собой неравномерное изменение (увеличение и уменьшение) второй переменной.

Под теснотой (плотностью) понимается степень сопряженности между двумя переменными (признаками, явлениями). На рис. 3.8 корреляционное поле имеет высокую тесноту связи, т.е. числовые значения близки к своему среднему значению. На рис. 3.9 наблюдается низкая теснота связи, т.е. числовые значения сильно отклоняются от среднего.

Рис. 3. 8 Рис. 3. 9

Тип, форма и теснота связи определяются на основе такой статистической характеристики, как коэффициент корреляции.

Коэффициент ранговой корреляции

Для определения взаимосвязи между двумя рассматриваемыми или изучаемыми характеристиками (представленными в порядковой шкале) пользуются ранговой корреляцией. Коэффициент ранговой корреляции ρ (Спирмена) рассчитывается по формуле:

, (3. 23)

где индекс хy означает, что связь устанавливается между характеристиками х и y;

–ранговые значения рассматриваемых характеристик х и y;

М – число измерений.

Коэффициент ранговой корреляции изменяется от –1 до 1 и содержит в себе информацию трех видов:

  • об уровне статистической значимости: определяется по таблице значений коэффициента ранговой корреляции(табл. 3.9)

  • о величине связи: при 0.3||< 0.5 связь слабая,

при 0.5 ||< 0.7 связь умеренная,

при ||0.7 связь сильная;

  • о направлении (знаке) связи: при< 0 связь обратно пропорциональная, а при> 0 — прямо пропорциональная.

Для определения статистической значимости коэффициента ранговой корреляции Спирмена используют таблицу значений ранговой корреляции приp, равном 0.05 и 0.01.

Таблица 3. 9

Таблица значений коэффициента ранговой корреляциипри p, равном 0.05 и 0.01

p

M

0.05

0.01

p

M

0.05

0.01

5

0.900

1.000

16

0.425

0.601

6

0.829

0.943

18

0.399

0.564

7

0.714

0.893

20

0.377

0.534

8

0.643

0.833

22

0.359

0.508

9

0.600

0.783

24

0.343

0.485

10

0.564

0.746

26

0.329

0.465

12

0.506

0.712

28

0.317

0.448

14

0.456

0.645

30

0.306

0.432

В графе «М» указано число элементов измерения (объем выборки), а в графах «0.05» и «0.01» — уровни значимости. Для заданного числа измерений и рассчитанного значения ||находят превышающее его табличное значение коэффициента ранговой корреляции. Если оно найдется (его лучше иметь для меньшего уровня значимости), коэффициент ранговой корреляциистатистически значим. Если же нет, о значимости говорить не приходится и результат не считается достоверным.

Пример. Пусть Х — конфликтность, У — агрессивность. Предположим, что по результатам проведенных методик на выявление уровней конфликтности и агрессивности по выборке мужчин были получены следующие значения хi=7, 1, 5, 2, 6, 3, 4, 3, 8 — ранговые значения по переменной Х и уi=8, 3, 2, 4, 7, 5, 4, 6, 9 — ранговые значения по переменной У. Необходимо (1) установить наличие взаимосвязи между изучаемыми признаками и (2) каков характер этой взаимосвязи.

Воспользуемся расчетом коэффициента ранговой корреляции (Спирмена). Получаем значение ху0,725. Для заданного числа измерений М=9 и рассчитанного значения ху0,725 в таблице (см. таблицу 3.9, стр. 47) находим превышающее его Т=0,783. Так как ху0,725Т=0,783 с уровнем значимости р=0,01, то ху достоверно (статистически значимо).

Исходя из рассчитанного значения ху и условий, налагаемых на величину и направление связи, можно сделать вывод:

  1. при ху0,7250,7 связь между рассматриваемыми характеристиками сильная;

  2. при ху0 связь между изучаемыми характеристиками прямо пропорциональная (положительная).

Учитывая полученные результаты расчета коэффициента ранговой корреляции  (Спирмена), и, возвращаясь к условию примера, можно заключить, что изучаемые признаки конфликтность и агрессивность по выборке мужчин находятся в статистически значимой (ху0,725 с р=0,01), сильной и положительной взаимосвязи. Это, в свою очередь, свидетельствует о том, что с увеличением показателей конфликтности, агрессивность также будет увеличиваться, и наоборот.

Коэффициент линейной корреляции

В качестве метрической меры парной связи используется коэффициент линейной корреляции r(Пирсона). Исходные данные для его определения – две переменныеxиy, принимающие при каждом измерении конкретные числовые значения. Расчет коэффициента линейной корреляции производится по формуле:

, (3. 24)

где индекс xy при коэффициенте r означает, что корреляционная зависимость устанавливается между характеристиками х и у;

–i-значение переменной х;

–среднее арифметическое по переменной х;

–значение переменной у;

–среднее арифметическое по переменной у;

М – количество измерений.

Коэффициент Пирсона изменяется от -1 до +1 и содержит в себе информацию трех видов:

  • об уровне статистической значимости:находится по таблице значений коэффициента линейной корреляции(табл. 3. 10);

  • о величине связи: при 0.3|r|< 0.5 – связь слабая, при 0.5|r|< 0.7 — связь умеренная, при|r|0.7 — связь сильная;

  • о направлении (знаке) связи:приr < 0 переменныеxиyявляются обратно пропорциональными (чем больше x, тем меньшеy, и, наоборот), приr> 0 переменныеxиyявляются прямо пропорциональными (чем большеx, тем большеy, и наоборот).

Таблица 3. 10

Таблица значений коэффициента линейной корреляции при p, равном 0.05 и 0.01

p

M

0.05

0.01

p

M

0.05

0.01

p

M

0.05

0.01

10

0.63

0.77

28

0.37

0.48

46

0.29

0.38

11

0.60

0.74

29

0.37

0.47

47

0.29

0.37

12

0.58

0.71

30

0.36

0.46

48

0.28

0.37

13

0.55

0.68

31

0.36

0.46

49

0.28

0.36

14

0.53

0.66

32

0.35

0.45

50

0.28

0.36

15

0.51

0.64

33

0.34

0.44

51

0.27

0.36

16

0.50

0.62

34

0.34

0.44

52

0.27

0.35

17

0.48

0.61

35

0.33

0.43

53

0.27

0.35

18

0.47

0.59

36

0.33

0.42

54

0.27

0.35

19

0.46

0.58

37

0.32

0.42

55

0.26

0.34

20

0.44

0.56

38

0.32

0.41

56

0.26

0.34

21

0.43

0.55

39

0.31

0.41

57

0.26

0.34

22

0.42

0.54

40

0.31

0.40

58

0.26

0.34

23

0.41

0.53

41

0.31

0.40

59

0.26

0.33

24

0.40

0.52

42

0.30

0.39

60

0.25

0.33

25

0.40

0.51

43

0.30

0.39

75

0.22

0.30

26

0.39

0.50

44

0.30

0.38

100

0.20

0.26

27

0.38

0.49

45

0.29

0.38

200

0.14

0.18

В данной таблице в графе «М» приведено число измерений, а в графах «0.05» и «0.01» – табличные значения для соответствующего уровня значимости. Чтобы определить, является ли рассчитанное значение коэффициента линейной корреляции достоверным, надо найти такое табличное значение, которое было бы меньше его. Если оно существует, то значение коэффициента статистически значимо с соответствующим уровнем значимости. Если же нет, то о достоверности результата говорить не приходится.

Корреляция качественных признаков

Если при статистическом наблюдении отмечается только наличие или отсутствие признака (номинальная шкала), а также если изучается связь между альтернативными признаками, то целесообразно применять четырехпольную таблицу и подсчитывать коэффициент ассоциации (связи) и коэффициент контингенции (сопряженности).

Таблица 3. 11

Признаки

a

b

a+b

c

d

c+d

a+c

b+d

n

где a, b, c, d — частоты сопоставляемых признаков;

a+b+c+d=n – число наблюдений;

и – крайние, итоговые распределения.

Коэффициент связиопределяется по формуле:

. (3. 25)

Коэффициент сопряженностивычисляется по формуле:

. (3. 26)

Числовое выражение коэффициента сопряженности всегда меньше, чем коэффициента связи, и он дает более осторожную оценку тесноты связи. Знак определяется по знаку в числителе.

Формула для подсчета коэффициента ассоциации более проста. При значениях его от –1 до –0.5 и от +0.5 до +1 связь можно считать установленной. При значениях от –0.5 до +0.5 он дает значительное расхождение с .

Коэффициент регрессии

В отличие от коэффициентов корреляции, которые направлены на установление меры связи между переменными, для цели предсказания одной переменной по данным другой используется коэффициент регрессии. При этом становится важным определиться в том, какая из переменных –хилиу– служит для предсказания какой. Это отражается в последовательности указанияxиyв индексе коэффициента регрессии. Соответственно коэффициенты регрессии с разным порядком следования переменных в индексации будут иметь разные величины, в то время как для коэффициентов ковариации и корреляции указание последовательностиxиyв индексе не имеет значения, так как это будет одна величина связи.

Регрессиейназывают среднее изменение функции (результативного признакау) на единицу изменения аргумента (факторах). Регрессия может также показывать измененияxв зависимости от значенийy. Например, можно вычислить, насколько увеличивается в среднем продуктивность усвоения материала (y) с увеличением сосредоточения внимания (x) на данном материале, а также насколько возрастает усилие по сосредоточению внимания (x) с увеличение продуктивности усвоения материала (y). По показателю регрессии можно определить какое значение продуктивности (y) соответствует данному значению внимания (x).

Формула коэффициента регрессии:

, (3. 28)

где — коэффициент регрессии x на y (x от y);

—коэффициент регрессии y на x (y от x);

—среднее квадратичное отклонение по признаку x;

—среднее квадратичное отклонение по признаку y;

r — коэффициент корреляции.

Примечание. Коэффициенты регрессии берутся с тем же знаком, что и коэффициент корреляции.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]