Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
пособие по матем методам.doc
Скачиваний:
223
Добавлен:
20.04.2019
Размер:
2.75 Mб
Скачать

8. Изучение взаимосвязи психологических явлений

8.1 Меры связи явлений, измеренных в номинативных шкалах

Коэффициент четырехклеточной сопряженности. Когда объекты классифицированы по двум или нескольким свойствам, то результат такой классификации можно представить в виде таблиц, в которых строки будут иметь заголовки одного свойства, а столбцы - другого, а сочетания всех свойств будут рассматриваться попарно. Такие таблицы называются таблицами сопряженности. В заголовки столбцов выносятся свойства Х1, Х2 и т.д. до Xi, в заголовки строк У1, У2 и т.д. до Yj. В клетки таблицы заносим частоту - то есть количество случаев сочетания Х1 и У1 (записывается Х1 и У1), Х1У2, Х1У3 и т.д. до Х1Уj в первой строке, Х2У1, Х2У2 ..... X2Yj во второй строке, и так по всей таблице вплоть до нижней правой клетки, где будет XiУj.

Силу связи между двумя явлениями, измеренными в дихотомической номинативной шкале, оценивают с помощью коэффициента четырехклеточной сопряженности Пирсона :

В данной формуле a, b, c, d - это количество случаев в каждой ячейке таблицы: a, b - в верхней строке справа налево, c и d - в нижней строке. Коэффициент может изменяться от -1 до 1. Если он равен нулю, то связь отсутствует, если близок к нулю - связь слабая, а если приближается к 1 (или -1) или равен ей, то связь сильная.

С помощью коэффициента 4-х-клеточной сопряженности Пирсона можно непосредственно сравнивать между собой силу связи по двум и более таблицам сопряженности - коэффициент четырехклеточной сопряженности указывает, что в таблице А связь сильнее, чем в таблице Б. Статистически же точный ответ, значимо ли отличается коэффициент  от нуля, то есть значима ли связь между явлениями, можно получить с помощью критерия 2 Пирсона.

где fi - эмпирическая частота, а ft - теоретическая частота для ячейки таблицы. Эмпирическая частота - это те значения абсолютной частоты, которые приведены в таблице сопряженности. Теоретическая частота - это та частота, которая значилась бы в данной ячейке при равномерном распределении характеристик. Теоретическая частота рассчитывается согласно правилу вероятности произведения случайных независимых событий по формуле:

где f(xi)- сумма по соответствующей строке, f(yj) - сумма по соответствующему столбцу, а N- общее число испытуемых.

Знак суммы в формуле критерия Пирсона говорит о том, что сложение проводится для всех клеток таблицы.

Число степеней свободы  определяется по формуле

 = (n-1)(m-1)

где n - число строк в таблице, а m - число столбцов, т.е. для четырехклеточных таблиц =1. Если эмпирическое значение критерия 2 оказывается больше (или равно) критического при заданном уровне доверительной вероятности, то отличие коэффициента  от нуля признается статистически значимым.

Для четырехклеточных таблиц с числом испытуемых меньше 30 рекомендуется использовать формулу с учетом поправки Йетса на непрерывность:

Задача: Есть ли связь между результатами сдачи зачета, посещением лекций и местом проживания? Какая из этих связей более сильная?

А. Связь «посещаемость - сдача зачета»:

(здесь и ниже: цифра слева вверху ячейки - эмпирическая частота, справа внизу - теоретическая частота)

Таблица 21

У1 - посещал лекции

У2 - не посещал лекции

Сумма по строке

Х1 - сдал зачет с 1-го раза

18

12.87

3

8.13

21

Х2-не сдал зачет с 1-го раза

1

6.13

9

3.87

10

Сумма

по столбцу

19

12

Всего 31

= 0.727

Статистическую значимость отличия коэффициента  от нуля проверим по критерию 2 Пирсона:

2эмп= (18-12.87)2 + (3-8.13)2 + (1-6.13)2 + (9-3.87) 2 = 16.375

12.87 8.13 6.13 3.87

2кр=6.635 (=0.01)

2эмп > 2кр связь «посещаемость - сдача зачета» статистически значима (0.01).

Б. Связь «место проживания - сдача зачета»:

Таблица 22.

У1 - живет дома

У2- живет в общежитии

Сумма по строке

Х1 - сдал зачет с 1-го раза

11

10.29

7

7.71

18

Х2-не сдал зачет с 1-го раза

5

5.71

5

4.29

10

Сумма по столбцу

16

12

Всего 28

=0.107

Статистическая значимость связи «место проживания - сдача зачета» проверяется по критерию 2 с учетом поправки Йетса, так как число испытуемых меньше 30:

2эмп= (11-10.29-0.5)2 + (|7-7.71|-0.5)2 + (|5-5.71|-0.5)2 + (5-4.29-0.5)2 = 0.028

10.29 7.71 5.71 4.29

2кр=3.841 (=0.05)

2эмп < 2крсвязь «место проживания - сдача зачета» статистически незначима (0.05).

Ответ: Коэффициент четырехклеточной сопряженности для зависимости «посещаемость - сдача зачета» выше, чем для зависимости «место проживания - сдача зачета», следовательно, в первой зависимости связь сильнее.

Если таблицы описывают свойства, измеренные в недихотомической шкале наименований, то они называются таблицами многоклеточной сопряженности.

Для анализа многоклеточных таблиц используются коэффициенты многоклеточной сопряженности Кч - коэффициент Чупрова и - коэффициент Пирсона. Коэффициенты рассчитываются по формулам:

С - коэффициент многоклеточной сопряженности Пирсона:

где N - общее количество испытуемых, 2- критерий Пирсона.

Кч - коэффициент Чупрова:

где n-число строк, m - число столбцов, N - общее количество испытуемых.

Непосредственно по коэффициентам многоклеточной сопряженности К и С, как и в случае с четырехклеточными таблицами, можно сравнивать силу связи между изучаемыми характеристиками в разных таблицах. Статистическая значимость связи и отличия от нуля коэффициентов Чупрова и Пирсона оценивается по критерию 2 Пирсона аналогично четырехклеточным таблицам (с учетом поправки Йетса при количестве измерений менее 30).

Задача: При исследовании связи между удовлетворенностью профессиональной деятельностью, уровнем образования и социальным положением испытуемых получены результаты, приведенные в таблицах. Какие выводы можно сделать о силе связи между этими характеристиками?

Таблица 23.

Удовлетворенность профессиональной деятельностью

Уровень образования

Суммы по строкам

Высшее

Ср. техн.

Среднее

А1

А2

А3

Высокая

В1

20

12.21

10

10.89

3

9.90

33

Средняя

В2

11

16.28

15

14.52

18

13.20

44

Низкая

В3

6

8.51

8

7.59

9

6.90

23

Сумма

по столбцам

37

33

30

Всего: 100

Критерий 2эмп= (20-12.21)2 + (10-10.89)2 + (3-9.90)2 + (11-16.28)2+ (15-14.52)2+

12.21 10.89 9.90 16.28 14.52

+ (18-13.20)2 + (6-8.51)2 + (8-7.59)2 + (9-6.90)2 = 14.74

13.20 8.51 7.59 6.90

.Число степеней свободы =(3-1)(3-1)=4. Критическое значение критерия при 95% доверительной вероятности составляет 9.49, при 99% - 13.28. Поскольку 2эмп >2кр, то зависимость между уровнем образования и удовлетворенностью работой статистически значима (=0.01).

Рассчитав эмпирическое значение критерия 2, можно рассчитать коэффициенты Чупрова и Пирсона:

= 0.358,

= 0.271.

Исследование связи между удовлетворенностью профессией и социальным положением испытуемых дало следующие результаты:

Таблица 24

Удовлетворенность профессиональной деятельностью

Социальное положение испытуемого

Суммы по строкам

Предпри-ниматели

Гос. служащие

Рабочие

Тружени-ки села

А1

А2

А3

А4

Высокая

В1

14

10.25

13

10.66

6

11.48

8

8.61

41

Средняя

В2

7

7.75

4

8.06

14

13.20

6

8.68

31

Низкая

В3

4

7.00

9

7.28

8

7.84

7

5.88

28

Сумма по столбцам

25

26

28

21

Всего:100

Критерий 2эмп= (14-10.25)2 + (13-10.66)2 + (6-11.48)2 + (8-8.61)2 +

10.25 10.66 11.48 8.61

+ (7-7.75)2 + (4-8.06)2 +(14-13.20)2 + (6-8.68)2 + (4-7.00)2 + (9-7.28)2 +

7.75 8.06 13.20 8.68 7.00 7.28

+ (8-7.84)2 + (7-5.88)2 = 9.447

7.84 5.88

Число степеней свободы =(4-1)(3-1)=6. Критическое значение критерия при 95% доверительной вероятности составляет 12.592. Поскольку 2эмп <2кр, то связь между удовлетворенностью профессией и социальным положением испытуемых статистически незначима (=0.05).

= 0.293,

= 0.196.

Коэффициент многоклеточной сопряженности Пирсона С для зависимости «удовлетворенность профессией - образование» выше, чем для зависимости «удовлетворенность профессией - социальное положение», следовательно, в первой зависимости связь более тесная, чем во второй. Аналогичный вывод можно сделать и по коэффициенту Чупрова К.

Следует иметь также в виду, что с помощью рассмотренных коэффициентов и критериев доказывается только отличие распределения цифр в таблице от равномерного. Для описания же характера связи между явлениями следует использовать другие методы, о некоторых из них речь пойдет ниже.