Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
kulikov_l_v_psihologicheskoe_issledovanie.doc
Скачиваний:
743
Добавлен:
09.02.2015
Размер:
1.04 Mб
Скачать

4.2.4 Корреляционный анализ

Сущность корреляционного анализа

Корреляционный анализ дает возможность точной количественной оценки степени согласованности изменений (варьирования) двух и более признаков. Степень согласованности изменений характеризует теснота связи — абсолютная величина коэффициента корреляции. В случае прямо пропорциональной зависимости одного признака от другого коэффициент корреляции равен единице. Последний может принимать значения от -1 до +1. Отрицательный коэффициент корреляции свидетельствует о разной направленности варьирования признаков: при увеличении одного другой уменьшается, или наоборот: приуменьшении одного другой увеличивается. Нулевая величина коэффициента корреляции говорит об отсутствии взаимосвязи между признаками.

Например, если мы измерим на репрезентативной выборке два параметра — рост человека и вес его тела есть, а затем подсчитаем корреляцию между этими параметрами, то, вероятно, она окажется положительной. Она не может быть равна единице. Иначе это означало бы, что измерять у человека и рост, и вес излишне. Достаточно измерить что-нибудь одно. Далее с помощью простой формулы или таблицы пересчета мы всегда можем точно определить второй параметр. Мало вероятно, чтобы между этими параметрами не было бы никакой связи, то есть коэффициент корреляции был бы равен нулю. Ведь чем длиннее тело, тем больше его размеры и, следовательно, вес. Или, наоборот, зная вес человека, мы хотя и очень приблизительно, но можем назвать его рост.

Предположим, мы затруднимся назвать рост человека, зная его вес. Предположим далее, что нам облегчат задачу, и предъявят два ряда чисел — вес в килограммах и рост в сантиметрах. Попросят поставить в соответствие нескольким разным весам разные длины тела. Вряд ли мы будем долго сомневаться и, скорее всего самому тяжелому человеку припишем самый большой рост, человеку более легкому и рост поменьше и так до самого маленького веса. Этим ранжированием мы продемонстрируем, что у нас есть интуитивные представления о том, что эти две величины изменяются в той или иной мере согласованно, что между ними есть некоторая связь.

Если есть два ряда значений, то можно не только строить предположения о наличии или отсутствии связи между ними, но и подсчитать коэффициент корреляции. Он и покажет нам, насколько согласованы изменения двух параметров, как тесно они связаны, положительной или отрицательной связью.

Коэффициент корреляции ничего не сообщает о причинных связях. Человек высокий не потому, что он тяжелый и, наоборот, тяжелый не потому что высокий. Некорректно говорить о влиянии роста на вес или веса на рост. Один параметр не является причиной другого. И тот и другой, их проявленность, их величина причинно обусловлены наследственностью, индивидуальными характеристиками обменных процессов в организме, питанием, числом и спецификой перенесенных болезней, факторами среды, особенностями образа жизни и т.д.

Отображение результатов корреляционного анализа

Результаты вычисления корреляций для некоторого набора признаков записываются в виде матрицы. В каждой строке квадратной матрицы интеркорреляций представлены коэффициенты корреляции одного признака со всеми остальными в том порядке признаков, который был избран при составлении сводной таблицы данных. Прямоугольная матрица обычно содержит коэффициенты корреляции одной группы признаков с другой группой признаков из всей совокупности измеренных вами признаков. Строки и столбцы матрицы оцифрованы номерами признаков, в ячейках приведены коэффициенты корреляции одного признака с другим. Испытуемые и их порядковые номера из таблицы исходных данных (составленной вами для вычисления корреляций) в матрице интеркорреляций никак не представлены. Коэффициенты корреляции несут информацию только о тесноте связи между признаками и не дают никаких сведений ни об одном отдельном испытуемом.

Для эффективного использования вычисленных коэффициентов корреляции необходимо представить имеющуюся числовую информацию в подходящем виде. Прежде всего, надо выделить коэффициенты корреляции, величина которых превышает критические значения. В психологии чаще всего рассматривают два уровня достоверности 0.05 и 0.01. Критические значения коэффициента корреляции Пирсона приведены в приложении 3. Целесообразно выделить среди прочих коэффициенты корреляции, превышающие эти уровни достоверности. Можно подчеркнуть коэффициенты с достоверностью 0.05 одной чертой или отметить одной звездочкой, а с достоверностью 0.01 — двумя. Удобно использовать и цветовое кодирование.

Если после этого выделения обнаружилось, что значимых коэффициентов корреляции (превышающих уровень 0.05 или 0.01) довольно много, то для дальнейшего анализа более удобна полная матрица интеркорреляций. Поэтому, если в принтерной распечатке содержится только половина матрицы, отделенная от другой половины главной диагональю, то ее надо восстановить до полного вида.

Поскольку матрица интеркорреляций симметрична относительно своей главной диагонали (проходящей из левого верхнего угла в правый нижний), то ее при восстановлении надо "опрокинуть", повернуть относительно этой оси симметрии. Обычно в распечатке каждая строчка начинается с номера признака, затем идет 1.00 — это коэффициент корреляции данного признака с самим собой. Затем напечатан коэффициент корреляции данного признака со следующим по порядковому номеру и далее коэффициенты корреляции с остальными признаками.

Пример. Получена распечатка половины матрица интеркорреляций:

1

1.00

.58

.30

.41

.60

2

1.00

.43

.57

.65

.51

3

1.00

.39

.38

.40

4

1.00

.60

.36

5

1.00

.35

Примечание.Нули перед десятичной точкой опущены).

В этой матрице в первом столбце записаны номера признаков, во втором — коэффициенты корреляции признаков с собой. В остальной части поля матрицы коэффициенты корреляции признаков с другими признаками.

Используя полученные данные, заполним половину матрицы в более подходящем виде.

1

2

3

4

5

1

1.00

.58

.30

.41

.60

2

1.00

.43

.57

.65

3

1.00

.39

.38

4

1.00

.60

5

1.00

В этой матрице в первом столбце и в первой строке записаны номера признаков. Поскольку второй признак коррелирует с первым так же, как первый со вторым, а третий — с первым так же, как первый с третьим и т.д., то мы можем первую строку матрицы записать как первый ее столбец. Затем вторую строку — как второй столбец и т.д. В результате получим полную матрицу.

1

2

3

4

5

1

1.00

.58

.30

.41

.60

2

.58

1.00

.43

.57

.65

3

.30

.43

1.00

.39

.38

4

.41

.57

.39

1.00

.60

5

.60

.65

.38

.60

1.00

Если матрица большая, то даже выделение значимых коэффициентов не создает достаточной наглядности. Тогда к нижней части матрицы можно добавить еще несколько строк и записать в соответствующих клетках число значимых коэффициентов в данном столбце: значимых на уровне 0.05, значимых на уровне 0.01, суммарное число значимых коэффициентов. Это лучше позволит увидеть иерархию признаков по числу значимых корреляционных связей.

Вычисленные коэффициенты корреляции надо наглядно представить и описать в тексте: что с чем связано, какова направленность связи — положительная или отрицательная, уровень достоверности, теснота связи. Все множество корреляционных связей разделяют с опорой на содержательные критерия деления: например, в соответствии с задачами и подзадачами всего исследования или его фрагмента. Придерживаясь этих же критериев, организуют наглядное представление подмножеств корреляционных связей. Затем эти подмножества корреляционных связей последовательно описывают. Эти моменты освещены в главе «Описание и представление результатов исследования».