
- •Методическое пособие к курсу «Информатика для психологов»
- •Содержание
- •1. Подготовка таблицы результатов первичной обработки исходных данных
- •2. Построение диаграмм (гистограмм и графиков) по средним значениям в подгруппах
- •2.1. Построение вспомогательной таблицы средних значений
- •2.2. Построение диаграмм с использованием Мастера диаграмм
- •3. Сравнение независимых выборок в Excel
- •3.1. Сравнение выборок по t-критерию Стьюдента (параметрический критерий)
- •3.2. Сравнение выборок по u-критерию Манна-Уитни (непараметрический критерий)
- •4. Построение матрицы интеркорреляций в Excel
- •4.1. Построение матрицы интеркорреляций с использованием линейного коэффициента корреляции Пирсона (параметрический критерий)
- •4.2. Построение матрицы интеркорреляций с использованием рангового коэффициента корреляции Спирмена (непараметрический критерий)
- •5. Использование условного форматирования для обозначения различных уровней значимости коэффициентов корреляции
- •6. Применение критерия Хи-квадрат Пирсона для выявления связи между номинативными переменными
- •Литература
- •Приложение 1. Критические значения t-критерия Стьюдента
- •Приложение 2.
- •Приложение 3.
- •Приложение 4. Критические значения χ2 –распределения
4. Построение матрицы интеркорреляций в Excel
4.1. Построение матрицы интеркорреляций с использованием линейного коэффициента корреляции Пирсона (параметрический критерий)
Рассмотрим построение матрицы интеркорреляций (т.е. корреляции всех показателей друг с другом) по всей выборке. В Excel реализован линейный коэффициент корреляции Пирсона.
Создать новый лист, назвать его «Корреляции».
Скопировать названия показателей вверху (начиная от столбца С), а также те же самые названия вставить слева:
Установить курсор на пересечении строки первого показателя со столбцом его же (в левом верхнем углу полученной таблицы).
Вызвать функцию КОРРЕЛ (линейный коэффициент корреляции Пирсона):
Перейти на лист с исходными данными и обвести диапазон, соответствующий первой шкале для поля Массив1.
Переключиться на Массив2 и обвести тот же диапазон:
По нажатию Ok получим корреляцию первого показателя с самим собой (всегда равен 1):
Для того, чтобы при копировании формулы вправо столбец для первого диапазона оставался закрепленным, а для второго наращивался при «растягивании» вправо, войти в строку формул и поставить знаки доллара так, как показано на рисунке ниже, нажать Enter:
Растянуть построенную формулу до конца таблицы. Так как первый столбец закреплен, а второй наращивается, получаем коэффициенты корреляции 1-го столбца со 2-м, 1-го с 3-м, 1-го с 4-м и т.д.:
Установить курсор на пересечении строки второго показателя со столбцом его же, вычислить коэффициент корреляции второго показателя с самим собой:
Закрепить первый диапазон, растянуть построенную формулу до конца таблицы:
Повторить вычисления для всех показателей:
Полученная матрица интеркорреляций имеет треугольный вид, что не всегда удобно для интерпретации. Рекомендуется привести ее к квадратному виду, растягивая формулы также и в левую сторону (установить курсор на 1 и тянуть за правый нижний угол влево):
Отформатировать полученную матрицу: формат ячейки числовой, 2 знака после запятой, по центру:
Аналогично можно строить матрицы интеркорреляций по отдельным подвыборкам (например, отдельно по мужской или по женской подвыборке), обводя на 5-м и 6-м шаге не весь столбец, а только диапазоны значений, которые относятся к конкретной подвыборке.
4.2. Построение матрицы интеркорреляций с использованием рангового коэффициента корреляции Спирмена (непараметрический критерий)
Рекомендуется использовать не линейный коэффициент корреляции Пирсона, а его непараметрический аналог ранговый коэффициент корреляции Спирмена в следующих случаях:
если показатель измерен не по метрической, а по порядковой шкале,
если количество испытуемых в выборке меньше 30,
если форма распределения значимо отклоняется от нормальной.
Формула рангового коэффициента корреляции Спирмена:
,
где
–
разность между рангами сопряженных
значений признаков X
и Y,
n
– число парных членов ряда (если в
таблице данных нет пропусков, равно
объему выборки).
Пример.
Рассмотрим результаты наблюдений проявления ситуативной и общей тревожности на выборке учащихся 12-14 лет (n=10) и установим, связаны ли между собой проявления этих признаков.
№ |
X |
Y |
Rx |
Ry |
d=Rx-Ry |
d2 |
|
|
1 |
17 |
70 |
1 |
1 |
0,0 |
0,00 |
70 |
1 |
2 |
18 |
74 |
2,5 |
3 |
-0,5 |
0,25 |
72 |
2 |
3 |
18 |
78 |
2,5 |
7 |
-4,5 |
20,25 |
74 |
3 |
4 |
19 |
72 |
4,5 |
2 |
+2,5 |
6,25 |
76 |
4 |
5 |
19 |
77 |
4,5 |
5,5 |
-1,0 |
1,00 |
77 |
5,5 |
6 |
20 |
76 |
6 |
4 |
+2,0 |
4,00 |
77 |
5,5 |
7 |
21 |
88 |
7 |
10 |
-3,0 |
9,00 |
78 |
7 |
8 |
22 |
80 |
8 |
8 |
0,0 |
0,00 |
80 |
8 |
9 |
23 |
77 |
9 |
5,5 |
+3,5 |
12,25 |
86 |
9 |
10 |
25 |
86 |
10 |
9 |
+1,0 |
1,00 |
88 |
10 |
СУММА |
|
|
55 |
55 |
0 |
54 |
|
|
Если бы отдельные члены ряда не повторялись, их рангами были бы порядковые номера. Для одинаковых значений ранги вычисляются как средние арифметические их порядковых номеров в упорядоченном ряду. У одинаковых значений признака должны быть одинаковые ранги.
Подставляем d2 в первую формулу для вычисления
Полученная величина rs=0,67 превосходит критическое значение r0,05;10=0,64 для n=10 и уровня значимости p=0,05 (см. Приложение 3), что позволяет сделать вывод о существовании статистически значимой положительной корреляции между проявлениями ситуативной и общей тревожности (rs=0,67; p<0,05).
Выполним все вычисления в Excel. Возможности автоматизации вычислений в случае ранговых критериев ограничены, т.к. каждый показатель должен ранжироваться (упорядочиваться по возрастанию) отдельно.
Шаг 1. Сформируем таблицу со всеми необходимыми графами для вычислений и введем в нее значения двух столбцов показателей, которые нужно скоррелировать (X и Y):
Шаг 1.
Пустая строка после названий нужна для того, чтобы автоматическая сортировка их не захватила.
Шаг 2. Упорядочим данные по возрастанию значений первого столбца: выделим все значения первого столбца и выберем пункт Главного меню «Сортировка и фильтр», «Сортировка от минимального к максимальному».
После этого буде выдана экранная форма с предложением «автоматически расширить выделенный диапазон», для согласия с предложением нажать «Сортировка».
В результате сортировки данные будут перемещены целыми строками, согласно значению показателя Х.
Шаг 3. Записшем ранги значений по переменной X и по переменной Y в столбцах Rx и Ry.
Р
анги
значений переменной X – это просто их
порядковые номера.
Шаг. 4. Преобразуем полученные ранги в связанные – т.е. заменим порядковые номера одинаковых значений на средние арифметические соответствующих порядковых номеров. В данном примере есть два повторяющихся значения 18 с порядковыми номерами 2 и 3 (среднее арифметическое 2,5) и два повторяющихся значения 19 с порядковыми номерами 4 и 5 (среднее арифметическое 4,5).
Шаг 4.
Шаг. 5. Значения показателя Y также необходимо преобразовать в ранги. Для этого скопируем его значения в предпоследний столбец (Yранж):
Шаг 5.
Шаг. 6. Отсортируем скопированные значения Y и пронумеруем их в столбце Ранги Y, порядковые номера двух одинаковых значений 77 (5 и 6) заменяем на их среднее арифметическое (5,5):
Шаг 6.
Шаг. 7. Перепишем в столбец Ry ранги всех значений переменной Y:
Шаг 7.
Шаг. 8. Найдем разность d и квадрат этой разности d2 для первой строки таблицы:
Затем «растянем» эти две формулы на все строки таблицы:
Шаг 8.
Шаг. 9. Найдем сумму по столбцу d для подстановки в формулу для рангового коэффициента корреляции Спримена
Шаг 9.
Шаг. 10. Строим формулу rs:
Шаг 10.
Шаг. 11. Полученный результат 0,67 сравниваем с критическими значениями рангового коэффициента корреляции Спирмена rs(0,05; 10)=0,63, rs(0,01; 10)= 0,77 и rs(0,001; 10)=0,87.
Вычисленное значение превышает первое критическое значение, но не превышает второе. Следовательно, можно сделать вывод о наличии статистически значимой положительной корреляции между общей и ситуативной тревожностью на уровне значимости p<0,05 (rs=0,67; p<0,05).