
- •Калинин а.А., Гусева с.И. Простейшие методы анализа данных в психологии
- •Введение
- •1. Шкалы
- •2. Случайное событие
- •3. Случайная величина
- •3.1 Распределение случайной величины
- •Способность обобщения учеников 10 класса одной из школ Ленинградской области (по результатам штур)
- •3.2 Параметры распределения
- •3.3 Нормальное распределение
- •4. Генеральная совокупность и выборка
- •5. Стандартизация психодиагностических методов
- •6. Статистические гипотезы
- •7. Математический аппарат проверки статистических гипотез
- •Подготовка данных и выбор критерия
- •Формулирование нулевой и альтернативной гипотез.
- •7.1. Подготовка данных
- •7.1.1 Порядок выявления аномальных значений
- •7.1.2 Проверка эмпирического распределения на его соответствие нормальному распределению
- •7.2 Сравнение среднего значения некоторой выборки со средним значением генеральной совокупности или с нормативным значением
- •7.3 Сравнение уровня признака в независимых выборках
- •7.4 Сравнение уровня признака в зависимых выборках
- •7.5 Оценка сходства-различия распределений признаков
- •8. Изучение взаимосвязи психологических явлений
- •8.1 Меры связи явлений, измеренных в номинативных шкалах
- •8.2 Корреляционная связь
- •8.2.1 Меры связи для явлений, измеренных в ранговых шкалах
- •8.2.2 Меры связи для явлений, измеренных в разных шкалах
- •8.2.3 Меры связи для явлений, измеренных в шкале интервалов или отношений
- •8.3 Корреляционный анализ
- •Список использованной литературы:
- •Критические значения f-критерия Фишера
- •Приложение 2 . Результаты штур, использованные при составлении задач настоящего методического пособия
- •11 Класса одной из школ Ленинградской области
- •Калинин а.А., Гусева с.И. Простейшие методы анализа данных в психологии
- •189620, Г. Пушкин, Петербургское шоссе, 10
8. Изучение взаимосвязи психологических явлений
8.1 Меры связи явлений, измеренных в номинативных шкалах
Коэффициент четырехклеточной сопряженности. Когда объекты классифицированы по двум или нескольким свойствам, то результат такой классификации можно представить в виде таблиц, в которых строки будут иметь заголовки одного свойства, а столбцы - другого, а сочетания всех свойств будут рассматриваться попарно. Такие таблицы называются таблицами сопряженности. В заголовки столбцов выносятся свойства Х1, Х2 и т.д. до Xi, в заголовки строк У1, У2 и т.д. до Yj. В клетки таблицы заносим частоту - то есть количество случаев сочетания Х1 и У1 (записывается Х1 и У1), Х1У2, Х1У3 и т.д. до Х1Уj в первой строке, Х2У1, Х2У2 ..... X2Yj во второй строке, и так по всей таблице вплоть до нижней правой клетки, где будет XiУj.
Силу связи между двумя явлениями, измеренными в дихотомической номинативной шкале, оценивают с помощью коэффициента четырехклеточной сопряженности Пирсона :
В данной формуле a, b, c, d - это количество случаев в каждой ячейке таблицы: a, b - в верхней строке справа налево, c и d - в нижней строке. Коэффициент может изменяться от -1 до 1. Если он равен нулю, то связь отсутствует, если близок к нулю - связь слабая, а если приближается к 1 (или -1) или равен ей, то связь сильная.
С помощью коэффициента 4-х-клеточной сопряженности Пирсона можно непосредственно сравнивать между собой силу связи по двум и более таблицам сопряженности - коэффициент четырехклеточной сопряженности указывает, что в таблице А связь сильнее, чем в таблице Б. Статистически же точный ответ, значимо ли отличается коэффициент от нуля, то есть значима ли связь между явлениями, можно получить с помощью критерия 2 Пирсона.
где fi - эмпирическая частота, а ft - теоретическая частота для ячейки таблицы. Эмпирическая частота - это те значения абсолютной частоты, которые приведены в таблице сопряженности. Теоретическая частота - это та частота, которая значилась бы в данной ячейке при равномерном распределении характеристик. Теоретическая частота рассчитывается согласно правилу вероятности произведения случайных независимых событий по формуле:
где f(xi)- сумма по соответствующей строке, f(yj) - сумма по соответствующему столбцу, а N- общее число испытуемых.
Знак суммы в формуле критерия Пирсона говорит о том, что сложение проводится для всех клеток таблицы.
Число степеней свободы определяется по формуле
= (n-1)(m-1)
где n - число строк в таблице, а m - число столбцов, т.е. для четырехклеточных таблиц =1. Если эмпирическое значение критерия 2 оказывается больше (или равно) критического при заданном уровне доверительной вероятности, то отличие коэффициента от нуля признается статистически значимым.
Для четырехклеточных таблиц с числом испытуемых меньше 30 рекомендуется использовать формулу с учетом поправки Йетса на непрерывность:
Задача: Есть ли связь между результатами сдачи зачета, посещением лекций и местом проживания? Какая из этих связей более сильная?
А. Связь «посещаемость - сдача зачета»:
(здесь и ниже: цифра слева вверху ячейки - эмпирическая частота, справа внизу - теоретическая частота)
Таблица 21
|
У1 - посещал лекции |
У2 - не посещал лекции |
Сумма по строке |
|
Х1 - сдал зачет с 1-го раза |
18 12.87 |
3 8.13 |
21 |
|
Х2-не сдал зачет с 1-го раза |
1 6.13 |
9 3.87 |
10 |
|
Сумма по столбцу |
19 |
12 |
Всего 31 |
|
|
= 0.727 |
Статистическую значимость отличия коэффициента от нуля проверим по критерию 2 Пирсона:
2эмп= (18-12.87)2 + (3-8.13)2 + (1-6.13)2 + (9-3.87) 2 = 16.375
12.87 8.13 6.13 3.87
2кр=6.635 (=0.01)
2эмп > 2кр связь «посещаемость - сдача зачета» статистически значима (0.01).
Б. Связь «место проживания - сдача зачета»:
Таблица 22.
|
У1 - живет дома |
У2- живет в общежитии |
Сумма по строке |
||
Х1 - сдал зачет с 1-го раза |
11 10.29 |
7 7.71 |
18 |
||
Х2-не сдал зачет с 1-го раза |
5 5.71 |
5 4.29 |
10 |
||
Сумма по столбцу |
16 |
12 |
Всего 28 |
||
|
=0.107 |
|
Статистическая значимость связи «место проживания - сдача зачета» проверяется по критерию 2 с учетом поправки Йетса, так как число испытуемых меньше 30:
2эмп= (11-10.29-0.5)2 + (|7-7.71|-0.5)2 + (|5-5.71|-0.5)2 + (5-4.29-0.5)2 = 0.028
10.29 7.71 5.71 4.29
2кр=3.841 (=0.05)
2эмп < 2кр связь «место проживания - сдача зачета» статистически незначима (0.05).
Ответ: Коэффициент четырехклеточной сопряженности для зависимости «посещаемость - сдача зачета» выше, чем для зависимости «место проживания - сдача зачета», следовательно, в первой зависимости связь сильнее.
Если таблицы описывают свойства, измеренные в недихотомической шкале наименований, то они называются таблицами многоклеточной сопряженности.
Для анализа многоклеточных таблиц используются коэффициенты многоклеточной сопряженности Кч - коэффициент Чупрова и - коэффициент Пирсона. Коэффициенты рассчитываются по формулам:
С - коэффициент многоклеточной сопряженности Пирсона:
где N - общее количество испытуемых, 2- критерий Пирсона.
Кч - коэффициент Чупрова:
где n-число строк, m - число столбцов, N - общее количество испытуемых.
Непосредственно по коэффициентам многоклеточной сопряженности К и С, как и в случае с четырехклеточными таблицами, можно сравнивать силу связи между изучаемыми характеристиками в разных таблицах. Статистическая значимость связи и отличия от нуля коэффициентов Чупрова и Пирсона оценивается по критерию 2 Пирсона аналогично четырехклеточным таблицам (с учетом поправки Йетса при количестве измерений менее 30).
Задача: При исследовании связи между удовлетворенностью профессиональной деятельностью, уровнем образования и социальным положением испытуемых получены результаты, приведенные в таблицах. Какие выводы можно сделать о силе связи между этими характеристиками?
Таблица 23.
Удовлетворенность профессиональной деятельностью |
Уровень образования |
Суммы по строкам |
|||
Высшее |
Ср. техн. |
Среднее |
|||
А1 |
А2 |
А3 |
|
||
Высокая |
В1 |
20 12.21 |
10 10.89 |
3 9.90 |
33 |
Средняя |
В2 |
11 16.28 |
15 14.52 |
18 13.20 |
44 |
Низкая |
В3 |
6 8.51 |
8 7.59 |
9 6.90 |
23 |
Сумма по столбцам |
37 |
33 |
30 |
Всего: 100 |
Критерий 2эмп= (20-12.21)2 + (10-10.89)2 + (3-9.90)2 + (11-16.28)2+ (15-14.52)2+
12.21 10.89 9.90 16.28 14.52
+ (18-13.20)2 + (6-8.51)2 + (8-7.59)2 + (9-6.90)2 = 14.74
13.20 8.51 7.59 6.90
.Число степеней свободы =(3-1)(3-1)=4. Критическое значение критерия при 95% доверительной вероятности составляет 9.49, при 99% - 13.28. Поскольку 2эмп >2кр, то зависимость между уровнем образования и удовлетворенностью работой статистически значима (=0.01).
Рассчитав эмпирическое значение критерия 2, можно рассчитать коэффициенты Чупрова и Пирсона:
|
= 0.358, |
|
= 0.271. |
Исследование связи между удовлетворенностью профессией и социальным положением испытуемых дало следующие результаты:
Таблица 24
Удовлетворенность профессиональной деятельностью |
Социальное положение испытуемого |
Суммы по строкам |
||||
Предпри-ниматели |
Гос. служащие |
Рабочие |
Тружени-ки села |
|||
|
А1 |
А2 |
А3 |
А4 |
||
Высокая |
В1 |
14 10.25 |
13 10.66 |
6 11.48 |
8 8.61 |
41 |
Средняя |
В2 |
7 7.75 |
4 8.06 |
14 13.20 |
6 8.68 |
31 |
Низкая |
В3 |
4 7.00 |
9 7.28 |
8 7.84 |
7 5.88 |
28 |
Сумма по столбцам |
25 |
26 |
28 |
21 |
Всего:100 |
Критерий 2эмп= (14-10.25)2 + (13-10.66)2 + (6-11.48)2 + (8-8.61)2 +
10.25 10.66 11.48 8.61
+ (7-7.75)2 + (4-8.06)2 +(14-13.20)2 + (6-8.68)2 + (4-7.00)2 + (9-7.28)2 +
7.75 8.06 13.20 8.68 7.00 7.28
+ (8-7.84)2 + (7-5.88)2 = 9.447
7.84 5.88
Число степеней свободы =(4-1)(3-1)=6. Критическое значение критерия при 95% доверительной вероятности составляет 12.592. Поскольку 2эмп <2кр, то связь между удовлетворенностью профессией и социальным положением испытуемых статистически незначима (=0.05).
|
= 0.293, |
|
= 0.196. |
Коэффициент многоклеточной сопряженности Пирсона С для зависимости «удовлетворенность профессией - образование» выше, чем для зависимости «удовлетворенность профессией - социальное положение», следовательно, в первой зависимости связь более тесная, чем во второй. Аналогичный вывод можно сделать и по коэффициенту Чупрова К.
Следует иметь также в виду, что с помощью рассмотренных коэффициентов и критериев доказывается только отличие распределения цифр в таблице от равномерного. Для описания же характера связи между явлениями следует использовать другие методы, о некоторых из них речь пойдет ниже.