Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
методичка ППД для СП.doc
Скачиваний:
166
Добавлен:
13.11.2019
Размер:
5.4 Mб
Скачать

Тема 38. Ранговый бисериальный коэффициент корреляции

Данный КК вычисляется в случае, когда одна переменная (например, х) измерена в номинальной дихотомической шкале, а вторая (например, у) в порядковой (ранговой) шкале. Этот коэффициент был исследован Кертеном и Глассом. Гласс предложил для вычисления ранговой корреляции формулу, которая не требует подсчета совпадений и инверсии.

rrb = 2/n (y 1 – y 0) , где n – общее количество лиц; y 1 – среднее значение по переменной у для лиц, у которых переменная х = 1; y 0 – среднее значение по переменной у для лиц, у которых переменная х = 0.

Пример: пусть у нас имеются следующие исходные данные:

 х (пол)

у (ранги по росту)

0 1 0 1 0 0 1 1 0 0

1 10 2 9 5 8 4 7 3 6

n = 10

y 1 = (10+9+4+7) : 4 = 7,5

y 0 = (1+2+5+8+3+6) : 6 = 4,167

rrb = 2/10 (7,5 – 4,167) = 0,67

Примечание. Если одна переменная, например, х, измерена в порядковой шкале, а вторая переменная у в количественной шкале, то в этом случае не было разработано и исследовано никакого коэффициента корреляции. В такой ситуации рекомендуется преобразовать данные для количественной переменной в порядковую шкалу, т.е. проранжировать и воспользоваться после этого КРК Спирмена или КРК Кендалла.

Тема 39. Коэффициент ранговой корреляции Кендалла

Как и в случае КРК Спирмена исходные данные представляют собой две выборки, каждая из которых содержит n последовательных и несвязанных рангов, т.е. чисел от 1 до n. Кендалл построил свой коэффициент корреляции на количестве пар рангов, которые упорядочиваются в одинаковом направлении как по переменной х, так и по переменной у.

Для некоторой пары лиц констатируется совпадение, если их порядок как по переменной х, так и по переменной у одинаков. Для некоторой пары лиц констатируется инверсия, если их порядок по переменным х и у различен.

КРК Кендалла обычно обозначается и вычисляется по формуле:

КРК = (P – Q) : ((n (n – 1)) :2), где P – общее количество совпадений; Q – общее количество инверсий. Например:

Лицо

х

у

Совпадения

Инверсия

А С В Н Е F D G

1 2 3 4 5 6 7 8

1 2 5 7 8 4 6

5 6 5 3 1 0 1 0

2 0 0 1 2 2 0 0

 

 

 

Р = 21

Q = 7

При вычислении КРК Кендалла для упрощения расчетов данные располагают по одной переменной (например, х) в порядке возрастания.

Так как для каждой пары может быть или совпадение или инверсия, то после подсчета совпадений количество инверсий равно количеству сравниваемых лиц (исключая себя) минус количество совпадений.

КРК = (21 – 7) : (8 (8 – 1) : 2) = 0,5.

Отсюда видно, что между переменными х и у имеется прямая (положительная) средняя корреляционная связь.

В случае связанных (одинаковых) КРК Кендалла, как и КРК Спирмена, вычисляется по формуле:

КРК = (P – Q) : [ n (n – 1) :2 – Kx ] [ n (n – 1) :2 – Ky ] , где поправки Кх и Ку вычисляются по следующим формулам:

k

Кх = [ fi (fi – 1)] : 2, где k - количество групп совпадающих

i=1

рангов по переменной х; fi - количество значений в i-той группе совпадений.

m

Ky = [gi (gi – 1)] : 2, где m - количество групп совпадающих

i=1

рангов по переменной у, gi - количество значений в i-той группе совпадений.

Наиболее часто на практике используется КРК Спирмена. Следует также отметить, что КРК Спирмена и КРК Кендалла связаны следующим приблизительным соотношением:

rs = 1,3

Значимость КРК Кендалла.

После вычисления КРК Кендалла необходимо проверить полученное значение КРК на значимость. Для этого воспользуемся общей схемой проверки статистической гипотезы.

1. Выдвигаются две статистические гипотезы:

Н0 о том, что КРК Кендалла статистически равен 0 и

Н1 о том, что этот КРК статистически отличен от 0.

Н0 : =0

Н1 : / =0.

2. Выбирается уровень значимости .

3 . Вычисляется наблюдаемое значение статистического критерия. Для этого сначала вычисляем величину

т.е. - Zкр < Zнабл. < Zкр, то в нашем случае делаем вывод о том, что на уровне значимости 0,05 КРК Кендалла статистически равен 0, т.е. не является значимым.

Проверка гипотезы о равенстве двух коэффициентов корреляции.

Иногда может возникать задача сравнения для двух различных групп лиц. Например: сильнее ли коррелированы способности и успеваемость у мальчиков, чем у девочек?

Для решения такой задачи воспользуемся общей схемой проверки статистической гипотезы.

1. Выдвигаются две статистические гипотезы, основная нулевая Н0 о том, что КК двух рассматриваемых ГС статистически одинаковы и альтернативная Н1 о том, что эти КК статистически различны.

Н0: 1 = 2, где 1 – КК между двумя исследуемыми показателями в первой ГС

Н1: 1 /= 2, где 2 – КК между двумя исследуемыми показателями во второй ГС.

2. Выбираем уровень значимости .

3. Вычисляется наблюдаемое значение статистики критерия. Для этого сначала по исходным данным вычисляется КК, r1 и r2. После этого вычисленные КК с помощью преобразования Фишера преобразуются величины Z1 и Z2.

Z1 = ½ ln (1+r1) : (1 – r1)

Z2 = ½ ln (1+r2) : (1 – r2)

Тогда наблюдаемое значение статистики критерия вычисляется по следующей формуле:

Zнабл. = (Z1 – Z2) : (1 : (n – 3) + 1 : (m – 3), где n – количество лиц первой группы, а m – количество лиц второй группы.

4. Находится критическое значение статистики критерия. В нашем случае статистика критерия имеет стандартное нормальное распределение, поэтому для нахождения Zкр нужно воспользоваться статистической таблицей стандартного нормального распределения

5. Делаем вывод о правильности той или иной гипотезы по следующему правилу: 1) если –Zкр < Zнабл < Zкр, то принимается гипотеза Н0, т.е. делаем вывод о том, что КК между исследуемыми показателями в двух рассматриваемых ГС статистически одинаковы на уровне значимости . 2) если Zнабл < -Zкр или Zнабл > Zкр, то принимается гипотеза Н1, т.е. делаем вывод о том, что эти КК статистически различны на уровне значимости .

Так как Zнабл > Zкр, то принимаем гипотезу Н1, т.е. корреляция между интеллектом и скоростью обмена веществ у детей сильнее (т.к. r1 > r2), чем у взрослых.

Таблица выбора необходимого коэффициента корреляции.

У

Х

Номинальная дихотомическая

Ранговая (порядковая)

Количественная

Номинальная дихотомическая

«Анализ взаимосвязи номинальных признаков с помощью корреляционного анализа»

«Ранговый бисериальный коэффициент корреляции»

«Бисериальный коэффициент корреляции (бкк)» (по y).

Ранговая (порядковая)

«Ранговый бисериальный коэффициент корреляции»

«Анализ взаимосвязи ранжированных признаков.»

«Коэффициент ранговой корреляции Кендалла»

Примечание по теме «Ранговый бисериальный коэффициент корреляции»

Количественная

«Бисериальный коэффициент корреляции» (бкк) (по х )

Примечание по теме «Ранговый бисериальный коэффициент корреляции»

«Коэффициент корреляции Пирсона»

«Значимость коэффициента корреляции»