
4.3. Ранговая корреляция
В результате формализации данных экспертными методами получается упорядоченный ряд, состоящий из рангов. Будем считать ранги случайными числами и введем для них статистику связи. Показателем связи ранжированных рядов может служить коэффициент ранговой корреляции.
Пусть n объектов ранжированы сначала по степени обладания свойством Х (ранги обозначим хi), а затем по степени обладания свойством Y (ранги обозначим yi). Ранжировки представим в виде
x1, x2, … , xn;
y1, y2, … , yn,
при этом предполагается, что выполнено условие (4.1). Коэффициент ранговой корреляции оценивает степень связи между этими рядами.
Спирмэн предложил искать оценку коэффициента ранговой корреляции в виде
,
(4.10)
где
В случае, если ранжировки содержат одинаковые ранги, выражение для имеет вид
,
(4.11)
где
Здесь ti
и ui
– числа повторений i-го
ранга в ранжировке по Х
и Y
соответственно.
Исследование
распределения вероятностей коэффициента
ранговой корреляции показывает, что
при отсутствии связи в ранжировках
распределение величины
в формуле (4.10) стремится к нормальному
распределению с дисперсией
. Поэтому для оценки значимости
коэффициента
можно использовать нормальный закон
распределения.
Другой коэффициент ранговой корреляции , не связанный предпосылкой нормальности генеральной совокупности, был предложен Кендэлом. Он также вычисляется по рангам xi и yi. При этом элементы выборки располагают так, чтобы последовательность рангов одной из переменных представляла собой натуральный ряд 1,2,…,n. Для каждого i-го члена последовательности рангов второй переменной устанавливаем числа pi и qi , отражающие соответственно прямой и обратный порядок расположения последующих рангов. Затем подсчитываем суммы этих чисел P=pi и Q=qi , а также разность полученных сумм S=P Q. Коэффициент ранговой корреляции представляет собой отношение этой разности к наибольшему возможному значению P и Q, т.е. к наибольшей возможной сумме pi и qi. Такая величина может быть достигнута лишь тогда, когда порядок рангов в обеих последовательностях полностью совпадают. Она равна:
(4.12)
Коэффициент ранговой корреляции Кендэла можно вычислять по одной из эквивалентных формул:
(4.13)
или
.
(4.14)
Для определения достаточно располагать либо величиной P, либо Q. Чаще всего в формулу подставляют ту величину, которая имеет наименьшее значение.
Расчет показателя Кендэла можно упростить следующим образом:
-
ранжируем ряд по признаку Х в возрастающем порядке с указанием соответствующих им рангов по признаку Y;
-
подсчитываем баллы для всех рангов по признаку Y. Для этого находим, сколько рангов, предшествующих каждому рангу и последующих за ним, превышают его величину. Число предшествующих превышений есть qi , число последующих превышений есть pi;
-
находим сумму баллов
, Q=qi и разность между ними S=PQ. Далее по формулам (4.13) или (4.14).
Нельзя дать рекомендаций, какой из коэффициентов ранговой корреляции предпочтительнее на практике. Коэффициенты и построены по разному. При их вычислении по одной и той же последовательности чисел обычно >, но это ни о чем не говорит, так как оба коэффициента имеют пределы изменений от –1 до +1, а точность их не определена.