Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методичка ЛР по ТВИМС.doc
Скачиваний:
17
Добавлен:
31.08.2019
Размер:
1.89 Mб
Скачать

7.2.2. Коэффициент ранговой корреляции Кендалла

Предположим, как и в разд. 7.2.1, что ранги расположены в порядке возрастания и имеется последовательность Кi рангов Y, определяемая последовательностью рангов X. Интуитивно ясно, что если между X и Y имеется сильная положительная корреляция, то ранги У будут упорядочены примерно так же, как и ранги X, а значит, слева от Yi будет мало рангов Y, больших Yi. И, наоборот, если имеется сильная отрицательная связь, то порядок расположения рангов ki будет близок к обратному порядку расположения рангов X и, значит, слева от кi будет много рангов Y, больших кi.

Если корреляционная связь слабая или отсутствует, то ранги Y будут хорошо перемешаны, а слева от кi число рангов, больших, чем к i , будет равно примерно полусумме их чисел в случае положительной и отрицательной корреляций. Поэтому в качестве меры корреляционной связи между Х и Y можно выбрать сумму рангов Y, стоящих слева от кi и больших Xi.

Обозначим через Ri число рангов, больших ki и находящихся слева от Xi. Подсчитаем сумму Ri для всех i≥2:

R = R2 + R3 + … + Rn.

Если X образует последовательность n, n-1, … , 1 (что имеет место, если Y = -X ), то R принимает максимальное значение Rmax , равное 1/2n (n-1).

Чтобы привести R в отрезок (-1,+1) достаточно сделать следующее преобразование:

(7.11)

Величина называется коэффициентом ранговой корреляции Кендалла. Нетрудно видеть, что обладает свойством коэффициента корреляции ; . Если X и Y некоррелированы, то =0.

Если гипотеза H0 верна, то распределение Q сходится к нормальному с нулевым средним и дисперсией

(7.12)

Проверка гипотезы о существовании корреляционной связи X и Y состоит в проверке на значимость Qxy. Если гипотеза Hо верна, то в соответствии с нормальным распределением находим область значений критерия, вероятность которых не превосходит q вблизи 0. Для двусторонней критической области вероятность попасть в нее равна

откуда

Вычислим для условий примера 7.2.1. По табл. 6 находим: R2=1; R3=R4=R5=0; R7=0; R8=3; R9=3; R6=1; R10=4. Сумма рангов R=∑Ri =12. По формуле (7.11) получаем

Определим значимость для рассматриваемого примера при уровне значимости q=0,05. По формуле (7.12) вычисляем дисперсию D Q:

С помощью таблиц интеграла вероятности Ф(x)

Так как 0,47 < 0,49, то при уровне значимости 0,05 можно считать, что корреляционная связь между X и Y незначимая.

7.3. Исследование точности ранговых критериев

Из разд. 7.2 следует, что процедура проверки статистической гипотезы о некоррелированности случайных выборок в принципиальном отношении не отличается от процедур, описанных в разд. 6. Ранговые критерии, рассмотренные в разд. 7.2, в пределе, при неограниченном увеличении объема выборки, подчиняются распределению Стьюдента (критерий Спирмена) или нормальному (критерий Кенделла). Поэтому возникает вопрос о корректности метода в случае коротких выборок ( п мало). Этот аспект исследования точности уже рассматривался в разд. 6 и изложенные там методы оценки точности процедур, основанных на значимости расхождений статистических и гипотетических параметров, полностью могут быть перенесены и на задачу оценки точности ранговых критериев. Читателю предоставляется возможность самостоятельно сформулировать алгоритм решения этой задачи.