Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Гмурман.doc
Скачиваний:
6
Добавлен:
01.03.2025
Размер:
4.92 Mб
Скачать

§ 25. Выборочный коэффициент ранговой корреляции Спирмена и проверка гипотезы о его значимости

Допустим, что объекты генеральной совокупно­сти обладают двумя качественными признаками. Под ка­чественным подразумевается признак, который невозмож­но измерить точно, но он позволяет сравнивать объекты между собой и, следовательно, расположить их. в порядке убывания или возрастания качества. Для определенности будем всегда располагать объекты в поряд­ке ухудшения качества. При таком «ранжирова­нии» на первом месте находится объект наилучшего каче­ства по сравнению с остальными; на втором месте ока­жется объект «хуже» первого, но «лучше» других, и т. д.

Пусть выборка объема п содержит независимые объ­екты, которые обладают двумя качественными признака­ми Л и В. Для оценки степени связи признаков вводят, в частности, коэффициенты ранговой корреляции Спирмена (изложен в настоящем параграфе) и Кендалла (см. § 26).

Для практических целей использование ранговой кор­реляции весьма полезно. Например, если установлена

335

высокая ранговая корреляция между двумя качествен ными признаками изделий, то достаточно контролировать изделия только по одному из признаков, что удешевляет и ускоряет контроль

Расположим сначала объекты выборки в порядке ухуд. шения качества по признаку А при допущении, что все объекты имеют различное качество по о б о и ^ признакам (случай, когда это допущение не выполняет­ся, рассмотрим ниже). Припишем объекту, стоящему на i-M месте, число—ранг хп равный порядковому номеру объекта Например, ранг объекта, занимающего первое место, х1 = \. объект, расположенный на втором месте, имеет ранг л:2 = 2' и т. д. В итоге получим последовательность рангов по признаку А: х1=1, х2 = 2, . . ., хп = п.

Расположим теперь объекты в порядке убывания ка­чества по признаку В и припишем каждому из них ранг у,, однако (для удобства сравнения рангов) индекс i при у будет по-прежнему равен порядко­вому номеру объекта по признаку Л. Напри­мер, запись у2 = 5 означает, что по признаку А объект стоит на втором месте, а по признаку В— на пятом.

В итоге получим две последовательности рангов:

по признаку А . .. хи х2, . .., хп по признаку В . .. ух, у2, . . ., уп

Заметим, что в первой строке индекс i совпадает с по­рядковым номером объекта, а во второй, вообще говоря, не совпадает. Итак, в общем случае х, Ф yt. Рассмотрим два «крайних случая».

  1. Пусть ранги по признакам А и В совпадают при всех значениях индекса i:xl — yl. В этом случае ухуд­ шение качества по одному признаку влечет ухудшение качества по другому. Очевидно, признаки связаны: имеет место «полная прямая зависимость».

  2. Пусть ранги по признакам А и В противоположны в том смысле, что если xl—\, то уг = п; если х2 = 2, то у2 = п \; . .., если хп = п, то уп = 1. В этом случае ухуд­ шение качества по одному признаку влечет улучшение по другому. Очевидно, признаки связаны — имеет место «противоположная зависимость».

На практике чаще будет встречаться промежуточный случай, когда ухудшение качества по одному признаку влечет для некоторых объектов ухудшение, а для дру гих — улучшение качества. Задача состоит в том, чтобы

336

оценить связь между признаками. Для ее решения рас-сМотрим ранги xlt х2, ..., хп как возможные значения сЛучайной величины X, a ух, y2,---, у„ — как возможные значения случайной величины Y. Таким образом, о связи между качественными признаками А и В можно судить по связи между случайными величинами X и Y, для оценки которой используем коэффициент корреляции.

Вычислим выборочный коэффициент корреляции слу­чайных величин X и У в условных вариантах (см. гл. XVIII, § 8):

в nauav '

приняв в качестве условных вариант отклонения и, =

= х,х, v, = y,у. Каждому рангу х, соответствует только один ранг уп поэтому частота любой пары ран­гов с одинаковыми индексами, а следовательно, и любой пары условных вариант с одинаковыми индексами равна единице: па „ =1. Очевидно, что частота любой пары

вариант с разными индексами равна нулю. Учитывая, кроме того, что среднее значение отклонения равно нулю (см. гл. XVI, § 7, следствие), т.е. ц = у=^0, получим более простую формулу вычисления выборочного коэф­фициента корреляции:

в nauov v '

Таким образом, надо найти 2"»и«» °а и °V

Выразим 2"(у' через известные числа — объем выбор­ки п и разности рангов dl = xlyh Заметим, что по­скольку средние значения рангов х — (1 + 2 -f- ... -\-п)/п [if/ = (l+2+...-f п)/п равны между собой, то^ — х = 0. Используем последнее равенство:

Следовательно,

df = (u,—vt)\ Учитывая, что (см. далее пояснение)

2 2 (**)

337

имеем

Отсюда

Остается найти ои и о^. По определению выборочной дисперсии, учитывая, что ы = 0, и используя (**), По_ лучим

Отсюда среднее квадратическое отклонение

Аналогично найдем Следовательно,

цаг, = (п3—/г)/12.

Подставив правые части этого равенства и соотно­шения (***) в (*), окончательно получим выборочный коэф­фициент ранговой корреляции Спирмена

рв = 1 -[(6 2^8)/(«3-«)]. (•**•)

где dl = xl—yi.

Пояснение. Покажем, что ^uf = (n3 n)j 12. Дей­ствительно, учитывая, что

2 и? = 2 (xt —х)2 =2*?—2х2 после элементарных выкладок получим

Аналогично можно показать, что

338

Приведем свойства выборочного коэффициента корре­кции Спирмена.

Свойство 1. Если между качественными призна­ками А и В имеется «полная прямая зависимость-» в том смысле, что ранги объектов совпадают при всех значе­ниях i, то выборочный коэффициент ранговой корреляции Спирмена равен единице.

Действительно, подставив dt — Xiу, —О в (****), по­дучим

i

Свойство 2. Если между качественными признаками Л и В имеется «противоположная зависимость» в том смысле, что рангу хх=\ соответствует ранг у1='п; рангу х2 соответствует ранг у2 = п — 1; ...; рангу хп = п соответствует ранг уп= 1, то выборочный коэффициент ранговой корреляции Спирмена равен минус единице.

Действительно,

dt=lп, d2 — 3п, ..., dn = (2n—1) — п. Следовательно,

1)»] —2n[l+3+...+(2n —1)] +

2л-/г2 + я3 = (/г3п)/3.

Подставив ^df = (n3 п)/3 в (****), окончательно по­лучим

рв = —1.

Свойство 3. Если между качественными признаками А и В нет ни «полной прямой», ни «противоположной» зависимостей, то коэффициент рв заключен между — 1 и + 1, причем чем ближе к нулю его абсолютная величина, т зависимость меньше.

Пример 1. Найти выборочный коэффициент ранговой корреляции ирмена по данным ранга объектов выборки объема га =10:

Х{ 1 2 3 4 5 6 7 8 9 10 У1 6 4 8 1 2 5 10 3 7 9

Решение. Найдем разности рангов d/ = *,-—щ: —5, —2, —5, 3, 1, —3, 5, 2, 1. Вычислим сумму квадратов разностей рангов:

2 dt? = 25 + 4 + 25 +9 + 9+ 1+9 + 25 + 4+ 1 = 112.

339

Найдем искомый коэффициент ранговой корреляции, учитывая что п=10:

рв= 1 —[б 2dV(ns—n)] = 1 _[6-112/(1000— 10)] =0,32.

Замечание. Если выборка содержит объекты с одинако вым качеством, то каждому из них приписывается ранг, рав" ный среднему арифметическому порядковых номеров объектов. Напри мер, если объекты одинакового качества по признаку А имеют порядковые номера 5 и 6, то их ранги соответственно равны: *. _, (5!6)/2 55 55

Приведем правило, позволяющее установить значи­мость или незначимость ранговой корреляции связи ддя выборок объема п^9. Если п < 9, то пользуются таб­лицами (см., например, табл. 6.10а, 6.106 в книге: Боль-шев Л. Н., Смирнов Н. В. Таблицы математической статистики. М., «Наука», 1965).

Правило. Для того чтобы при уровне значимости а проверить нулевую гипотезу о равенстве нулю генераль­ного коэффициента ранговой корреляции рг Спирмена при конкурирующей гипотезе Н1гФ0, надо вычислить критическую точку:

Ткр = tKP(a; k)K(l-p№-2),

где п — объем выборки, рв — выборочный коэффициент ран­говой корреляции Спирмена, tKp(a; k) — критическая точка двусторонней критической области, которую находят по таблице критических точек распределения Стьюдента, по уровню значимости а и числу степеней свободы /г = п—2.

Если |р„|<7\<р—нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качест­венными признаками незначима.

Если | рв| > 7"Кр—нулевую гипотезу отвергают. Между качественными признаками существует значимая ранговая корреляционная связь.

Пример 2. При уровне значимости 0,05 проверить, является ли ранговая корреляционная связь, вычисленная в примере 1, значимой?

Решение. Найдем критическую точку двусторонней критичес-кой'области распределения Стьюдента по уровню значимости а = 0,05 и числу степеней свободы fe = re—2=10 — 2 = 8 (см. приложение 6): *кр(0,05; 8) = 2,31.

Найдем критическую точку:

П одставив <кр = 2,31, /г = 10, рв = 0,24, получим TKV = 0,79.

Итак, Гкр = 0,79, рв = 0,24.

Так как рв < Ткр — нет оснований отвергнуть нулевую гипотезу; ранговая корреляционная связь между признаками незначимая.

340