Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
7
Добавлен:
11.05.2015
Размер:
53.25 Кб
Скачать

Допустим, что объекты генеральной совокупно­сти обладают двумя качественными признаками. Под ка­чественным подразумевается признак, который невозмож­но измерить точно, но он позволяет сравнивать объекты между собой и, следовательно, расположить их. в порядке убывания или возрастания качества. Для определенности будем всегда располагать объекты в поряд­ке ухудшения качества. При таком «ранжирова­нии» на первом месте находится объект наилучшего каче­ства по сравнению с остальными; на втором месте ока­жется объект «хуже» первого, но «лучше» других, и т. д.

Пусть выборка объема п содержит независимые объ­екты, которые обладают двумя качественными признака­ми А и В. Для оценки степени связи признаков вводят, в частности, коэффициенты ранговой корреляции Спирмена (изложен в настоящем параграфе) и Кендалла (см. § 26).

Для практических целей использование ранговой кор­реляции весьма полезно. Например, если установлена высока* ранговая корреляция между двумя качествен.

нымм признаками изделий, то достаточно контролировать; изделия только по одному из признаков, что удешевляет

и ускоряет контроль.

Расположим сначала объекты выборки .в порядке уху*

шення качества по признаку А при допущении, чтовс! объекты имеют различное качество по обоим признакам (случай, когда это допущение не выполняем­ся, рассмотрим ниже). Припишем объекту, стоящему на им месте, число—ращг*/, равный порядковому номеру объекта. Например, ранг объекта, занимающего первое место, х1\\ объект, расположенный на втором месте, имеет ранг х2—2} и т. д. В итоге получим последовательность рангов по признаку А: х1=\, х2 = 2, ...,хп = п.

Расположим теперь объекты в порядке убывания Ка­чества по признаку В и припишем каждому из них ранг у1% однако (для удобства сравнения рангов) индекс/ при у будет по-прежнему равен порядко­вому номеру объекта по признаку Л. Напри­мер, запись у2 = 5 означает, что по признаку А объект стоит на втором месте, а по признаку В — на пятом. I

В итоге получим две последовательное-!^ рангов: I

по признаку А . . . х1% х2, . . ., хп

по признаку В ... у у2, уп I

Заметим, что в первой строке индекс I совпадает с по­рядковым номером объекта, а во второй, вообще говоря, не совпадает. Итак, в общем случае ЩЩЖ Рассмотрим два «крайних случая».

Пусть ранги по признакам А и В совпадают при всех значениях индекса 1:х{ = у{. В 1гом случае ухуд­шение качества по одному признаку влечет ухудшение качества по другому. Очевидно, признаки связаны: имеет место «полная прямая зависимость».

2. Пусф> ранги по признакам Л и Б противоположны в том смы&1е, что если 9иф то У±**Щ если х2 = 2, то уа = п—1; . ,{Ж еслил;д = п, тог/п=1. В этом случае у худ* шение качества по одному признаку влечет улучшение по другому. Очевидно, признаки связаны — имеет мест «противоположная зависимость».

На практике чаще будет встречаться промежуточный случай, когда ухудшение качества по одному признаку влечет для некоторых объектов ухудшение, а для дру­гих—улучшение качества. Задача состоит в том, чтобы

оценить связь между признаками. Для ее решения рас* смотрим ранги х1$ х2, ...,хп как возможные значения случайной величины X, а ух% у29.. ., уп— как возможные

значения случайной величины У. Таким образом, о связи между качественными признаками А и В можно судить по связи между случайными величинами X и К, для оценки которой используем коэффициент корреляции.

Вычислим выборочный коэффициент корреляции слу­чайных величин X и V в условных вариантах (см. гл. XVIII, § 8):

поиоу

приняв в качестве условных вариант отклонения и{ = = Г, Щт1/{—у. Каждому рангу х, соответствует только один ранг у(1 поэтому частота любой гов с одинаковыми индексами, ^ следовательно, и любой пары условиях вариант с одинаковыми индексами равна единице: пи = 1. Очевидно, что частота любой пары

вариант с разными индексами равна нулю. Учитывая, [■•кроме того,, что среднее значение отклонения равно нуль (см. гл. XVI, § 7, следствие), т.е. и = а=*0, получим более простую формулу вычисления выборочного коэф фициента корреляции:

' § | г =2>™. (*)

в поиоу

образом, надо найти ^ир,-, оа и оу. Выразим чеРез известные числа — объем выбор-

ки п и разности рангов А; = Х; у{. Заметим, что по­скольку средние значения рангов х = (1 + 2 + ^ . + и у = (1 + 2+ • . . +п)/п равны между собой, то у х = 0. Используем последнее равенство:

41 = Х;—У( = Х1 У1 + — *) = (*,— X) ((/,— у) = II,-

Следовательно,

# = (",— ",)*• Щ^^^ШШ Учитывая, что (см. далее пояснение)

НЩ 2и?«2^-(п*-п)/12^еИИ1м

Приведем свойства выборочного коэффициента корре­ляции СЙм р мена.

Свойство 1. Если между качественными призна­ками А и В имеется «полная прямая зависимость* в том смысле, что ранги объектов совпадают при всех значе­ниях I, то выборочный коэффициент ранговой корреляции Спирмена равен единице.

Действительно, подставив д,{ = Х(у 1 = 0 в (•*»♦), по-Ш&им

I рв=1-

С в о й с т в о 2. Если между качественными признаками и В имеется «противоположная зависимость"» в том смысле, что рангу хх «= 1 соответствует ранг ух — п\ рангу х9 соответствует ранг у, = п — 1; ...; рангу хп = п соответствует ранг ун = 1, то выборочный коэффициент ранговой корреляции Спирмена равен минус единице. Действительно,

' ^=1—/г, а9 = 3 — п, йп = (2л — 1)—п.

Следовательно,

2<*? = (1 — л)2 + (3 — л)3 + ... + [(2/г— 1) — л]3 = = [1' + 3»+...+(2п— I)2] — 2л [1+3 + ...+(2л-1)] + + п п* = [п (4/г3 — 1 )/3] — 2л п3 + л» = (л8—л)/3.

Подставив 2 йа = (/г3—л)/3 в (**»*), окончательно по­лучим

Рв = — I

Свойство 3. Если между качественными признаками А и В нет ни толпой прямой*, ни «противоположной» зависимостей, то коэффициент рв заключен между — 1 и + 1, причем чем ближе к нулю его абсолютная величина, тем зависимость меньше.

Пример 1. Найти выборочный коэффициент ранговой корреляции Спирмена по данным ранга объектов выборки объема п = 10:

X/ 123456 789 10 У1 6 4 8 I 2 5 10 3 7 9

Решение. Найдем разности рангов с*,-=л',-—у,*; —5,-2,-5 3, 3, 1, —3, б, 2, I.

Вычислим сумму квадратов разностей рангов:

2 4? - 25 + 4 + 85 + 9 + 9 + I + 9 + 95 + 4 + I » 111

Нейдем искомый коэффициент ранговой корреляции, учитывая, что п== 10:

Рв=1[б2^/(«'— «)] ' — [6-112/(1000— 10)| ш 0,32.

Замечание. Если выборка содержит объекты с одинако­вым качеством, то каждому из них приписывается ранг, рае-ный среднему арифметическому порядковых номеров объектов. Напри­мер, если объекты одинакового качества по признаку А имеют порядковые номера 5 и 6, то их ранги соответственно равны: х,= -*(б + 6)/2«=5,5; хвв*5,5.

Приведем правило, позволяющее установить значи­мость или незначимость ранговой корреляции связи для выборок объема п^9. Если п < 9, -то пользуются таб­лицами (см., например, табл. 6.10а, 6.106 в книге: Боль­шее Л. Н., Смирнов Н. В. Таблицы математической статистики. М., «Наука», 1965).

Правило. Для того чтобы при уровне значимости а проверить нулевую гипотезу о равенстве нулю генераль­ного коэффициента ранговой корреляции рг Спирмена при конкурирующей гипотезе Я1г^0, надо вычислять критическую точку:

К ::Щ Гкр= гкр (о; к) КО—Р.)/(л —2), !*М<«^

где п—объем выборки, рв — выборочный коэффициент ран­говой корреляции Спирмена, /кр(а; к)— критическая точка двусторонней критической области, которую находят по таблице критических точек распределения Стьюдента, по уровню значимости а и числу степеней свободы к = л—2.

Если \р„\<Ткрнет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качест­венными признаками незначима.

Если |рв| > Гкр — нулевую гипотезу отвергают. Между качественными признаками существует значимая ранговая корреляционная связь.

Пример 2. При уровне значимости 0,05 проверить, является ля ранговая корреляционная связь, вычисленная в примере I, значимой?

Решение. Найдем критическую точку двусторонней критичес­кой области распределения Стьюдента по уровню значимости а«0 0$ и числу степеней свободы 6 = п —2= 10 —2 = 8 (см. приложение <Ь* '«р(0,0в; в)-2,31.

Найдем критическую точку:

Г»рвр(в; *)У(1-рЬ/(*-~г).

Подставив *кп = 2,31, л«=10, р,**0,24, получим Г^^ОД Итак, Гкр = 0,79, рв-0,24.

Так как рш < Т*,» —к«т оснований отвергнуть *ул*»ую г**<мгм|; ММГовяя корреляционная связь между признаками Незначимая.

Соседние файлы в папке ИДЗ