Тервер лабораторные / ИДЗ / Допустим
.docДопустим, что объекты генеральной совокупности обладают двумя качественными признаками. Под качественным подразумевается признак, который невозможно измерить точно, но он позволяет сравнивать объекты между собой и, следовательно, расположить их. в порядке убывания или возрастания качества. Для определенности будем всегда располагать объекты в порядке ухудшения качества. При таком «ранжировании» на первом месте находится объект наилучшего качества по сравнению с остальными; на втором месте окажется объект «хуже» первого, но «лучше» других, и т. д.
Пусть выборка объема п содержит независимые объекты, которые обладают двумя качественными признаками А и В. Для оценки степени связи признаков вводят, в частности, коэффициенты ранговой корреляции Спирмена (изложен в настоящем параграфе) и Кендалла (см. § 26).
Для практических целей использование ранговой корреляции весьма полезно. Например, если установлена высока* ранговая корреляция между двумя качествен.
нымм признаками изделий, то достаточно контролировать; изделия только по одному из признаков, что удешевляет
и ускоряет контроль.
Расположим сначала объекты выборки .в порядке уху*
шення качества по признаку А при допущении, чтовс! объекты имеют различное качество по обоим признакам (случай, когда это допущение не выполняемся, рассмотрим ниже). Припишем объекту, стоящему на им месте, число—ращг*/, равный порядковому номеру объекта. Например, ранг объекта, занимающего первое место, х1 — \\ объект, расположенный на втором месте, имеет ранг х2—2} и т. д. В итоге получим последовательность рангов по признаку А: х1=\, х2 = 2, ...,хп = п.
Расположим теперь объекты в порядке убывания Качества по признаку В и припишем каждому из них ранг у1% однако (для удобства сравнения рангов) индекс/ при у будет по-прежнему равен порядковому номеру объекта по признаку Л. Например, запись у2 = 5 означает, что по признаку А объект стоит на втором месте, а по признаку В — на пятом. I
В итоге получим две последовательное-!^ рангов: I
по признаку А . . . х1% х2, . . ., хп
по признаку В ... у1У у2, уп I
Заметим, что в первой строке индекс I совпадает с порядковым номером объекта, а во второй, вообще говоря, не совпадает. Итак, в общем случае ЩЩЖ Рассмотрим два «крайних случая».
Пусть ранги по признакам А и В совпадают при всех значениях индекса 1:х{ = у{. В 1гом случае ухудшение качества по одному признаку влечет ухудшение качества по другому. Очевидно, признаки связаны: имеет место «полная прямая зависимость».
2. Пусф> ранги по признакам Л и Б противоположны в том смы&1е, что если 9иф то У±**Щ если х2 = 2, то уа = п—1; . ,{Ж еслил;д = п, тог/п=1. В этом случае у худ* шение качества по одному признаку влечет улучшение по другому. Очевидно, признаки связаны — имеет мест «противоположная зависимость».
На практике чаще будет встречаться промежуточный случай, когда ухудшение качества по одному признаку влечет для некоторых объектов ухудшение, а для других—улучшение качества. Задача состоит в том, чтобы
оценить связь между признаками. Для ее решения рас* смотрим ранги х1$ х2, ...,хп как возможные значения случайной величины X, а ух% у29.. ., уп— как возможные
значения случайной величины У. Таким образом, о связи между качественными признаками А и В можно судить по связи между случайными величинами X и К, для оценки которой используем коэффициент корреляции.
Вычислим выборочный коэффициент корреляции случайных величин X и V в условных вариантах (см. гл. XVIII, § 8):
поиоу
приняв в качестве условных вариант отклонения и{ = = Г, Щт1/{—у. Каждому рангу х, соответствует только один ранг у(1 поэтому частота любой гов с одинаковыми индексами, ^ следовательно, и любой пары условиях вариант с одинаковыми индексами равна единице: пи„ = 1. Очевидно, что частота любой пары
вариант с разными индексами равна нулю. Учитывая, [■•кроме того,, что среднее значение отклонения равно нуль (см. гл. XVI, § 7, следствие), т.е. и = а=*0, получим более простую формулу вычисления выборочного коэф фициента корреляции:
' § | г =2>™. (*)
в поиоу
образом, надо найти ^ир,-, оа и оу. Выразим чеРез известные числа — объем выбор-
ки п и разности рангов А; = Х; — у{. Заметим, что поскольку средние значения рангов х = (1 + 2 + ^ . + и у = (1 + 2+ • . . +п)/п равны между собой, то у — х = 0. Используем последнее равенство:
41 = Х;—У( = Х1 — У1 + — *) = (*,— X) — ((/,— у) = II,-
Следовательно,
# = (",— ",)*• Щ^^^ШШ Учитывая, что (см. далее пояснение)
НЩ 2и?«2^-(п*-п)/12^еИИ1м
Приведем свойства выборочного коэффициента корреляции СЙм р мена.
Свойство 1. Если между качественными признаками А и В имеется «полная прямая зависимость* в том смысле, что ранги объектов совпадают при всех значениях I, то выборочный коэффициент ранговой корреляции Спирмена равен единице.
Действительно, подставив д,{ = Х(—у 1 = 0 в (•*»♦), по-Ш&им
I рв=1-
С в о й с т в о 2. Если между качественными признаками и В имеется «противоположная зависимость"» в том смысле, что рангу хх «= 1 соответствует ранг ух — п\ рангу х9 соответствует ранг у, = п — 1; ...; рангу хп = п соответствует ранг ун = 1, то выборочный коэффициент ранговой корреляции Спирмена равен минус единице. Действительно,
' ^=1—/г, а9 = 3 — п, йп = (2л — 1)—п.
Следовательно,
2<*? = (1 — л)2 + (3 — л)3 + ... + [(2/г— 1) — л]3 = = [1' + 3»+...+(2п— I)2] — 2л [1+3 + ...+(2л-1)] + + п • п* = [п (4/г3 — 1 )/3] — 2л ■ п3 + л» = (л8—л)/3.
Подставив 2 йа = (/г3—л)/3 в (**»*), окончательно получим
Рв = — I
Свойство 3. Если между качественными признаками А и В нет ни толпой прямой*, ни «противоположной» зависимостей, то коэффициент рв заключен между — 1 и + 1, причем чем ближе к нулю его абсолютная величина, тем зависимость меньше.
Пример 1. Найти выборочный коэффициент ранговой корреляции Спирмена по данным ранга объектов выборки объема п = 10:
X/ 123456 789 10 У1 6 4 8 I 2 5 10 3 7 9
Решение. Найдем разности рангов с*,-=л',-—у,*; —5,-2,-5 3, 3, 1, —3, б, 2, I.
Вычислим сумму квадратов разностей рангов:
2 4? - 25 + 4 + 85 + 9 + 9 + I + 9 + 95 + 4 + I » 111
Нейдем искомый коэффициент ранговой корреляции, учитывая, что п== 10:
Рв=1 — [б2^/(«'— «)] ' — [6-112/(1000— 10)| ш 0,32.
Замечание. Если выборка содержит объекты с одинаковым качеством, то каждому из них приписывается ранг, рае-ный среднему арифметическому порядковых номеров объектов. Например, если объекты одинакового качества по признаку А имеют порядковые номера 5 и 6, то их ранги соответственно равны: х,= -*(б + 6)/2«=5,5; хвв*5,5.
Приведем правило, позволяющее установить значимость или незначимость ранговой корреляции связи для выборок объема п^9. Если п < 9, -то пользуются таблицами (см., например, табл. 6.10а, 6.106 в книге: Большее Л. Н., Смирнов Н. В. Таблицы математической статистики. М., «Наука», 1965).
Правило. Для того чтобы при уровне значимости а проверить нулевую гипотезу о равенстве нулю генерального коэффициента ранговой корреляции рг Спирмена при конкурирующей гипотезе Я1:рг^0, надо вычислять критическую точку:
К ::Щ Гкр= гкр (о; к) КО—Р.)/(л —2), !*М<«^
где п—объем выборки, рв — выборочный коэффициент ранговой корреляции Спирмена, /кр(а; к)— критическая точка двусторонней критической области, которую находят по таблице критических точек распределения Стьюдента, по уровню значимости а и числу степеней свободы к = л—2.
Если \р„\<Ткр—нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками незначима.
Если |рв| > Гкр — нулевую гипотезу отвергают. Между качественными признаками существует значимая ранговая корреляционная связь.
Пример 2. При уровне значимости 0,05 проверить, является ля ранговая корреляционная связь, вычисленная в примере I, значимой?
Решение. Найдем критическую точку двусторонней критической области распределения Стьюдента по уровню значимости а«0 0$ и числу степеней свободы 6 = п —2= 10 —2 = 8 (см. приложение <Ь* '«р(0,0в; в)-2,31.
Найдем критическую точку:
Г»р-Гвр(в; *)У(1-рЬ/(*-~г).
Подставив *кп = 2,31, л«=10, р,**0,24, получим Г^^ОД Итак, Гкр = 0,79, рв-0,24.
Так как рш < Т*,» —к«т оснований отвергнуть *ул*»ую г**<мгм|; ММГовяя корреляционная связь между признаками Незначимая.