Глава 3. Оценивание тесноты взаимосвязи между признаками
3.1. Непараметрические методы оценки взаимозависимости признаков
Непараметрические показатели связи применимы для измерения сопряженности между варьирующими признаками независимо от их закона распределения. Кроме того, они позволяют измерять тесноту связи между признаками, значения которых можно ранжировать.
коэффициент Фехнера используется для оценки зависимости между двумя количественными признаками. Для каждого признака по выборочным данным вычисляется средняя величина, а затем определяется знак отклонения текущего значения от его среднего значения. Подсчитывается число соответствий знаков у признаков c и
число несоответствий знаков н. Далее вычисляется коэффициент
Фехнера по формуле: КФ с н .
с н
Связь считается достаточно тесной, если KФ 0,3.
Для измерения связей между признаками, значение которых можно упорядочить (ранжировать) по степени проявления ими анализируемых свойств, применяются коэффициенты ранговой корреляции. Рангом называется номер места значения признака в упорядоченном ряду, если все значения признака – различны. Если же какие-либо значения признака встречаются неоднократно, то ранг вычисляется как среднее арифметическое этих номеров мест.
коэффициент ранговой корреляции Спирмена:
n
6 di2
i 1
rC 1 n n2 1 ,
c 7 и
i -ых значений
где n - объем выборки, di - разность между рангами анализируемых признаков.
Пример 1.1. Требуется определить наличие или отсутствие взаимосвязи между накладными расходами по реализации продукции и обеспеченностью товарной продукцией.
Результаты выборочной проверки предприятий отрасли представлены в следующей таблице:
№ |
обеспеченность |
накладные расходы |
предприятия |
товарной продукцией |
по реализации |
|
|
|
1 |
12,0 |
462 |
|
|
|
2 |
18,8 |
939 |
|
|
|
3 |
11,0 |
506 |
|
|
|
4 |
29,0 |
1108 |
|
|
|
5 |
18,8 |
872 |
|
|
|
6 |
23,4 |
765 |
|
|
|
7 |
35,6 |
1368 |
|
|
|
8 |
15,4 |
1002 |
|
|
|
9 |
26,0 |
998 |
|
|
|
10 |
20,7 |
804 |
|
|
|
Решение: Обозначим через X - обеспеченность товарной продукцией, Y - накладные расходы по реализации. Вычислим коэффициент Фехнера. Для этого вычислим сначала средние значения по каждому признаку: x 21,07 и y 882,4. Далее в отдельном столбце находим знаки разностей xi x , в другом столбце – знаки разностей yi y . В
следующем столбце определяются совпадения или несовпадения знаков. В итоге получаем: н 3. Таким образом, значение коэффициента Фехнера: КФ 0,4.
Так как значения данных количественных признаков можно упорядочить, то для определения тесноты связи можно использовать
также коэффициент ранговой корреляции Спирмена. Составим расчѐтную таблицу.
В таблице RX и RY - ранги соответствующих значений признака X
и Y . Под последним столбцом записана сумма квадратов рангов.
X |
Y |
RX |
RY |
di |
di2 |
12,0 |
462 |
2 |
1 |
1 |
1 |
|
|
|
|
|
|
18,8 |
939 |
4,5 |
6 |
-1,5 |
2,25 |
|
|
|
|
|
|
11,0 |
506 |
1 |
2 |
-1 |
1 |
|
|
|
|
|
|
29,0 |
1108 |
9 |
9 |
0 |
0 |
|
|
|
|
|
|
18,8 |
872 |
4,5 |
5 |
-0,5 |
0,25 |
|
|
|
|
|
|
23,4 |
765 |
7 |
3 |
4 |
16 |
|
|
|
|
|
|
35,6 |
1368 |
10 |
10 |
0 |
0 |
|
|
|
|
|
|
15,4 |
1002 |
3 |
8 |
-5 |
25 |
|
|
|
|
|
|
26,0 |
998 |
8 |
7 |
1 |
1 |
|
|
|
|
|
|
20,7 |
804 |
6 |
4 |
2 |
4 |
|
|
|
|
|
|
|
|
|
|
Итого: |
50,5 |
Итак, rC 0,694. Значения выборочных коэффициентов Фехнера и ранговой корреляции Спирмена свидетельствует о достаточно тесной зависимости величины накладных расходов по реализации продукции от обеспеченности товарной продукцией в выборочной совокупности.
■
коэффициент ранговой корреляции Кендала. Расчет данного коэффициента выполняется в следующей последовательности:
1)значения факторного признака X ранжируются;
2)значения результативного признака Y располагаются в порядке, соответствующем значениям X ;
3)для каждого ранга результативного признака определяется количество следующих за ним значений рангов, превышающих его
величину. Суммарная величина P является мерой соответствия последовательности рангов по X и Y ;
4)для каждого ранга Y определяется количество следующих за ним рангов, меньших его величины. Суммарная величина обозначается через
Q ;
5)вычисляем SK P Q , при этом P Q n n 1 / 2;
6)вычисляем коэффициент корреляции Кендала по формуле:
rК 2 SK . n n 1
Как правило, коэффициент Кендала меньше коэффициента Спирмена. При достаточно большом объеме выборочной совокупности n
значения коэффициентов связаны соотношением: rK 23 rC .
Пример 1.2. По данным группы предприятий требуется оценить
зависимость между |
величиной уставного |
капитала X и количеством |
выставленных акций Y . |
|
|
|
|
|
|
|
|
№ |
Уставной капитал, млн. |
Число выставленных |
|
|
предприятия |
руб. |
акций, тыс. шт. |
|
|
|
|
|
|
|
1 |
2954 |
856 |
|
|
|
|
|
|
|
2 |
1603 |
932 |
|
|
|
|
|
|
|
3 |
4102 |
1567 |
|
|
|
|
|
|
|
4 |
2350 |
682 |
|
|
|
|
|
|
|
5 |
2625 |
616 |
|
|
|
|
|
|
|
6 |
1795 |
497 |
|
|
|
|
|
|
|
7 |
2813 |
815 |
|
|
|
|
|
|
|
8 |
1751 |
858 |
|
|
|
|
|
|
|
9 |
1700 |
467 |
|
|
|
|
|
|
|
10 |
2264 |
661 |
|
|
|
|
|
|
Решение: Для вычисления коэффициента составим расчетную таблицу.
|
|
|
|
|
|
ранжирование |
|
|
|
|
|
|
|
X |
|
Y |
|
|
|
|
|
|
P |
|
Q |
|
|
X |
|
RX |
|
Y |
RY |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2954 |
|
856 |
1603 |
|
1 |
|
932 |
9 |
|
1 |
|
8 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1603 |
|
932 |
1700 |
|
2 |
|
467 |
1 |
|
8 |
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4102 |
|
1567 |
1751 |
|
3 |
|
858 |
8 |
|
1 |
|
6 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2350 |
|
682 |
1795 |
|
4 |
|
497 |
2 |
|
6 |
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2625 |
|
616 |
2264 |
|
5 |
|
661 |
4 |
|
4 |
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1795 |
|
497 |
2350 |
|
6 |
|
682 |
5 |
|
3 |
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2813 |
|
815 |
2625 |
|
7 |
|
616 |
3 |
|
3 |
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1751 |
|
858 |
2813 |
|
8 |
|
815 |
6 |
|
2 |
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1700 |
|
467 |
2954 |
|
9 |
|
856 |
7 |
|
1 |
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2264 |
|
661 |
4102 |
|
10 |
|
1567 |
10 |
|
0 |
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Итого |
29 |
|
16 |
|
|
|
|
|
|
|
|
|
|
|
|
|
SK P Q 29-16=13, |
|
|
|
|
|
|
|
|
|
тогда |
значение |
коэффициента |
ранговой |
корреляции |
Кендала равно: |
rK (2•13)/(10•9)=0,29. |
Столь малое |
значение коэффициента свидетельствует о наличии слабой связи между рассматриваемыми роизнаками.
■
|
коэффициент конкордации Кендала: |
rW |
12 SW |
|
, |
|
k2 n3 |
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
2 |
|
|
|
|
|
|
n |
n |
|
Si |
|
|
|
|
|
|
где SW Si |
|
2 |
Si2 |
i 1 |
|
|
|
|
S |
- сумма квадратов отклонений |
|
|
|
|
|
i 1 |
i 1 |
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
k |
|
сумм рангов наблюдений от их |
общего среднего ранга, Si Rij , Rij |
|
|
|
|
|
|
|
|
|
|
|
|
|
j 1 |
|
- ранг i -го наблюдения по j -ому признаку, |
k - число признаков ( k >2). |
Коэффициент конкордации рангов Кендала используют тогда, когда
необходимо установить статистическую связь между несколькими признаками, значения которых можно ранжировать. С помощью этого коэффициента принято оценивать согласованность мнений группы экспертов.
Пример 1.3. Определить тесноту взаимосвязи между признаками, значения которых представлены в таблице.
|
Индивидуальные оценки экспертов коммуникабельности |
претенденты |
|
претендентов |
|
|
|
|
|
|
1 эксперт |
2 эксперт |
3 эксперт |
|
|
|
|
Иванов |
0,198 |
0,204 |
0,184 |
|
|
|
|
Петров |
0,119 |
0,098 |
0,125 |
|
|
|
|
Сидоров |
0,211 |
0,234 |
0,198 |
|
|
|
|
Лялькин |
0,176 |
0,196 |
0,202 |
|
|
|
|
Валькин |
0,208 |
0,231 |
0,219 |
|
|
|
|
Кузьмин |
0,165 |
0,174 |
0,186 |
|
|
|
|
Брекоткин |
0,335 |
0,402 |
0,373 |
|
|
|
|
Мухин |
0,105 |
0,143 |
0,124 |
|
|
|
|
Бабкин |
0,112 |
0,132 |
0,109 |
|
|
|
|
Шуртиков |
0,241 |
0,262 |
0,275 |
|
|
|
|
Решение: Проранжируем оценки экспертов для каждого претендента, промежуточные и итоговые расчеты оформим в таблице.
10 |
|
|
10 |
|
S 3421-165•165/10=3421-2722.5=698.5 |
S |
i |
165, |
S2 |
3421, |
|
|
i |
|
W |
i 1 |
|
|
i 1 |
|
|
Тогда значение коэффициента конкордации Кендала равно: rW 0,9407.
Полученное значение свидетельствует о высокой степени согласованности мнений экспертов.
претенденты |
R1 |
R2 |
R3 |
Si |
Si2 |
|
|
|
|
|
|
Иванов |
6 |
6 |
4 |
16 |
256 |
|
|
|
|
|
|
Петров |
3 |
1 |
3 |
7 |
49 |
|
|
|
|
|
|
Сидоров |
8 |
8 |
6 |
22 |
484 |
|
|
|
|
|
|
Лялькин |
5 |
5 |
7 |
17 |
289 |
|
|
|
|
|
|
Валькин |
7 |
7 |
8 |
22 |
484 |
|
|
|
|
|
|
Кузьмин |
4 |
4 |
5 |
13 |
169 |
|
|
|
|
|
|
Брекоткин |
10 |
10 |
10 |
30 |
900 |
|
|
|
|
|
|
Мухин |
1 |
3 |
2 |
6 |
36 |
|
|
|
|
|
|
Бабкин |
2 |
2 |
1 |
5 |
25 |
|
|
|
|
|
|
Шуртиков |
9 |
9 |
9 |
27 |
729 |
|
|
|
|
|
|
|
|
|
Итого |
165 |
3421 |
|
|
|
|
|
|
■
Задачи для самостоятельного решения
1.1 Определите силу взаимосвязи между признаками X и Y с помощью коэффициента ранговой корреляции Спирмена ( α =0,05):
№завода |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Уровень |
|
|
|
|
|
|
|
|
|
|
механизации, X ,% |
62 |
60 |
64 |
69 |
67 |
61 |
63 |
66 |
65 |
68 |
Трудоемкость |
|
|
|
|
|
|
|
|
|
|
единицы |
13 |
14 |
14 |
7 |
13 |
12 |
15 |
10 |
12 |
8 |
продукции,Y , млн. |
|
|
|
|
|
|
|
|
|
|
1.2 По данным итогов торгов (см. таблицу) на биржевом рынке с 06.03.9*
— 12.03.9* определите степень зависимости средней цены сделки от номинальной стоимости акции с помощью коэффициентов ранговой корреляции Спирмена и Кендала (α =0,05):
|
№ п/п |
Эмитент |
Номинал, тыс. |
Средняя цена сделки, тыс. |
|
руб. X |
руб. Y |
|
|
|
|
1 |
Средневолжский КБ |
1,0 |
2,0 |
|
2 |
«Кубань банк» |
1,0 |
6,0 |
|
3 |
«Автогаз банк» |
1,0 |
4,0 |
|
4 |
АКБ «АвтоВаз банк» |
1,0 |
4,0 |
|
5 |
«Алмазы Якутии» |
2,5 |
7,8 |
|
6 |
ТНК «Гермес-Союз» |
10,0 |
16,0 |
|
7 |
«Олби-Дипломат» |
10,0 |
11,0 |
|
8 |
Сиб. торговый банк |
5,0 |
18,0 |
|
9 |
«AVVA» |
10,0 |
16,4 |
|
10 |
АО «МММ» |
1,0 |
5,7 |
1.3 По следующим данным (см. таблицу) о прибыли (Y ,млн. руб.), затратах на 1 рубль произведенной продукции ( X , руб.), стоимости основных производственных фондов ( Z , млн. руб.) определите тесноту связи между признаками (α =0,05):
Y |
221 |
1070 |
1001 |
606 |
779 |
789 |
Z |
96 |
77 |
78 |
89 |
82 |
81 |
X |
4,3 |
5,9 |
6,0 |
3,9 |
4,6 |
4,9 |
3.2. Параметрические методы оценки взаимосвязи
коэффициент ассоциации Юла применяется для оценки тесноты взаимосвязи между двумя качественными признаками, каждый из которых принимает только два возможных значения. Для его расчѐта составляется таблица «тетрахорических показателей»:
|
X |
Y |
да |
|
нет |
|
|
|
|
|
|
|
|
|
да |
|
a |
|
b |
|
|
|
|
|
|
|
|
|
нет |
|
c |
|
d |
|
Числа a, |
|
|
|
|
|
|
b, c, d 5 |
представляют |
частоты появлений определенных |
значений признаков. Коэффициент ассоциации вычисляется по формуле:
Kac. ad bc . ad bc
Связь считается достаточно тесной, если Kac. 0,5. Однако, если одна из частот a , b, c или d равна нулю, то Kac. 1, что может не
соответствовать действительности. В таких случаях тесноту взаимосвязи оценивают с помощью следующего коэффициента.
коэффициент контингенции Пирсона:
Kkont |
|
|
ad bc |
|
|
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
a b |
|
b d |
|
|
c d |
a c |
|
|
Связь считается достаточно тесной, если |
|
Kkont |
|
0,3. |
|
|
|
|
|
|
|
|
Для качественных признаков, состоящих более чем из двух групп, тесноту взаимосвязи определяют с помощью коэффициентов взаимной сопряженности:
коэффициент взаимной сопряженности Пирсона:
K П |
|
φ2 |
, |
|
|
|
|
φ2 |
|
|
|
1 |
|
|
|
|
где φ2 - показатель взаимной сопряженности: 1 φ2 |
|
n2xy |
, |
|
|
|
|
|
i , j nx n y |
|
nxy , nx , ny - частоты совместного появления значений признаков и
каждого в отдельности;
коэффициент взаимной сопряженности Чупрова:
где k1 и k2 - число значений (групп) соответственно у первого и второго признаков.
Задачи для самостоятельного решения
2.1 По следующим данным о распределении строительных фирм по уровню рентабельности R (в %) и удельному весу активной части основных фондов d (в %) рассчитайте коэффициенты взаимной сопряженности Пирсона и Чупрова:
d |
|
|
|
R |
высокий |
средний |
низкий |
|
|
|
|
высокий |
6 |
10 |
25 |
|
|
|
|
средний |
19 |
30 |
20 |
|
|
|
|
низкий |
35 |
10 |
5 |
|
|
|
|
2.2 По данным о распределении числа погибших и раненых в зависимости от причины наезда рассчитайте показатели взаимосвязи:
причина наезда |
погибло |
ранено |
|
|
|
вина водителей |
26807 |
146685 |
|
|
|
вина пешеходов |
6451 |
40293 |
|
|
|
2.3 Вычислите коэффициент взаимной сопряженности Чупрова по распределению некоторых преступлений в регионе и их раскрываемости
|
|
виды преступлений |
|
раскрыты |
не раскрыты |
|
|
|
|
|
|
|
|
|
|
|
|
разбой |
|
110 |
40 |
|
|
|
|
|
|
|
|
|
|
|
|
мошенничество |
|
180 |
65 |
|
|
|
|
|
|
|
|
|
|
|
|
умышленное |
|
50 |
25 |
|
|
|
|
убийство |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
поджог |
|
10 |
20 |
|
|
|
|
|
|
|
|
|
|
2.4 В |
таблице представлены |
результаты |
обследования |
состояния |
гланд |
у 265 учащихся младших классов. |
Рассчитайте |
показатели |
взаимосвязи.