Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Rybleva_teoria veroatnosti_2014

.pdf
Скачиваний:
113
Добавлен:
23.03.2016
Размер:
5.58 Mб
Скачать

Глава 3. Оценивание тесноты взаимосвязи между признаками

3.1. Непараметрические методы оценки взаимозависимости признаков

Непараметрические показатели связи применимы для измерения сопряженности между варьирующими признаками независимо от их закона распределения. Кроме того, они позволяют измерять тесноту связи между признаками, значения которых можно ранжировать.

коэффициент Фехнера используется для оценки зависимости между двумя количественными признаками. Для каждого признака по выборочным данным вычисляется средняя величина, а затем определяется знак отклонения текущего значения от его среднего значения. Подсчитывается число соответствий знаков у признаков c и

число несоответствий знаков н. Далее вычисляется коэффициент

Фехнера по формуле: КФ с н .

с н

Связь считается достаточно тесной, если KФ 0,3.

Для измерения связей между признаками, значение которых можно упорядочить (ранжировать) по степени проявления ими анализируемых свойств, применяются коэффициенты ранговой корреляции. Рангом называется номер места значения признака в упорядоченном ряду, если все значения признака – различны. Если же какие-либо значения признака встречаются неоднократно, то ранг вычисляется как среднее арифметическое этих номеров мест.

коэффициент ранговой корреляции Спирмена:

n

6 di2

i 1

rC 1 n n2 1 ,

191

c 7 и
i -ых значений

где n - объем выборки, di - разность между рангами анализируемых признаков.

Пример 1.1. Требуется определить наличие или отсутствие взаимосвязи между накладными расходами по реализации продукции и обеспеченностью товарной продукцией.

Результаты выборочной проверки предприятий отрасли представлены в следующей таблице:

обеспеченность

накладные расходы

предприятия

товарной продукцией

по реализации

 

 

 

1

12,0

462

 

 

 

2

18,8

939

 

 

 

3

11,0

506

 

 

 

4

29,0

1108

 

 

 

5

18,8

872

 

 

 

6

23,4

765

 

 

 

7

35,6

1368

 

 

 

8

15,4

1002

 

 

 

9

26,0

998

 

 

 

10

20,7

804

 

 

 

Решение: Обозначим через X - обеспеченность товарной продукцией, Y - накладные расходы по реализации. Вычислим коэффициент Фехнера. Для этого вычислим сначала средние значения по каждому признаку: x 21,07 и y 882,4. Далее в отдельном столбце находим знаки разностей xi x , в другом столбце – знаки разностей yi y . В

следующем столбце определяются совпадения или несовпадения знаков. В итоге получаем: н 3. Таким образом, значение коэффициента Фехнера: КФ 0,4.

Так как значения данных количественных признаков можно упорядочить, то для определения тесноты связи можно использовать

192

также коэффициент ранговой корреляции Спирмена. Составим расчѐтную таблицу.

В таблице RX и RY - ранги соответствующих значений признака X

и Y . Под последним столбцом записана сумма квадратов рангов.

X

Y

RX

RY

di

di2

12,0

462

2

1

1

1

 

 

 

 

 

 

18,8

939

4,5

6

-1,5

2,25

 

 

 

 

 

 

11,0

506

1

2

-1

1

 

 

 

 

 

 

29,0

1108

9

9

0

0

 

 

 

 

 

 

18,8

872

4,5

5

-0,5

0,25

 

 

 

 

 

 

23,4

765

7

3

4

16

 

 

 

 

 

 

35,6

1368

10

10

0

0

 

 

 

 

 

 

15,4

1002

3

8

-5

25

 

 

 

 

 

 

26,0

998

8

7

1

1

 

 

 

 

 

 

20,7

804

6

4

2

4

 

 

 

 

 

 

 

 

 

 

Итого:

50,5

Итак, rC 0,694. Значения выборочных коэффициентов Фехнера и ранговой корреляции Спирмена свидетельствует о достаточно тесной зависимости величины накладных расходов по реализации продукции от обеспеченности товарной продукцией в выборочной совокупности.

коэффициент ранговой корреляции Кендала. Расчет данного коэффициента выполняется в следующей последовательности:

1)значения факторного признака X ранжируются;

2)значения результативного признака Y располагаются в порядке, соответствующем значениям X ;

3)для каждого ранга результативного признака определяется количество следующих за ним значений рангов, превышающих его

193

величину. Суммарная величина P является мерой соответствия последовательности рангов по X и Y ;

4)для каждого ранга Y определяется количество следующих за ним рангов, меньших его величины. Суммарная величина обозначается через

Q ;

5)вычисляем SK P Q , при этом P Q n n 1 / 2;

6)вычисляем коэффициент корреляции Кендала по формуле:

rК 2 SK . n n 1

Как правило, коэффициент Кендала меньше коэффициента Спирмена. При достаточно большом объеме выборочной совокупности n

значения коэффициентов связаны соотношением: rK 23 rC .

Пример 1.2. По данным группы предприятий требуется оценить

зависимость между

величиной уставного

капитала X и количеством

выставленных акций Y .

 

 

 

 

 

 

 

 

Уставной капитал, млн.

Число выставленных

 

 

предприятия

руб.

акций, тыс. шт.

 

 

 

 

 

 

 

1

2954

856

 

 

 

 

 

 

 

2

1603

932

 

 

 

 

 

 

 

3

4102

1567

 

 

 

 

 

 

 

4

2350

682

 

 

 

 

 

 

 

5

2625

616

 

 

 

 

 

 

 

6

1795

497

 

 

 

 

 

 

 

7

2813

815

 

 

 

 

 

 

 

8

1751

858

 

 

 

 

 

 

 

9

1700

467

 

 

 

 

 

 

 

10

2264

661

 

 

 

 

 

 

Решение: Для вычисления коэффициента составим расчетную таблицу.

194

 

 

 

 

 

 

ранжирование

 

 

 

 

 

 

 

X

 

Y

 

 

 

 

 

 

P

 

Q

 

 

X

 

RX

 

Y

RY

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2954

 

856

1603

 

1

 

932

9

 

1

 

8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1603

 

932

1700

 

2

 

467

1

 

8

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4102

 

1567

1751

 

3

 

858

8

 

1

 

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2350

 

682

1795

 

4

 

497

2

 

6

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2625

 

616

2264

 

5

 

661

4

 

4

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1795

 

497

2350

 

6

 

682

5

 

3

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2813

 

815

2625

 

7

 

616

3

 

3

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1751

 

858

2813

 

8

 

815

6

 

2

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1700

 

467

2954

 

9

 

856

7

 

1

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2264

 

661

4102

 

10

 

1567

10

 

0

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Итого

29

 

16

 

 

 

 

 

 

 

 

 

 

 

 

 

SK P Q 29-16=13,

 

 

 

 

 

 

 

 

 

тогда

значение

коэффициента

ранговой

корреляции

Кендала равно:

rK (213)/(109)=0,29.

Столь малое

значение коэффициента свидетельствует о наличии слабой связи между рассматриваемыми роизнаками.

коэффициент конкордации Кендала:

rW

12 SW

 

,

k2 n3

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

2

 

 

 

 

 

n

n

 

Si

 

 

 

 

 

где SW Si

 

2

Si2

i 1

 

 

 

S

- сумма квадратов отклонений

 

 

 

i 1

i 1

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

сумм рангов наблюдений от их

общего среднего ранга, Si Rij , Rij

 

 

 

 

 

 

 

 

 

 

 

 

j 1

- ранг i -го наблюдения по j -ому признаку,

k - число признаков ( k >2).

Коэффициент конкордации рангов Кендала используют тогда, когда

195

необходимо установить статистическую связь между несколькими признаками, значения которых можно ранжировать. С помощью этого коэффициента принято оценивать согласованность мнений группы экспертов.

Пример 1.3. Определить тесноту взаимосвязи между признаками, значения которых представлены в таблице.

 

Индивидуальные оценки экспертов коммуникабельности

претенденты

 

претендентов

 

 

 

 

 

 

1 эксперт

2 эксперт

3 эксперт

 

 

 

 

Иванов

0,198

0,204

0,184

 

 

 

 

Петров

0,119

0,098

0,125

 

 

 

 

Сидоров

0,211

0,234

0,198

 

 

 

 

Лялькин

0,176

0,196

0,202

 

 

 

 

Валькин

0,208

0,231

0,219

 

 

 

 

Кузьмин

0,165

0,174

0,186

 

 

 

 

Брекоткин

0,335

0,402

0,373

 

 

 

 

Мухин

0,105

0,143

0,124

 

 

 

 

Бабкин

0,112

0,132

0,109

 

 

 

 

Шуртиков

0,241

0,262

0,275

 

 

 

 

Решение: Проранжируем оценки экспертов для каждого претендента, промежуточные и итоговые расчеты оформим в таблице.

10

 

 

10

 

S 3421-165•165/10=3421-2722.5=698.5

S

i

165,

S2

3421,

 

 

i

 

W

i 1

 

 

i 1

 

 

Тогда значение коэффициента конкордации Кендала равно: rW 0,9407.

Полученное значение свидетельствует о высокой степени согласованности мнений экспертов.

196

претенденты

R1

R2

R3

Si

Si2

 

 

 

 

 

 

Иванов

6

6

4

16

256

 

 

 

 

 

 

Петров

3

1

3

7

49

 

 

 

 

 

 

Сидоров

8

8

6

22

484

 

 

 

 

 

 

Лялькин

5

5

7

17

289

 

 

 

 

 

 

Валькин

7

7

8

22

484

 

 

 

 

 

 

Кузьмин

4

4

5

13

169

 

 

 

 

 

 

Брекоткин

10

10

10

30

900

 

 

 

 

 

 

Мухин

1

3

2

6

36

 

 

 

 

 

 

Бабкин

2

2

1

5

25

 

 

 

 

 

 

Шуртиков

9

9

9

27

729

 

 

 

 

 

 

 

 

 

Итого

165

3421

 

 

 

 

 

 

Задачи для самостоятельного решения

1.1 Определите силу взаимосвязи между признаками X и Y с помощью коэффициента ранговой корреляции Спирмена ( α =0,05):

№завода

1

2

3

4

5

6

7

8

9

10

Уровень

 

 

 

 

 

 

 

 

 

 

механизации, X ,%

62

60

64

69

67

61

63

66

65

68

Трудоемкость

 

 

 

 

 

 

 

 

 

 

единицы

13

14

14

7

13

12

15

10

12

8

продукции,Y , млн.

 

 

 

 

 

 

 

 

 

 

1.2 По данным итогов торгов (см. таблицу) на биржевом рынке с 06.03.9*

— 12.03.9* определите степень зависимости средней цены сделки от номинальной стоимости акции с помощью коэффициентов ранговой корреляции Спирмена и Кендала (α =0,05):

197

№ п/п

Эмитент

Номинал, тыс.

Средняя цена сделки, тыс.

руб. X

руб. Y

 

 

1

Средневолжский КБ

1,0

2,0

2

«Кубань банк»

1,0

6,0

3

«Автогаз банк»

1,0

4,0

4

АКБ «АвтоВаз банк»

1,0

4,0

5

«Алмазы Якутии»

2,5

7,8

6

ТНК «Гермес-Союз»

10,0

16,0

7

«Олби-Дипломат»

10,0

11,0

8

Сиб. торговый банк

5,0

18,0

9

«AVVA»

10,0

16,4

10

АО «МММ»

1,0

5,7

1.3 По следующим данным (см. таблицу) о прибыли (Y ,млн. руб.), затратах на 1 рубль произведенной продукции ( X , руб.), стоимости основных производственных фондов ( Z , млн. руб.) определите тесноту связи между признаками (α =0,05):

Y

221

1070

1001

606

779

789

Z

96

77

78

89

82

81

X

4,3

5,9

6,0

3,9

4,6

4,9

3.2. Параметрические методы оценки взаимосвязи

коэффициент ассоциации Юла применяется для оценки тесноты взаимосвязи между двумя качественными признаками, каждый из которых принимает только два возможных значения. Для его расчѐта составляется таблица «тетрахорических показателей»:

 

X

Y

да

 

нет

 

 

 

 

 

 

 

 

 

да

 

a

 

b

 

 

 

 

 

 

 

 

 

нет

 

c

 

d

 

Числа a,

 

 

 

 

 

 

b, c, d 5

представляют

частоты появлений определенных

значений признаков. Коэффициент ассоциации вычисляется по формуле:

Kac. ad bc . ad bc

198

Связь считается достаточно тесной, если Kac. 0,5. Однако, если одна из частот a , b, c или d равна нулю, то Kac. 1, что может не

соответствовать действительности. В таких случаях тесноту взаимосвязи оценивают с помощью следующего коэффициента.

коэффициент контингенции Пирсона:

Kkont

 

 

ad bc

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a b

 

b d

 

 

c d

a c

 

 

Связь считается достаточно тесной, если

 

Kkont

 

0,3.

 

 

 

 

 

 

 

 

Для качественных признаков, состоящих более чем из двух групп, тесноту взаимосвязи определяют с помощью коэффициентов взаимной сопряженности:

коэффициент взаимной сопряженности Пирсона:

K П

 

φ2

,

 

 

 

 

φ2

 

 

 

1

 

 

 

 

где φ2 - показатель взаимной сопряженности: 1 φ2

 

n2xy

,

 

 

 

 

 

i , j nx n y

 

nxy , nx , ny - частоты совместного появления значений признаков и

каждого в отдельности;

коэффициент взаимной сопряженности Чупрова:

KЧ

 

φ2

 

,

k1

1 k2

1

 

 

где k1 и k2 - число значений (групп) соответственно у первого и второго признаков.

199

Задачи для самостоятельного решения

2.1 По следующим данным о распределении строительных фирм по уровню рентабельности R (в %) и удельному весу активной части основных фондов d (в %) рассчитайте коэффициенты взаимной сопряженности Пирсона и Чупрова:

d

 

 

 

R

высокий

средний

низкий

 

 

 

 

высокий

6

10

25

 

 

 

 

средний

19

30

20

 

 

 

 

низкий

35

10

5

 

 

 

 

2.2 По данным о распределении числа погибших и раненых в зависимости от причины наезда рассчитайте показатели взаимосвязи:

причина наезда

погибло

ранено

 

 

 

вина водителей

26807

146685

 

 

 

вина пешеходов

6451

40293

 

 

 

2.3 Вычислите коэффициент взаимной сопряженности Чупрова по распределению некоторых преступлений в регионе и их раскрываемости

 

 

виды преступлений

 

раскрыты

не раскрыты

 

 

 

 

 

 

 

 

 

 

 

 

разбой

 

110

40

 

 

 

 

 

 

 

 

 

 

 

 

мошенничество

 

180

65

 

 

 

 

 

 

 

 

 

 

 

 

умышленное

 

50

25

 

 

 

 

убийство

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

поджог

 

10

20

 

 

 

 

 

 

 

 

 

 

2.4 В

таблице представлены

результаты

обследования

состояния

гланд

у 265 учащихся младших классов.

Рассчитайте

показатели

взаимосвязи.

200

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]