Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Кластерный анализ

.pdf
Скачиваний:
19
Добавлен:
21.05.2015
Размер:
593.73 Кб
Скачать

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

-1-

-2-

 

 

-3-

-4-

 

 

-5-

 

 

 

-6-

 

-7-

 

-8-

 

 

-9-

 

3

1,0000

 

0,8770

0,0908

 

0,2391

 

 

1

 

0,6957

 

0,3806

 

0,3012

 

4

0,0142

 

0,4859

0,0245

 

0,3662

 

0,1078

 

0

 

 

0

 

0,2000

 

5

0,0360

 

0,1390

0,0436

 

0,0835

 

0,0656

 

0,0533

 

0,0555

 

0,2124

 

6

0,0495

 

0,2149

0,0145

 

0,0085

 

0,4553

 

0,0869

 

0,0901

 

0,1458

 

7

0,0179

 

0,1238

0,0323

 

0,0043

 

0,1127

 

0,0243

 

0,0315

 

0,2002

 

8

0,0261

 

0,4593

0,0206

 

0,0002

 

0,6519

 

0,0165

 

0,0222

 

0

 

9

 

0

 

0

0

 

0,0002

 

 

0

 

0,0051

 

0,0006

 

0,1584

 

10

0,0494

 

0,0384

0,0317

 

0,0936

 

0,0329

 

0,0346

 

0,0332

 

0,1910

 

11

0,1123

 

0,7728

0,0323

 

 

1

 

0,8968

 

0,2449

 

0,2639

 

0,3835

 

12

0,0286

 

0,3761

0,1302

 

 

0

 

0,1011

 

0,1378

 

0,1202

 

0,3772

 

3. Вычисл ен ие м а трицы вза им н ыхра сстоян ий по ф орм у л а м (2.9)–(2.11)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

3

 

 

4

 

5

 

6

 

7

 

8

 

9

10

11

 

12

1

0

1,2618

1,3517

 

2,3544

 

2,4224

 

2,2946

2,4583

 

2,3142

2,5975

2,4928

1,9136

 

2,2051

2

1,2618

0

1,1421

 

1,4497

 

1,4715

 

1,3397

1,4935

 

1,4121

1,6398

1,5558

1,3183

 

1,2132

3

1,3517

1,1421

0

 

1,6064

 

1,7028

 

1,4754

1,7206

 

1,4095

1,8644

1,7710

1,2711

 

1,5640

4

2,3544

1,4497

1,6064

 

0

 

0,4571

 

0,5849

0,5135

 

0,6868

0,6198

0,5327

1,1311

 

0,4716

5

2,4224

1,4715

1,7028

 

0,4571

 

0

 

0,4135

0,1037

 

0,7081

0,2050

0,1136

1,4310

 

0,3325

6

2,2946

1,3397

1,4754

 

0,5849

 

0,4135

 

0

0,3705

 

0,3604

0,5206

0,4744

1,2670

 

0,4715

7

2,4583

1,4935

1,7206

 

0,5135

 

0,1037

 

0,3705

 

0

 

0,6661

0,1802

0,1511

1,4740

 

0,3544

8

2,3142

1,4121

1,4095

 

0,6868

 

0,7081

 

0,3604

0,6661

 

0

0,8140

0,7788

1,1929

 

0,6992

9

2,5975

1,6398

1,8644

 

0,6198

 

0,2050

 

0,5206

0,1802

 

0,8140

0

0,1332

1,6100

 

0,4993

10

2,4928

1,5558

1,7710

 

0,5327

 

0,1136

 

0,4744

0,1511

 

0,7788

0,1332

0

1,4985

 

0,4365

11

1,9136

1,3183

1,2711

 

1,1311

 

1,4310

 

1,2670

1,4740

 

1,1929

1,6100

1,4985

0

 

1,3562

12

2,2051

1,2132

1,5640

 

0,4716

 

0,3325

 

0,4715

0,3544

 

0,6992

0,4993

0,4365

1,3562

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4. Ф орм ирова н ие вектор-строк ра сстоян ий м еж д у т еку щ им ф ра гм ен том д ерева и оста л ь н ым и объекта м и по ф орм у л а м (2.12)–(2.14). О ф орм л ен ие резу л ь т а тов ра счетов в вид е т а бл . 2.2.3.

 

 

 

 

 

 

 

 

 

 

 

 

Табли ца 2.2.3

 

Ра сст ояния ме ж

ду т е к ущ имиф рагме нт а миде ре ва

 

 

 

 

 

 

иост

 

авш имися объе к т ами

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

М ин .

 

 

 

 

 

 

П ред приятия

 

 

 

 

М ин .

ра сст оян ие

1

2

3

4

 

5

6

7

8

9

10

11

12

ра с-

меж д у :

 

ст оян ие

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

3

4

5

 

6

7

8

9

10

11

12

13

14

1 и всем и

0

1,26

1,35

2,35

 

2,42

2,29

2,46

2,31

2,60

2,49

1,91

2,21

1,26

ост а л ь н ым и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 и 2

0

0

1,14

1,45

 

1,47

1,34

1,49

1,41

1,64

1,56

1,32

1,21

1,14

1, 2 и 3

0

0

0

1,45

 

1,47

1,34

1,49

1,41

1,64

1,56

1,27

1,21

1,21

1, 2, 3 и 12

0

0

0

0,47

 

0,33

0,47

0,35

0,70

0,50

0,44

1,27

0

0,33

1, 2 , 3, 12 и

0

0

0

0,46

 

0

0,41

0,10

0,70

0,20

0,11

1,27

0

0,10

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1, 2, 3, 12, 5

0

0

0

0,46

 

0

0,37

0

0,67

0,18

0,11

1,27

0

0,11

и 7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

3

4

5

6

7

8

9

10

11

12

13

14

1, 2, 3, 12, 5,

0

0

0

0,46

0

0,37

0

0,67

0,13

0

1,27

0

0,13

7 и 10

 

 

 

 

 

 

 

 

 

 

 

 

 

1, 2, 3, 12, 5,

0

0

0

0,46

0

0,37

0

0,67

0

0

1,27

0

0,37

7, 10, и 9

 

 

 

 

 

 

 

 

 

 

 

 

 

1, 2, 3, 12, 5,

0

0

0

0,46

0

0

0

0,36

0

0

1,27

0

0,36

7, 10, 9 и 6

 

 

 

 

 

 

 

 

 

 

 

 

 

1, 2, 3, 12, 5,

0

0

0

0,46

0

0

0

0

0

0

1,19

0

0,46

7, 10, 9, 6 и 8

 

 

 

 

 

 

 

 

 

 

 

 

 

1, 2,3, 12, 5,

0

0

0

0

0

0

0

0

0

0

1,13

0

1,13

7, 10, 9, 6, 8

и 4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5. П остроен ие д ерева кра тча йшихра сстоян ий

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

П ред -

1

2

3

12

5

7

10

 

9

6

 

8

 

4

11

приятие

 

 

 

Ра с-

0

1,261

1,142

1,213

0,332

0,103

0,113

 

0,133

0,37

0,36

 

0,457

1,131

ст оян ие

 

 

П остроен н ое д ерево ра сстоян ий позвол яет

сд ел а ть

вывод

 

о том , что

ра ссм а трива ем у ю совоку пн ость пред приятий м ож н о ра зд ел ить

н а д ве гру п-

пы. П ерву ю гру ппы сост а вл яют 1, 2, 3 и 11

пред приятие, а ост а л ь н ые –д ру -

гу ю. Бол ее гл у бокий а н а л из пока за т ел ей ф ин а н сового состоян ия пред при-

ят ий свид етел ь ству ет о цел есообра зн ости

пред оста вл ен ия кред ит а первой

гру ппе пред приятий.

 

3.2.2.2. Решен и е с пом ощью STATISTICA

 

1. Скопирова т ь изMS Excel д а н н ые т а бл. 2.2.2 в ф а йл

STATISTICA.

2. О ткрыть м ен ю «С тати сти к а» (Statistics), в н ем

выбра ть «М но го -

мерны й и сследо вательск и е мето ды » (Multidimensional research methods), д а л ее –«А нали з к ластера»(Cluster analysis).

3. В открывшем ся окн е (см . рис. 2.1) выбра т ь в ка честве м етод ы кл а -

ст ериза ции древо ви дную к ластери заци ю (Joining (tree clustering)).

В ыбра н н ое м ен ю объед ин яет иера рхические а гл ом ера т ивн ые м етод ы, н а зн а чен ие которых состоит в кл а ссиф ика ции объектов в кл а стеры н а осн о- ве м еры сход ства ил и ра сстоян ия. Резу л ь та том та кой кл а ст ериза ции явл яется иера рхическое д ерево (д ен д рогра м м а ).

Д иа л оговое окн о эт ого м ет од а изобра ж ен о н а рис. 2.2.

Ри с. 2.1. Стартоваяпан ельмодуляКласт е рный анализ

Ри с. 2.2. Ди алоговое окн о и ерархи чески х аглом ерати вн ы х м етодов

Ч то ка са ет ся д ву х д ру гих м етод ов, за м етим , что м етод

К -средни х (K-

means clustering) прим ен яет ся, есл и пол ь зова т ел ь у ж е им еет

пред ст а вл ен ие

отн осит ел ь н о числ а кл а ст еров, н а

кот орые н еобход имо ра збить

н а бл юд е-

н ия. Т огд а м етод строит ровн о К

ра зл ичн ых кл а стеров, ра спол ож

ен н ых н а

возм ож н о бол ь ших ра сстоян иях д ру г от д ру га . Ид ея м ет од а Двух вх о до во го о бъ еди нени я (Two-way joining) состоит в том , чтобы од н оврем ен н о кл а с- сиф ицирова ть ка к н а бл юд ен ия, та к и перем ен н ые.

4. Щ ел кн у в по кн опке П еременны е, выбра т ь все н орм ирова н н ые пока - за тел и, ха ра кт еризу ющ ие д еятел ь н ость пред приятий.

5. В ка честве К ластера (Cluster) выбра ть Н а бл юд ен ия (строки) (Cases). 6. В строке П рави ло о бъ еди нени я (свя зи ) (Amalgamation (linkage) rule) выбра ть М ето до ди но чно й свя зи (Single Linkage), который в отечест-

вен н ой л итера т у ре бол ь шое известен под

н а зва н ием «прин цип бл иж а йш его

сосед а ». В этом

м етод е за ра сстоян ие м еж

д у кл а ст ера м и прин им а ется ра с-

ст оян ие м еж д у

их бл иж

а йшим и эл ем ен т а м и. П ра вил о связи строит вол ок-

н истые кл а стеры, т.е.

кл а ст еры, сцепл ен н ые вм ест е тол ь ко отд ел ь н ым и

объект а м и, сл у ча йн о ока за вш им ися бл иж е оста л ь н ых д ру г к д ру гу . Резу л ь - тиру ющ ие кл а стеры им еют тен д ен цию быть пред ст а вл ен н ым и д л ин н ым и цепочка м и.

7. В окн е М ера рассто я ни я (Distance measure) выбра т ь Е вкл ид ово ра с-

ст оян ие (Eucliden distances).

8. Н а ж а т ь кн опку О К . В резу л ь та те появит ся окн о (см . рис. 2.3).

9. В ыбра т ь опцию В ерти к альная древо ви дная ди аграмма

(Vertical

icicle plot). В резу л ь та те появит ся д ен д рогра м м а , изобра ж ен н а я н а

рис. 2.4.

10. Щ

ел кн у в

по кн опке С х ема о бъ еди нени я (Amalgamation schedule),

пол у чить

та бл ицу

резу л ь т а т ов со схем ой объед ин ен ия (см . т а бл. 2.2.4), ка ж -

д а я строка которой пока зыва ет соста в кл а ст ера н а соот ветству ющ ем ш а ге кл а ссиф ика ции

Ри с. 2.3. Результаты и ерархи ческой аглом ерати вн ой процедуры кластери заци и

Linkage Distance

Tree Diagram for 12 Cases

1,4

1,2

1,0

0,8

0,6

0,4

0,2

0,0 C_11 C_8 C_6 C_12 C_9 C_10 C_7 C_5 C_4 C_3 C_2 C_1

 

 

Ри с. 2.4. Верти кальн аяден дрограм м а объеди н ен и я

Табли ца 2.2.4

 

 

 

 

 

 

Схе ма объе дине ния

 

 

 

 

 

 

 

 

 

 

 

 

 

linkage

Amalgamation Schedule (Spreadsheet1)

 

 

 

 

 

 

 

 

Single Linkage

 

 

 

 

 

 

 

 

 

 

 

distance

Euclidean distances

 

 

 

 

 

 

 

 

 

 

 

1

2

 

3

4

5

6

7

8

9

10

 

11

12

0,1036

C_5

C_7

 

 

 

 

 

 

 

 

 

 

 

 

0,1136

C_5

C_7

 

C_10

 

 

 

 

 

 

 

 

 

 

0,1331

C_5

C_7

 

C_10

C_9

 

 

 

 

 

 

 

 

 

0,3324

C_5

C_7

 

C_10

C_9

C_12

 

 

 

 

 

 

 

 

0,3603

C_6

C_8

 

 

 

 

 

 

 

 

 

 

 

 

0,3705

C_5

C_7

 

C_10

C_9

C_12

C_6

C_8

 

 

 

 

 

 

0,4570

C_4

C_5

 

C_7

C_10

C_9

C_12

C_6

C_8

 

 

 

 

 

1,1311

C_4

C_5

 

C_7

C_10

C_9

C_12

C_6

C_8

C_11

 

 

 

 

1,1420

C_2

C_3

 

 

 

 

 

 

 

 

 

 

 

 

1,2132

C_2

C_3

 

C_4

C_5

C_7

C_10

C_9

C_12

C_6

C_8

 

C_11

 

1,2617

C_1

C_2

 

C_3

C_4

C_5

C_7

C_10

C_9

C_12

C_6

 

C_8

C_11

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

11. Выбра ть М атри ца рассто я ни й

(Distance matrix). В резу л ь та те поя-

вит ся сл ед у ющ а я м а трица :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C_1

C_2

C_3

C_4

C_5

C_6

C_7

C_8

C_9

C_10

C_11

C_12

 

 

C_1

0,00

1,26

1,35

2,35

2,42

2,29

2,46

2,31

 

2,60

2,49

1,91

2,21

 

 

C_2

1,26

0,00

1,14

1,45

1,47

1,34

1,49

1,41

 

1,64

1,56

1,32

1,21

 

 

C_3

1,35

1,14

0,00

1,61

1,70

1,48

1,72

1,41

 

1,86

1,77

1,27

1,56

 

 

C_4

2,35

1,45

1,61

0,00

0,46

0,58

0,51

0,69

 

0,62

0,53

1,13

0,47

 

 

C_5

2,42

1,47

1,70

0,46

0,00

0,41

0,10

0,71

 

0,20

0,11

1,43

0,33

 

 

C_6

2,29

1,34

1,48

0,58

0,41

0,00

0,37

0,36

 

0,52

0,47

1,27

0,47

 

 

C_7

2,46

1,49

1,72

0,51

0,10

0,37

0,00

0,67

 

0,18

0,15

1,47

0,35

 

 

C_8

2,31

1,41

1,41

0,69

0,71

0,36

0,67

0,00

 

0,81

0,78

1,19

0,70

 

 

C_9

2,60

1,64

1,86

0,62

0,20

0,52

0,18

0,81

 

0,00

0,13

1,61

0,50

 

 

C_10

2,49

1,56

1,77

0,53

0,11

0,47

0,15

0,78

 

0,13

0,00

1,50

0,44

 

 

C_11

1,91

1,32

1,27

1,13

1,43

1,27

1,47

1,19

 

1,61

1,50

0,00

1,36

 

 

C_12

2,21

1,21

1,56

0,47

0,33

0,47

0,35

0,70

 

0,50

0,44

1,36

0,00

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

А н а л из пол у чен н ой д ен д рогра м м ы, м а трица

ра сстоян ий и схем ы объе-

д ин ен ия с д еревом кра тча йших ра сстоян ий, построен н ым в сред е MS Excel, позвол яют сд ел а т ь вывод о пол н ой ид ен т ичн ости резу л ь та т ов кл а стерн ого а н а л иза , провед ен н ого с испол ь зова н ием т а бл ичн ого процессора MS Excel

и па кета

STATISTICA.

 

 

 

 

12.

Н а ж а ть

н а кн опку О пи сательные стати сти к и (Descriptive statis-

tics), пол у чит ь

т а бл ицу резу л ь та тов со

сред н им и зн а чен иям и (Mean) и

ст а н д а рт н ым и откл он ен иям и (Std. Dev.)

д л я ка ж д ой перем ен н ой, испол ь -

зу ем ой в описа н ии кл а ссиф ициру ем ыхобъектов (см . та бл. 2.2.5).

 

 

 

 

 

 

 

Табли ца 2.2.5

 

 

 

Описат ельные ст

ат ист ик и

 

 

 

 

 

 

 

 

 

 

 

Variable

Mean

 

Std. Dev.

 

 

 

 

Var1

0,211938

 

0,372409

 

 

 

 

Var2

0,434637

 

0,343888

 

 

 

 

Var3

0,143409

 

0,282025

 

 

 

 

Var4

0,185607

 

0,291957

 

 

 

 

Var5

0,420639

 

0,394442

 

 

 

 

Var6

0,256741

 

0,356183

 

 

 

 

Var7

0,215338

 

0,305987

 

 

 

 

Var8

0,343302

 

0,312793

 

 

 

 

 

 

 

 

 

2.3. Задани я для само сто я тельно й рабо ты

З адание 2.3.1. Н а пред приятии «П рогресс»ф у н кцион иру ют 16 н а у чн о- производ ствен н ых от д ел ов, за н ятых выпу ском ра зл ичн ой прод у кции, ра бот

и у сл у г.

П оскол ь ку

вид ы д еятел ь н ости, кол ичество

ра бот а ющ их, рен т а -

бел ь н ость

отд ел ов,

су щ ествен н о ра зл ича ются м еж д у

собой, был о решен о

сгру ппирова ть отд ел ы в н ескол ь ко од н ород н ых гру пп, а за тем д л я ка ж д ой гру ппы ра зра бота ть свою сист ем у прем ирова н ия. П осл е тщ а тел ь н ого а н а -

л иза выбра л и четыре призн а ка , с пом ощ ь ю которых описыва л ись н а ибол ее ва ж н ые па ра м етры ка ж д ого отд ел а : 1) стоим ост ь а ктивн ой ча ст и осн овн ых производ ствен н ых ф он д ов, т ыс. ру б. ( x1); 2) сред н ем есячн ый объем ра бот

отд ел а , тыс. ру б. ( x2 ); 3) у д ел ь н ый вес ра бот/у сл у г отд ел а по вн у триф ир- м ен н ой коопера ции, % ( x3); 4) сред н ем есячн а я прибыл ь отд ел а , тыс. ру б. ( x4 ). Д а н н ые по отд ел а м привед ен ы в та бл. 2.3.1.

Табли ца 2.3.1

 

 

 

 

 

 

 

 

 

 

№ отд ел а

x1

x2

x3

x4

№ отд ел а

x1

x2

x3

x4

1

699

190

53

11

9

293

391

16

66

2

532

211

19

42

10

300

396

29

87

3

650

152

46

14

11

73

160

0

22

4

768

216

67

17

12

862

199

51

22

5

67

106

0

32

13

112

136

0

29

6

322

397

26

52

14

289

388

31

74

7

736

180

49

18

15

512

195

6

58

8

501

239

11

60

16

490

201

9

65

 

 

 

 

 

 

 

 

 

 

П ровед ит е кл а стериза цию от д ел ов в

па кете STATISTICA,

испол ь зу я

иера рхические а л горит м ы по: 1) исход н ым

д а н н ым ; 2) ст а н д а рт

изова н н ым

исход н ым д а н н ым . Сра вн ите резу л ь та ты кл а стериза ции. Н а йд ит е ста тистические ха ра ктерист ики ка ж д ого кл а стера . П ровед ите кл а ст ериза цию, испол ь зу я м етод К -сред н их (числ о кл а ст еров за д а йте ра вн ым 4). Сра вн ите резу л ь т а т ы кл а стериза ции по д ву м м етод а м (соста вы кл а ст еров).

З адание 2.3.2. П ровед ите кл а ст ериза цию (л юбым извест н ым В а м м ето- д ом ) потребител ей н а осн ове их отн ошен ия к посещ ен ию м а га зин ов д л я поку пки т ова ров н а осн ове резу л ь т а т ов иссл ед ова н ия, су т ь которого в том , что

потребител ей попросил и выра зить их степен ь

согл а сия со сл ед у ющ им и у т-

верж д ен иям и по 7-ба л л ь н ой шка л е (1 –н е согл а сен , 7 –согл а сен ): V1

«П осещ ен ие м а га зин ов д л я поку пки това ров

–прият н ый процесс»; V2

«П осещ ен ие м а га зин ов д л я поку пки това ров пл охо ска зыва ется н а бюд ж е- те»; V3 –«Я совм ещ а ю посещ ен ие м а га зин ов д л я поку пки това ров с пит а - н ием вн е д ом а »; V4 –«Я ст а ра юсь сд ел а т ь л у чшие поку пки при посещ ен ии м а га зин ов»; V5 –«М н е н е н ра вит ся посещ ен ие м а га зин ов д л я поку пки то-

ва ров»; V6 –«Я м огу

сэкон ом ить м н ого д ен ег, сра вн ива я цен ы в ра зн ыхм а -

га зин а х». Резу л ь та ты этого иссл ед ова н ия привед ен ы в та бл . 2.3.2.

 

 

 

 

 

 

 

Табли ца 2.3.2

 

 

 

 

 

 

 

 

 

 

П о треби тель

V1

V2

V3

V4

V5

V6

 

 

-1-

-2-

-3-

-4-

-5-

-6-

-7-

 

 

1

6

4

7

3

2

3

 

 

2

2

3

1

4

5

4

 

 

3

7

2

6

4

1

3

 

 

4

4

6

4

5

3

6

 

-1-

-2-

-3-

-4-

-5-

-6-

-7-

5

1

3

2

2

6

4

6

6

4

6

3

3

4

7

5

3

6

3

3

4

8

7

3

7

4

1

4

9

2

4

3

3

6

3

10

3

5

3

6

4

6

 

 

 

 

 

 

 

З а дание 2.3.3. С цел ь ю а д ресн ой под д ерж

ки м а л ого бизн еса Д епа рт а -

м ен том экон ом ического ра звит ия г. Ворон еж а

был о решен о построить ком -

пь ютерн у ю ра спозн а ющ у ю систем у н а осн ове м етод ов м н огом ерн ой кл а с- сиф ика ции, позвол яющ у ю по опред ел ен н ом у перечн ю пока за тел ей ид ен ти- ф ицирова ть м а л ые пред приятия д л я опред ел ен ия провод им ой от н осител ь н о н их экон ом ической пол ит ики. Д а н н ые д л я реш ен ия поста вл ен н ой за д а чи пред ст а вл ен ы в та бл. 2.3.3. С пом ощ ь ю м етод а , осн ова н н ого н а построен ии д ерева кра тча йшихра сстоян ий (с испол ь зова н ием «взвешен н ого»Е вкл ид ова ра сстоян ия д л я опред ел ен ия вза им н ого сход ст ва м еж д у пред прият иям и), ра зд ел ите всю выборочн у ю совоку пн ость пред приятий н а отд ел ь н ые гру ппы и по сред н им ха ра ктеристика м пол у чившихся гру пп опред ел ите, в ка кие из

кл а ссов вошл и пред приятия,

н у ж

д а ющ иеся в ф ин а н совой под д ерж ке, ка кие

н орм а л ь н о ф у н кцион иру ют, а

ка

кие у ж е, возм ож н о, ста л и ба н крота м и. Т ре-

бу ем ые ра счеты провед ит е в MS Excel и STATISTICA (У ка за н ие: испол ь зова ть мен ю «О бъед ин ен ие (д ревовид н а я кл а стериза ция)»).

 

 

 

 

 

 

Табли ца 2.3.3

 

 

 

 

 

 

 

 

 

 

К оэф ф ициен т

К оэф ф ициен т обеспе-

К оэф ф ициен т

 

 

 

П ред -

теку щ ей л ик-

чен н ости собствен н ым и

у тра ты (восста н овл ен ия)

 

 

приятие

вид н ости,

сред ства м и,

пл а теж еспособн ости,

 

 

 

 

x1

x2

x3

 

 

 

1

1,30

0,23

1,13

 

 

 

2

0,73

-1,36

0,59

 

 

 

3

2,02

0,24

1,46

 

 

 

4

0,64

-1,09

0,72

 

 

 

5

1,28

0,23

1,19

 

 

 

6

1,52

0,51

1,42

 

 

 

7

2,00

0,50

1,69

 

 

 

8

0,32

0,16

0,37

 

 

 

9

1,18

0,15

1,04

 

 

 

10

0,92

-1,10

0,51

 

 

 

 

 

 

 

 

 

 

 

З адание 2.3.4. П ровед ит е кл а ссиф ика цию ком м ерческих ба н ков м ето-

д ом

К -сред н их н а пред м ет оцен ки их н а д еж н ост и, у ста н овив экспертн ым

пу т ем оптим а л ь н ое числ о кл а стеров. О пред ел ите соста в ка ж

д ого кл а стера ,

его

ста тистические ха ра кт ерист ики. О сн овн ые пока за т ел и

ра боты ба н ков

привед ен ы в т а бл . 2.3.4.

 

 

 

 

 

 

 

Табли ца 2.3.4

Ба н к

Ч истые а ктивы,

Л иквид н ые а ктивы,

Су м м а рн ые обяза тел ь ст ва ,

 

тыс. ру б.

тыс. ру б.

тыс. ру б.

 

 

 

1

728481,825

12731,458

1527149,283

 

2

43831,446

-24198,034

79374,219

 

3

19973,371

629,285

27452,437

 

4

26484,649

-16262,703

31193,252

 

5

20393,837

3483,837

29484,226

 

6

174967

6783,932

260847,887

 

7

137371,384

3197,923

12736,83

 

8

62763,913

6158,736

97264,837

 

9

183,837

-189,78

18373,803

 

10

11836,91

-414,712

19724,46

 

 

 

 

 

 

3.ДИ С К РИ М И НА Н ТН Ы Й А НА ЛИ З

3.1.Тео рети ческ и е о сно вы

Ди скри ми н ан тн ы й ан али з – это м етод

м н огом ерн ой кл а ссиф ика ции,

пресл ед у ющ ий цел ь ра зд ел ен ия объектов н а

гру ппы при н а л ичии н а ча л ь -

н ых пред ста вл ен ий о ха ра кт ере гру пп, т .е. н а л ичии обу ча ющ их выборок.

П од обучающи м и вы борками

пон им а ются н а бл юд ен ия, отн осит ел ь н о кото-

рых известн о, к ка ком у кл а ссу он и прин а д л еж

а т , а точн ее –из ка ких ген е-

ра л ь н ых совоку пн ост ей он и

извл ечен ы. Д л я

пон им а н ия

су т и д искрим и-

н а н тн ого а н а л иза возн ика ет

н еобход им ость в

у точн ен ии

пон ятия «кл а сс».

К ласс –это ген ера л ь н а я совоку пн ост ь , описыва ем а я од н ом од а л ь н ой ф у н к- цией пл от н ост и f (x) (ил и од н ом од а л ь н ым пол игон ом вероятн ост ей в сл у -

ча е д искретн ыхпризн а ков).

 

 

В осн ову вероят н остн ых м етод ов кл а ссиф ика ции (д искрим ин а н тн ый

а н а л из –это вероятн остн ый м етод ) пол ож ен

прин цип, в соответ ст вии с ко-

торым н а бл юд ен ие отн осится к том у кл а ссу

(т.е. к той ген ера л ь н ой сово-

ку пн ост и),

в ра м ка х которого (которой) он о выгл яд ит бол ее пра вд опод об-

н ым .

Д л я

пра ктической реа л иза ции этого прин ципа

н еобход им о ра спол а -

га ть

пол н ым описа н ием гипотетических кл а ссов,

т.е. зн а н ием ф у н кций

1 ( )

2 (

),K, fm,(xf ), xза дfа ющx их за кон ра спред ел ен ия вероятн остей, соот-

ветствен н о, д л я 1-го, 2-го, . . . , m -го кл а ссов. З а тру д н ен ия, связа н н ые с отсу тствием та кого описа н ия, обход ят с пом ощ ь ю обу ча ющ ихвыборок.

О сн овн ым т ребова н ием к м етод а м кл а ссиф ика ции явл яет ся требова н ие, состоящ ее в том , чтобы их прим ен ен ие м ин им изирова л о потери (ил и веро-

ят н ость )

 

н епра вил ь н ой кл а ссиф ика ции объектов. Д л я этого ввод ится вел и-

чин а

с(j

 

i) потерь , которые бу д у т им еть

м есто, при отн есен ии од н ого объ-

 

екта

i -го кл а сса к j -м у кл а ссу (при i = j

с(j

 

i)= 0 ). Е сл и обозн а чить через

 

( mi)jкол ичество сл у ча ев, когд а ош ибочн о объект i -го кл а сса от н осил ся к

j -м у кл а ссу ,

то потери,

связа н н ые с д опу щ ен ием ошибок та кого род а ,

бу-

д у т ра вн ы с(

 

 

)

(

 

 

i)j.

Чmijтобы посчит а ть общ ие возм ож н ые потери Сn при

 

 

испол ь зова н ии т а кой процед у ры кл а ссиф ика ции,

н еобход им о просу м м иро-

ва ть вел ичин у

 

 

произвед ен ия с(

 

 

 

)

(

 

i)j поmij всем i =

 

и

j =

 

, т.е.

 

 

 

 

 

 

 

1, m

1, m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m m

 

(

 

 

)

(

 

 

iCj).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n = åå

 

 

 

 

 

mi j

c

 

 

 

 

(3.1)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1 j=1

 

 

 

 

 

 

 

 

 

 

n кл а ссиф ициру ем ых объектов (Cn

Ч тобы потери н е за висел и от числ а

 

ра стет

с ростом

n ), перейд ем

к у д ел ь н ой ха ра кт еристике объектов, ра зд е-

л ив обе ча сти (3.1) н а

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

1

 

m

m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Cn

=

å å (

 

 

)

 

(

 

i)j.

mic j

 

 

 

 

(3.2)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

n i=1 j=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Е сл и

 

 

под

 

 

зн а ком

су м м ы в

пра вой ча сти

произвест и

преобра зова н ие,

у м н ож ив

и ра зд ел ив

ка ж

 

д ое сл а га ем ое н а

 

числ о эл ем ен тов в

 

i -ом

кл а ссе

ni (n) и перейд я к пред ел у , пол у чим

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

m

(

 

i)j

(

 

 

 

) i

(n) mni j

 

 

m

(å) (

 

 

i)j.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

 

 

 

 

 

= limC

 

 

 

 

 

c

 

 

(n)

 

 

 

 

 

=

 

 

πi å

 

 

Pci j

(3.3) åå

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n→∞ i

j

 

 

 

 

 

 

n

 

 

 

 

 

 

i

 

i 1

1

 

 

 

 

 

 

 

 

1 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

=

=

 

 

 

 

 

 

 

 

 

= =

П ред ел в (7.21) пон им а ется в см ысл е сход им ост и по вероят н ости ча с-

тоты

(

 

 

)/

 

 

i (n) nкmiвероятнj

ости отн есен ия объект а кл а сса

i к кл а ссу

j

 

 

 

( Pi)j,

а

 

 

ча стоты

 

 

 

i ( )/ nn кnвероят н ости

 

извл ечен ия объекта кл а сса

i из

общ ей совоку пн ости кл а ссиф ициру ем ыхобъектов, обозн а чен н ой π i . В ел ичин а

 

 

 

 

 

 

(i ) = åm

(

 

) (

 

i)Cj

P i j c

(3.4)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j=1

 

 

 

 

 

 

 

опред ел яет сред н ие потери от

н епра вил ь н ой кл а ссиф ика ции объектов i -го

кл а сса , а вся д войн а я су м м а

 

 

(3.3) –сред н ие у д ел ь н ые потери от н епра вил ь -

н ой кл а ссиф ика ции всеха н а л изиру ем ыхобъектов.

 

В бол ь шин стве сит у а ций, встреча ющ ихся н а

пра ктике, м ож н о счит а ть ,

что потери с(j

 

i) од ин а ковы д л я л юбой па ры i ,

j и м огу т быть

пред ста в-

 

л ен ы ка к

 

 

 

i)= íì1,

при i ¹ j .

 

 

 

 

 

с(j

 

 

(3.5)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

î0,

при i = j

 

 

 

 

 

 

 

 

 

 

 

 

 

В этом сл у ча е за д а ча

м ин им иза ции сред н их у д ел ь н ых потерь эквива л ен тн а

за д а че м а ксим иза ции

вероят н ости

пра вил ь н ой

кл а ссиф ика ции

объектов,

ра вн ой

 

m

 

 

(

 

i)i. P

 

 

 

 

 

(i ) =

 

 

 

 

 

 

 

 

 

 

i

 

(3.6)

 

 

 

 

 

å

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

П ока ж ем , что это, д ействител ь н о,

та к. П реж

 

д е всего за м етим , что в си-

л у ра вен ства пот ерь н у л ю при i = j , т .е. с(i

 

 

i)= 0 м ож н о за писа ть

 

 

 

 

 

 

 

 

 

= m π

m

(

 

 

 

 

)

(

 

 

)= m π

i

m

(

 

i)j.

P

å

(3Ci.7)j

P i j c

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

å

å

 

 

 

å

 

 

 

i

j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

j=1

=1

 

=1

 

=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j¹i

 

 

 

 

 

 

 

 

Д а л ее, у читыва я что

(

 

)+

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

 

 

 

 

å

 

 

i i =P1( Pи)i jå πi = 1,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

j¹i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

из(3.7) пол у ча ем

m

 

 

 

 

 

 

 

 

(

 

 

)

 

 

 

 

 

 

1− m==π(

(

 

i)i.) P

 

 

 

 

 

 

С

 

π

i

 

1

 

 

 

 

 

 

 

 

 

 

(3.8)Pi i

 

 

 

 

 

 

 

 

 

 

 

 

 

å

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

å

i

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

Т а ким обра зом , за д а ча м ин им иза ции потерь

от

н епра вил ь н ой кл а сси-

ф ика ции свод ится к за д а че м а ксим иза ции вероят н ости пра вил ь н ой кл а сси-

ф ика ции

 

 

 

 

 

 

 

 

m

 

 

 

 

(

 

i)i.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= å πPi

 

 

 

P

 

 

 

 

 

 

 

 

(3.9)

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Е сл и в ка честве критерия испол ь зова т ь

вероятн ость

пра вил ь н ой кл а с-

сиф ика ции объектов (3.8), то за д а чу

построен ия

оптим а л ь н ой процед у ры

кл а ссиф ика ции м н огом ерн ых

 

 

н а бл юд ен ий

м ож

н о

сф орм у л ирова ть

сл е-

д у ющ им обра зом . З а д а н ы

p -м ерн ые н а бл юд ен ия

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

 

K,, xn , x x

 

 

 

 

 

 

 

 

пред ст а вл яющ ие собой выборку из ген ера л ь н ой совоку пн ост и, описыва е-

м ой та к н а зыва ем ой см есь ю m кл а ссов (од н омод а л ь н ых ген ера л ь н ых сово-

ку пн ост ей) с пл отн ость ю вероятн ост и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f (x) = åm π j f j (x),

 

 

 

 

 

 

 

(3.10)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

гд е

π j –а приорн а я вероят н ост ь появл ен ия в

эт ой выборке эл ем ен та из

кл а сса

(ген ера л ь н ой совоку пн ости)

 

j

с пл от н ость ю

f j (x). Д ру гим и сл ова -

м и,

π j

–это у д ел ь н ый вес эл ем ен т ов

j -го

кл а сса

в

общ ей ген ера л ь н ой

совоку пн ости.

 

 

 

 

 

 

 

 

 

 

 

с(j

 

i)

 

 

 

 

 

 

 

 

 

 

 

 

 

П о-преж н ем у счита я,

что потери

 

от

 

н епра вил ь н ой кл а ссиф ика -

 

 

 

ции

од ин а ковы д л я л юбой па ры i ,

 

j ,

м ож

н о за д а чу

кл а ссиф ика ции, т.е.

отн есен ие н а бл юд ен ия (объект а ) н еизвестн ой прин а д л еж н ости

xν к кл а ссу

с н ом ером j , за писа ть ка к

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

π

j

f

j

(xν ) = maxπ j f j (xν ).

 

 

 

(3.11)

 

 

 

 

 

 

 

 

 

 

 

 

 

1£ j£m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

П ол у чен н ое пра вил о кл а ссиф ика ции (3.11) н е м ож

ет быть

испол ь зова -

н о н а пра ктике, т а к ка к н еизвест н ы а приорн ые вероятн ост и π1

π 2 K,, π m,

и