Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Кластерный анализ

.pdf
Скачиваний:
18
Добавлен:
21.05.2015
Размер:
593.73 Кб
Скачать

Ф е де рал ь н ое аге н т с т во по образован ию РФ В орон е ж с кий гос ударс т ве н н ы й ун иве рс ит е т

В .В . Давни с, В .И . Ти ня к о ва, С .И . М о к ш и на, А .И . А лек сеева

КО М П Ь Ю ТЕРНЫ Е РЕШ ЕНИ Я ЗА Д А Ч

МНО ГО М ЕРНО Й С ТА ТИ С ТИ К И

ЧА С ТЬ 1. К ЛА С ТЕРНЫ Й И ДИ С К РИ М И НА НТНЫ Й А НА ЛИ З

П О С О Б И Е по специ ально сти 080116 (061800)

«М атемати ческ и е мето ды вэк о но ми к е»

ОП Д .Р.10

Ворон е ж – 2005

У тверж д ен о н а у чн о-метод ическим советом экон омического ф а ку л ь тета , протокол № 2 от 26.02.2005г.

П особие под готовл ен о н а ка фед ре ин ф орма цион н ых техн ол огий и ма тема тических метод ов в экон омике экон омического фа ку л ь тета Ворон еж ского госу д а рствен н ого у н иверситета . Рекомен д у ется д л я сту - д ен тов, обу ча ющ ихся по специа л ь н ости 080116 (061800) –«М а тема - тические метод ы в экон омике», а та кж е д л я сту д ен тов д ру гих специ- а л ь н остей, осу щ ествл яющ их ста тистические компь ютерн ые иссл ед о- ва н ия при под готовке ку рсовых и выпу скн ых ква л иф ика цион н ых ра - бот.

ПРЕД И С ЛО В И Е

Прикл а д н ые м етод ы м н огом ерн ой ста тистики широко испол ь зу ются в

современ н ых экон ом ических иссл ед ова н иях. О н и позвол яют оцен ива ть н а -

д еж н ость сред н их ха ра ктеристик и ра зл ичий м еж

д у

н им и, у ст а н а вл ива т ь

за кон ом ерн ост и и обосн ова н н о им и пол ь зова ть ся

в

а н а л итических и про-

гн озн ых ра счет а х, осу щ ествл ять м н огом ерн ые кл а ссиф ика ции и а н а л изирова ть их, пред ста вл ят ь резу л ь т а т ы иссл ед ова н ий в у д обн ой та бл ичн ой и гра - ф ической ф орм а х.

В озмож н ости соврем ен н ой ком пь ютерн ой техн ики обра ба тыва ть ко- л осса л ь н ые объем ы ин ф орм а ции способствова л и ра звитию програ м м н ого обеспечен ия, ориен т ирова н н ого н а под д ерж ку ста т ист ических м етод ов а н а - л иза . В н а ст оящ ее врем я ра зра бота н о д оста точн о бол ь шое числ о ком пь ю- терн ых па кетов, реа л изу ющ их эти м етод ы, н а прим ер, STATISTICA, STATA, SPSS, EViews, SAS и д р. Их гра м отн ое испол ь зова н ие требу ет, с од н ой сторон ы, д оста точн о гл у боких зн а н ий по т еории м н огом ерн ого ст а - тистического а н а л иза , а с д ру гой –вл а д ен ия н а выка м и пра ктической ра боты в сред е са м их па кет ов. Без н а выков н ел ь зя осу щ ествить ра счеты, без

зн а н ий –сод ерж а тел ь н о проин т ерпрет ирова т ь

резу л ь та ты ста тистического

а н а л иза .

 

В д а н н ом пособии пред прин ят ы у сил ия

по решен ию обеих за д а ча х.

О н о сод ерж ит н а ча л ь н ые свед ен ия о па кете STATISTICA, позвол яющ ие освоить осн овн ые прием ы ра бот ы с м а ссива м и д а н н ых, под л еж а щ их ста тист ической обра ботке, а та кж е н а у чить ся пра ктическом у испол ь зова н ию д ву хм од у л ей па кета –кл а стерн ого и д искрим ин а н т н ого а н а л иза .

О своен ие ка ж д ого из м од у л ей пред у см а трива ет выпол н ен ие т иповой за д а чи с у ка за н ием всех пу н ктов м ен ю, привод ящ их к ее решен ию. Резу л ь - та ты ра счетов ин терпретиру ются с т очки зрен ия сод ерж а н ия реша ем ой за - д а чи и сра вн ива ются с резу л ь та та м и а н а л огичн ых ра счетов, провед ен н ых в

MS Excel.

С цел ь ю проверки зн а н ий и за крепл ен ия н а выков в пособии привед ен о д оста точн ое кол ичество за д а н ий д л я са м остоятел ь н ой ра боты.

2.К ЛА С ТЕРНЫ Й А НА Л И З

2.1.Тео рети ческ и е о сно вы

К ластерн ы й ан али з пред ста вл яет собой ста тистические м етод ы, испол ь зу ем ые д л я кл а ссиф ика ции м н огом ерн ых объектов ил и событий в от- н осител ь н о од н ород н ые гру ппы, которые н а зыва ют кл а стера м и. О бъекты в

ка ж д ом

кл а ст ере д ол ж н ы быт ь похож и д ру г н а

д ру га

в бол ь ш ей ст епен и,

чем н а

объект ы д ру гих кл а ссов, и отл ича т ь ся от объект ов д ру гих кл а ст еров

сил ь н ее, чем от объектов собствен н ого кл а сса .

К л а стерн ый а н а л из та кж е

н а зыва ют кл а ссиф ика цион н ым а н а л изом ил и числ ен н ой т а ксон ом ией.

В экон ом ике он испол ь зу ется д л я д остиж

ен ия

сл ед у ющ их цел ей: сег-

м ен т а ции рын ка , изу чен ия повед ен ия поку па тел ей,

опред ел ен ия кон ку рен -

тоспособн ост и н ового това ра , сокра щ ен ия ра зм ерн ости д а н н ыхи д р.

О бычн о в за д а ча х кл а ст ерн ого а н а л иза исход н ые д а н н ые пред ст а вл яют

в ф орм е прям оу гол ь н ой та бл ицы,

ка ж д а я строка

которой пред ста вл яет ре-

зу л ь т а т изм ерен ия p призн а ков н а соответству ющ ем объект е:

 

 

 

æ

L x

öx

 

x

 

11

 

 

ç

L x

1p ÷

 

x

12

 

 

X = ç

 

x

 

22

21

(2.1)

 

 

2 p ÷,

 

 

 

ç

 

M

÷ M L

 

M

 

 

 

ç

 

 

÷

 

 

 

 

 

 

 

ç

 

 

÷

 

 

 

 

 

 

 

è 1

2 L xnp øx n x n

 

 

гд е n–числ о объектов, под л еж а щ ихкл а ссиф ика ции.

 

 

 

 

Ч исл овые зн а чен ия призн а ков, вход ящ их в м а трицу , могу т

соответст-

вова ть

трем типа м перем ен н ых:

ка чествен н ым ,

ра н говым и

кол ичествен -

н ым . К ачествен н ы е перемен н ы е , ка к пра вил о, прин им а ют д ва и бол ее зн а -

чен ий, кот орым , хотя и м ож

н о поста вить в соот вет ствие н екоторые числ а ,

н о эти числ а н е бу д у т отра ж

а ть ка ку ю-л ибо у поряд очен н ость зн а чен ий ка -

чествен н ых перем ен н ых. И это н у ж н о у читыва ть

при опред ел ен ии бл изо-

ст и. З н а чен ия ран говы х перем ен н ы х , в отл ичие от

ка чест вен н ых, у поряд о-

чен ы. Их м ож н о прон у м ерова т ь н а ту ра л ь н ым и числ а м и. О д н а ко а риф м етические опера ции н а д этим и числ а м и н е им еют см ысл а . К оли чествен н ы е перем ен н ы е обл а д а ют свойством у поряд очен н ост и, и н а д н им и, в отл ичие от д ру гих, м ож н о привод ит ь а риф м ет ические опера ции.

Ж ел а тел ь н о, чтобы вся та бл ица исход н ых д а н н ых соот вет ствова л а од - н ом у типу перем ен н ых. Е сл и это н е та к, то ра зн ые т ипы перем ен н ых ст а - ра ются свести к ка ком у -то од н ом у типу перем ен н ых. Са м ый прост ой явл я- ет ся процед у ра свед ен ия к ка чествен н ым перем ен н ым . Су ть этой процед у - ры в сл ед у ющ ем . Е сл и есть кол ичест вен н ые д а н н ые, то он и сн а ча л а свод ятся к ра н говым, д л я чего обл а сть зн а чен ий кол ичествен н ых перем ен н ых ра з- бива ет ся н а ин терва л ы, которые н у м еру ются числ а м и н а ту ра л ь н ого ряд а . Ра н говые перем ен н ые м ож н о счит а ть ка чествен н ым и, есл и н е у чит ыва т ь у поряд очен н ость их зн а чен ий. В свою очеред ь , ка чествен н ые перем ен н ые

перевод ят ся

в д ихотом ические по

сл ед у ющ ем у

пра вил у .

К а ж д ое из воз-

м ож н ых зн а чен ий ка чествен н ой перем ен н ой за м ен яется

н а

1, есл и ка чест-

вен н а я перем ен н а я прин ял а это зн а чен ие, и 0 –в противн ом сл у ча е.

 

В т ех сл у ча ях, когд а все пока за тел и кол ичествен н ые,

ча сто возн ика ет

пробл ем а их н орм ирова н ия,

поскол ь ку ра зл ичие в ед ин ица х изм ерен ия д е-

л а ет эти пока за т ел и н есопост а вим ым и. Т а к,

н а прим ер,

при кл а ссиф ика ции

пром ышл ен н ых пред прият ий по

резу л ь т а та м

ф ин а н сово-хозяйствен н ой

д еятел ь н ост и в описа н ие вкл юча ются та кие пока за тел и, ка к прибыл ь ,

рен -

та бел ь н ость ,

себестоим ость , коэф ф ициен т т еку щ ей л иквид н ости и т.д .

П о

прибыл и пред прият ия м огу т ра зл ича ть ся н а

д есятки и сотн и тысяч ед ин иц,

а по рен т а бел ь н ости –н а ед ин ицы, а то и д есятые д ол и ед ин ицы.

Т а ка я н е-

сопост а вим ость пра ктически перечеркива ет

ид ею м н огом ерн ой кл а ссиф и-

ка ции, та к ка к он а

а втом а т ически бу д ет осу щ ествл ять ся по бол ее м а сшт а б-

н ом у

пока за тел ю.

П оэтом у

процед у ре н епосред ст вен н ого ра зн есен ия

объ-

ектов

по кл а сса м

д ол ж н а

пред шествова ть

процед у ра

привед ен ия

всех

пока за тел ей

к

сопоста вим ом у

вид у ,

котору ю

прин ято

н а зыва ть

н ормиВ рованпр ктическихи е м .

ра счет а х ча щ е д ру гих испол ь зу ются

д ва

под ход а к

н орм ирова н ию. О д ин изн ихсвяза н с ид еей ста тистической ста н д а ртиза ции, осу щ ествл яем ой по ф орм у л е

 

xн

=

x x j

,

ij

(2.2)

 

 

 

 

ij

 

σ j

 

 

 

 

 

 

 

гд е xн –н орм ирова н н ый

j -ый пока за т ел ь i -го объект а ;

 

ij

 

 

 

 

 

 

xij –зн а чен ие j -го пока за тел я i -го объекта ;

 

x j –сред н ее зн а чен ие

j -го пока за т ел я по всем у м н ож еству

кл а ссиф и-

циру ем ыхобъектов;

 

 

 

 

 

 

σ j –сред н еква д ра т ическое откл он ен ие

j -го пока за т ел я.

 

П ри испол ь зова н ии т а кой н орм ировки все пока за тел и, описыва ющ ие кл а ссиф ициру ем ый объект, привод ят ся к вид у , когд а сред н ее ра вн о 0, а ра з- брос вокру г сред н его ра вен 1.

В торой

под ход пред у см а трива ет преобра зова н ие пока за т ел ей пу т ем

отобра ж

ен ия ин т ерва л а

их возм ож н ых зн а чен ий н а

пром еж у ток [ 01;]. Э т о

осу щ ествл яется с пом ощ ь ю ф орм у л ы

xmin

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

xн

=

 

j

,ij

 

(2.3)

 

 

 

 

 

 

 

 

 

 

 

ij

 

x j

xminj

 

max

 

 

 

 

 

 

 

 

 

min

=

xij };

max

 

 

xij }. {

max

 

 

гд е x j

 

{x j min=

 

i

 

 

 

 

 

i

 

 

 

 

 

 

Т а ким обра зом , с пом ощ ь ю н орм ирова н ия у д а ет ся изба вить ся от н еж е- л а тел ь н ого вл иян ия ра зн ом а сшта бн ости пока за тел ей н а степен ь схож ест и м еж д у объект а м и. Са м у схож есть ча щ е всего опред ел яют л ибо с пом ощ ь ю

н екоторой ф у н кции r(xi , xk ), ха ра ктеризу ющ ей бл изость

i -го и

k -го объ-

 

ектов, л ибо по вел ичин е ра сстоян ия ρ(xi , xk )

м еж

д у

объекта м и,

им ея вви-

 

д у , что ка ж

д ый объект

м ож ет

быть

пред ст а вл ен

точкой p -м ерн ого про-

 

ст ра н ства .

Д л я

ф у н кции

схож ести

 

r(xi , xk )

д ол ж

н ы выпол н ять ся у сл овия

 

сим м етрии, т .е.

r(

,

) = r(

, x

i

),xи у xсл овиеx м а ксим а л ь н ого сход ства с

 

 

 

 

 

 

 

 

 

 

 

k

i

k

 

 

 

 

 

 

 

 

 

са м им собой r(

i

i ) =

 

r(

i , x,k )x. Д л maxя ρ(xi , xk )

эти у сл овия выпол н я-

 

ют ся а втом а т ически.

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В ыборм еры сход ст ва явл яется од н им из у зл овых м ом ен тов в за д а ча х

 

кл а ссиф ика ции,

та к ка к от н ее,

в осн овн ом ,

за висит при д а н н ом а л горит м е

 

кл а ссиф ика ции окон ча тел ь н ый ва риа н т

ра збиен ия объектов

н а

кл а ссы. В

 

ка ж д ом кон кретн ом

сл у ча е этот

выбор осу щ ест вл яет ся

в за висим ост и от

 

цел и иссл ед ова н ия и природ ы са м их кл а ссиф ициру ем ых объектов. В са м ом

 

общ ем сл у ча е, когд а

м еж

д у пока за т ел ям и объектов су щ еству ет вза им освязь

 

и, кром е того, он и им еют ра зл ичн у ю степен ь

зн а чим ост и д л я провод им ой

 

кл а ссиф ика ции, испол ь зу ют обобщ ен н ое (взвеш ен н ое) расстоян и е М ахала-

 

н оби са

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ρ

 

 

 

 

 

 

 

k

T

−1

i

 

 

 

T

 

 

 

(2x.4)) x

x( x )( ,

 

 

 

 

 

 

 

 

i

 

ikxk x , Σ= Λ(

гд е Σ−1 –кова риа цион н а я м а трица

ген ера л ь н ой совоку пн ост и, из которой

 

извл ечен ы н а бл юд ен ия (объект ы, под л еж а щ ие кл а ссиф ика ции);

 

 

Λ –н екотора я сим м етрическа я

н еотрица тел ь н о-опред ел ен н а я м а трица

 

весовыхкоэф ф ициен тов (ка к пра вил о, это м а трица д иа гон а л ь н а я).

 

В о м н огих ситу а циях д л я опред ел ен ия сход ства

м еж

д у

объект а м и ис-

 

пол ь зу ют ся ча ст н ые сл у ча и ра сстоян ия М а ха л а н обиса . Т а к, при ед ин ичн ых

 

Λи Σ из(2.4) пол у ча ется обычн ое Евкли дово расстоян и е

 

 

 

 

 

 

 

ρ(x , x ) =

 

 

åp (x

xkj )2.

 

ij

 

 

i

k

(2.5)

 

 

 

 

 

 

 

 

 

 

j =1

 

 

 

 

 

 

 

 

 

 

 

 

О пред ел ят ь похож ест ь по этом у

ра сстоян ию обычн о реком ен д у ет ся в тех

 

сл у ча ях, когд а :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1) н а бл юд ен ия

извл ечен ы

из ген ера л ь н ых совоку пн ост ей,

им еющ их

 

м н огом ерн ое н орм а л ь н ое ра спред ел ен ие с д иа гон а л ь н ой кова риа цион н ой

 

м а трицей, а все ком пон ен ты векторов н а бл юд ен ий xi , xk вза им н о н еза ви-

 

сим ы и им еют од н у и ту

ж е д исперсию;

 

 

 

 

 

 

 

 

 

 

 

2) все ком пон ен т ы векторов н а бл юд ен ий xi , xk

од ин а ково ва ж н ы д л я

 

кл а ссиф ика ции;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3) ин ту итивн ое пред ст а вл ен ие о

ст епен и

схож ести

м еж

д у

объекта м и

 

совпа д а ет с пон ят ием геом етрического ра сстоян ия м еж д у

н им и в призн а ко-

 

вом простра н стве.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В сл у ча е, когд а Σ явл яется ед ин ичн ой м а т рицей,

а Λ –д иа гон а л ь н ой,

сход ст во м еж

д у

объекта м и изм еряет ся вел ичин ой взвешен н ого Евкли дова

расстоян и я

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ρ(x , x )=

p

(

 

 

x w)

2.x

ij

j

i

(2.6)

 

 

 

 

 

 

 

å

 

 

 

kj

 

 

k

 

 

 

 

 

 

 

j =1

 

 

 

 

 

 

 

 

 

 

 

Э та м ера

схож

ести прим ен яется в т ех сл у ча ях, когд а

ка ж д ом у

призн а ку

xj

векторов

н а бл юд ен ий приписыва ется

н екоторый вес

wj , пропорцион а л ь -

н ый степен и ва ж

н ост и j -го призн а ка

в реша ем ой за д а че кл а ссиф ика ции.

 

 

 

 

p

 

 

 

 

 

 

 

 

 

 

 

 

О бычн о

0 ≤ wj ≤ 1 и å wj = 1.

О пред ел ен ие весовых коэф ф ициен т ов,

по

 

 

 

j=1

 

 

 

 

 

 

 

 

 

 

 

 

су ти, явл яется са м остоят ел ь н ой за д а чей, решен ие которой, ча щ е всего,

по-

ру ча ет ся эксперта м .

 

 

 

 

 

 

 

 

 

 

 

 

Е сл и все призн а ки изм ерен ы в н ом ин а л ь н ой шка л е и за д а ются д ихото-

м ическим и перем ен н ым и, т о степен ь

схож ест и

опред ел яет ся

с пом ощ ь ю

Хем м и н гово расстоян и я

 

p

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ρ(x , x

) = å

 

x

xkj

,

 

ij

i

k

(2.7)

 

ра вн ого числ у

н есовпа д ен ий.

j=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В н екоторых сл у ча ях исход н а я ин ф орма ция обобъекта х,

под л еж а щ их

кл а ссиф ика ции,

за д а ет ся н е призн а ковым простра н ст вом , а ква д ра тн ой м а т-

рицей R = (rik ),

, =

 

, хаi раk ктеризу ющ ей вза им н ые ра сстоян ия м еж д у

, 1n

объект а м и. Т огд а отпа д а ет н еобход им ость

в испол ь зова н ии выш е ра ссмот-

рен н ыхра сстоян ий д л я опред ел ен ия меры сход ства м еж

д у объекта м и.

 

Н а ибол ее ра спростра н ен н ым и а л горитм а м и кл а стерн ого а н а л иза явл я-

ет ся иера рхические (д еревообра зн ые)

процед у ры. О н и быва ют д ву х типов:

а гл ом ера т ивн ые и д ивизим н ые.

В а гл ом ера тивн ых а л горитм а х н а ча л ь н ым

явл яется ра збиен ие, состоящ ее из n - од н оэл ем ен тн ых кл а ссов, а кон ечн ым

–из од н ого кл а сса . В д ивизим н ых все н а оборот: н а ча л ь н ым явл яется од ин кл а сс, а кон ечн ым –n-од н оэл ем ен т н ыхкл а ссов.

П рин ицип, который пол ож ен в осн ову

иера рхических а гл ом ера тивн ых

(д ивизим н ых) а л горит мов, за кл юча ется в

посл ед ова тел ь н ом объед ин ен ии

(ра зд ел ен ии) гру пп эл ем ен тов сн а ча л а са м ых бл изких (д а л еких), а за тем все бол ее отд а л ен н ых (бл изких) д ру г от д ру га . Д л я реа л иза ции этого прин ципа н а ка ж д ом ша ге кл а ссиф ика ции требу ется построен ие м а трицы вза им н ых ра сстоян ий м еж д у объекта м и. Э то д ел а ет чрезвыча йн о гром озд кой вычис- л ит ел ь н у ю схем у , реа л изу ющ у ю д а н н ый под ход .

Бол ее эф ф ект ивн ым явл яется м етод кл а ссиф ика ции по д ереву кра т- ча йших ра сстоян ий, в котором оригин а л ь н а реш ен а пробл ем а пересчет а м а трицы вза им н ых ра сстоян ий. В этом м етод е посл ед ова т ел ь н о, ша г за ш а -

гом , строит ся связн ое дерево

кратчай ши х расстоян и й .

Ф орм а л ь н о про-

цед у ра построен ия та кого д ерева выгл яд ит сл ед у ющ им обра зом .

 

Н а н у л евом ша ге ф орм иру ются три вектор-строки по пра вил а м :

 

1-а я строка –это строка

из вза им н ых ра сстоян ий первого объекта

со

всем и оста л ь н ым и

 

 

 

 

 

 

 

 

ρ1 = ρ(x , x

 

), k =

 

;

(2.8)

 

k

1, n

 

k

1

 

 

 

 

 

 

2-а я ст рока –это строка , эл ем ен ты которой ра вн ы ра сст оян иям м еж

д у

вершин а м и д ерева и ра спол ож

ен н ые в т ой посл ед ова т ел ь н ости, в которой

вершин ы под соед ин ял ись к д ереву

(н а

н у л евом ша ге, когд а д ерево состоит

изод н ой вершин ы, ед ин ствен н ым эл ем ен т ом этой строки явл яет ся 0)

 

R1 = {0};

(2.9)

 

3-я строка –это строка из н ом еров вершин (объектов), ра спол ож ен н ых

в той посл ед ова т ел ь н ости, в

которой строил ось д ерево

кра тча йших ра с-

ст оян ий (н а н у л евом ша ге в этой строке стоит т ол ь ко од ин эл ем ен т –н ом ер первой верш ин ы д ерева )

K1 = {}1 .

(2.10)

Н а i -ом ш а ге опред ел яется вершин а , бл иж

а йша я к ф ра гм ен т у у ж е по-

ст роен н ого д ерева пу тем вычисл ен ия м ин им а л ь н ого эл ем ен та строки {ρki−1},

k = Arg min {ρki−1},

k =

 

.

(2.11)

1, n

ρkk¹0

 

 

 

 

Испол ь зу я н а йд ен н ый н ом ербл иж а йшей верш ин ы, ф орм иру ют ся три

вектор-ст роки по сл ед у ющ им пра вил а м :

 

 

 

 

1-а я строка ф орм иру ется из м ин им а л ь н ых ра сстоян ий пу тем сопоста в-

л ен ия теку щ ей строки ра сстоян ий построен н ого ф ра гм ен та

д ерева д о вер-

шин ,

н е вкл ючен н ых в

этот ф ра гм ен т, со строкой вза им н ых ра сст оян ий,

бл иж

а йшего к ф ра гм ен ту эл ем ен т а k

 

,k =

 

 

 

 

 

ρk =

ρk

ρ xk xk },

 

;,

min{ (2.12)

 

1(, n

2-а я строка попол н яет ся н ом ером объекта , бл иж

а йшего к построен н ом у

ф ра гм ен т у д ерева

 

 

i-1 k K;

 

 

 

 

 

 

 

i

=

K

 

 

(2.13)

3-я ст рока попол н яется

зн а чен ием

ра сстоян ия

от

построен н ого ф ра г-

м ен т а д ерева д о бл иж а йшей верш ин ы,

котора я н а i -ом

ша ге вкл юча ется в

соста в ф ра гм ен та д ерева

 

 

 

 

 

 

 

 

 

 

 

Ri

= Ri−1 ρk .

 

 

 

 

(2.14)

П роцесс прод ол ж а ется

д о пол н ого исчерпа н ия

всего м н ож

ества кл а с-

сиф ициру ем ыхобъектов.

 

 

 

 

 

 

 

 

П осл е построен ия

д ерева

вычисл яет ся

сред н ее зн а чен ие

ра сстоян ий

м еж д у его вершин а м и

 

 

 

 

 

 

 

 

 

 

 

 

1

 

n

 

 

 

 

ρ

=

 

å ρk ,

(2.15)

 

 

 

 

 

 

 

 

n −1 k =1

 

 

 

которое прин им а ется за пороговое.

 

 

 

 

В 3-ей строке ищ у тся м а ксим у м ы, т.е. т а кие ра сстоян ия, д л я которых

выпол н яет ся н ера вен ст во

 

 

 

 

 

 

ρ 1 < ρ

<kρk +1. k

(2.16)

 

 

В се н а йд ен н ые м а ксим а л ь н ые зн а чен ия сра вн ива ют ся с пороговым

 

.

ρ

Е сл и он и превосход ят и

пороговое, то прин им а ет ся решен ие обу д а л ен ии

соответству ющ его ребра

из построен н ого д ерева . О ст а вшиеся посл е этой

процед у ры связн ые ф ра гм ен ты д ерева обра зу ют кл а ссы. П еречен ь объектов ка ж д ого кл а сса опред ел яется по 2-ой строке, н а ход ящ ейся по построен ию во вза им н оод н озн а чн ом соответствии с 3-ей строкой.

П ол у ча ем ые с пом ощ ь ю кл а стер-процед у р резу л ь та ты н е обл а д а ют д оста точн ой у стойчивость ю в том см ысл е, что выборд ру гой ф орм у л ы д л я ра счета ра сстоян ий ил и н езн а чит ел ь н ые изм ен ен ия пра вил кл а ссиф ика ции м огу т привести к ра зн ым резу л ь та та м . П оэтом у пред ста вл яет ин терес сра в-

н ит ел ь н ый а н а л из ка чества

ра збиен ий, пол у ча ем ых с пом ощ ь ю ра зл ичн ых

способов. С эт ой цел ь ю ввод ят пон ят ие фун кци он ала Q(S ) качества раз-

би ен и я S , опред ел ен н ого н а м н ож естве всех возм ож н ых ра збиен ий. Т огд а

н а ил у чш им

ра збиен ием S

счита ется та кое,

при котором

д остига ется экс-

трем у м

та кого

ф у н кцион а л а . Ра ссм от рим

н а ибол ее ра спростра н ен н ые

ф у н кцион а л ы ка чества ра збиен ия.

 

 

 

 

 

 

ρ(xi , xk ) в

П у сть

д л я опред ел ен ия степен и сход ст ва

выбра н а м етрика

 

простра н стве X и

= ( 1

2 K,, Sm,)Sн SекотороеS

ф иксирова н н ое ра збиен ие

объектов

1

2

K,, xn ,. xТ огдx а м ож н о за писа т ь

сл ед у ющ ие ф у н кцион а л ы ка -

чества ра збиен ия:

 

 

 

 

 

 

 

 

 

§

су м м а вн у трикл а ссовыхд исперсий

 

 

 

 

 

 

 

 

 

 

 

1(

)= åm

åρ 2 (

i , xk )x;

Q

S(2.17)

 

 

 

 

 

 

k =1xi Sk

 

 

 

 

 

 

§

су м м а

попа рн ых вн у трикл а ссовых ра сст оян ий м еж д у

 

эл ем ен т а м и

 

кл а ссов

 

2 (

) = åm

å ρ(

i , x j )x.

Q

S (2.18)

 

 

 

 

 

 

k =1

, Sxki

xj

 

 

 

 

Э ти крит ерии позвол яют в цел ом оцен ить

ка чество пол у чен н ого ва риа н т а

кл а ссиф ика ции и,

кром е того, с их пом ощ ь ю мож н о у точн ить

кл а ссиф ика -

цию по д ереву

 

кра тча йших ра сстоян ий, перера спред ел ив

м еж

д у кл а сса м и

вершин ы, присоед ин ен н ые к д ереву

посл ед н им и.

 

 

 

 

2.2. Реш ени е ти по во й задачи

З адание 2.2.1. В ком м ерческий ба н к О А О «Д ру г» обра тил ись ру ково- д ит ел и 12 кру пн ых пред приятий г. Ворон еж а с прось бой о пред оста вл ен ии кред ит а . Специа л исты кред ит н ого от д ел а ба н ка с цел ь ю прин ятия н а д еж н о- го решен ия (т .е. решен ия, га ра н тиру ющ его возвра т кред ита ) по у д овл етворен ию эт их прось брешил и в перву ю очеред ь попыта ть ся ра зд ел ить пред - приятия н а гру ппы в соответ ствии с ихф ин а н совым состоян ием . В ка честве ф а кторов, опред ел яющ их ф ин а н совое состоян ие пред прият ий, был и выбра - н ы н еоборот н ые а ктивы ( x1), оборот н ые а ктивы ( x2 ), собст вен н ый ка пита л

( x3), д ол госрочн ые обяза тел ь ства ( x4 ), кра ткосрочн ые обяза тел ь ства ( x5 ), выру чка от реа л иза ции ( x6 ), себестоим ость ( x7 ), чист а я прибыл ь ( x8). З н а -

чен ия эт их пока за тел ей привед ен ы в та бл. 2.2.1. Осу щ ествите кл а стериза - цию пред приятий и сд ел а йте вывод ы о цел есообра зн ост и пред ст а вл ен ия кред ит а той ил и ин ой обра зова вшейся гру ппе.

Табли ца 2.2.1

П ок азат е ли, харак т еризую щ ие де ят е льност ь пре дприят ий, обрат ивш ихся вба нк за к ре дит ом

П ред -

x1

x2

x3

x4

x5

x6

x7

x8

приятие

1

5116652

1655737

4912417

619623

1240349

6391468

5820259

532581

2

1226241

1224983

1457028

93921

900275

5027062

3462529

499271

3

5851307

1460596

421161

395121

1295621

4489673

2291589

67368

4

86188

840198

93900

604792

227694

141282

122932

10

5

213652

289893

187876

138430

177239

474607

439172

8238

6

292249

410349

44432

14565

643601

684336

636529

-36067

7

107355

265899

132056

7656

233542

293423

302575

110

8

155221

797983

74255

860

878949

244337

249286

-133140

9

2852

69444

-27284

913

98667

173460

126278

-27697

10

292001

130363

129216

155051

138097

357466

312348

-5967

11

659633

1295344

132248

1650653

1172076

1671660

1626270

122137

12

170298

666081

616076

582

219721

1002735

807602

117997

 

 

 

 

 

 

 

 

 

2.2.1.1. Решен и е с пом ощью MS Excel

1.Ввод исход н ыхд а н н ых.

2.Н орм ирова н ие пока за тел ей по ф орм у л е (2.3) и оф орм л ен ие резу л ь т а - тов в вид е та бл. 2.2.2.

Табли ца 2.2.2

Нормирова нные пок азат е лиде ят е льност ипре дприят ий

 

 

 

 

 

 

 

 

 

П ред -

xн

xн

xн

xн

xн

xн

xн

xн

приятие

1

2

3

4

5

6

7

8

-1-

-2-

-3-

-4-

-5-

-6-

-7-

-8-

-9-

1

1

1

1

0,3752

0,9538

1

1

1

2

0,2092

0,7285

0,3005

0,0566

0,6697

0,7817

0,5862

0,9500