Кластерный анализ
.pdfФ е де рал ь н ое аге н т с т во по образован ию РФ В орон е ж с кий гос ударс т ве н н ы й ун иве рс ит е т
В .В . Давни с, В .И . Ти ня к о ва, С .И . М о к ш и на, А .И . А лек сеева
КО М П Ь Ю ТЕРНЫ Е РЕШ ЕНИ Я ЗА Д А Ч
МНО ГО М ЕРНО Й С ТА ТИ С ТИ К И
ЧА С ТЬ 1. К ЛА С ТЕРНЫ Й И ДИ С К РИ М И НА НТНЫ Й А НА ЛИ З
П О С О Б И Е по специ ально сти 080116 (061800)
«М атемати ческ и е мето ды вэк о но ми к е»
ОП Д .Р.10
Ворон е ж – 2005
У тверж д ен о н а у чн о-метод ическим советом экон омического ф а ку л ь тета , протокол № 2 от 26.02.2005г.
П особие под готовл ен о н а ка фед ре ин ф орма цион н ых техн ол огий и ма тема тических метод ов в экон омике экон омического фа ку л ь тета Ворон еж ского госу д а рствен н ого у н иверситета . Рекомен д у ется д л я сту - д ен тов, обу ча ющ ихся по специа л ь н ости 080116 (061800) –«М а тема - тические метод ы в экон омике», а та кж е д л я сту д ен тов д ру гих специ- а л ь н остей, осу щ ествл яющ их ста тистические компь ютерн ые иссл ед о- ва н ия при под готовке ку рсовых и выпу скн ых ква л иф ика цион н ых ра - бот.
ПРЕД И С ЛО В И Е
Прикл а д н ые м етод ы м н огом ерн ой ста тистики широко испол ь зу ются в
современ н ых экон ом ических иссл ед ова н иях. О н и позвол яют оцен ива ть н а -
д еж н ость сред н их ха ра ктеристик и ра зл ичий м еж |
д у |
н им и, у ст а н а вл ива т ь |
за кон ом ерн ост и и обосн ова н н о им и пол ь зова ть ся |
в |
а н а л итических и про- |
гн озн ых ра счет а х, осу щ ествл ять м н огом ерн ые кл а ссиф ика ции и а н а л изирова ть их, пред ста вл ят ь резу л ь т а т ы иссл ед ова н ий в у д обн ой та бл ичн ой и гра - ф ической ф орм а х.
В озмож н ости соврем ен н ой ком пь ютерн ой техн ики обра ба тыва ть ко- л осса л ь н ые объем ы ин ф орм а ции способствова л и ра звитию програ м м н ого обеспечен ия, ориен т ирова н н ого н а под д ерж ку ста т ист ических м етод ов а н а - л иза . В н а ст оящ ее врем я ра зра бота н о д оста точн о бол ь шое числ о ком пь ю- терн ых па кетов, реа л изу ющ их эти м етод ы, н а прим ер, STATISTICA, STATA, SPSS, EViews, SAS и д р. Их гра м отн ое испол ь зова н ие требу ет, с од н ой сторон ы, д оста точн о гл у боких зн а н ий по т еории м н огом ерн ого ст а - тистического а н а л иза , а с д ру гой –вл а д ен ия н а выка м и пра ктической ра боты в сред е са м их па кет ов. Без н а выков н ел ь зя осу щ ествить ра счеты, без
зн а н ий –сод ерж а тел ь н о проин т ерпрет ирова т ь |
резу л ь та ты ста тистического |
а н а л иза . |
|
В д а н н ом пособии пред прин ят ы у сил ия |
по решен ию обеих за д а ча х. |
О н о сод ерж ит н а ча л ь н ые свед ен ия о па кете STATISTICA, позвол яющ ие освоить осн овн ые прием ы ра бот ы с м а ссива м и д а н н ых, под л еж а щ их ста тист ической обра ботке, а та кж е н а у чить ся пра ктическом у испол ь зова н ию д ву хм од у л ей па кета –кл а стерн ого и д искрим ин а н т н ого а н а л иза .
О своен ие ка ж д ого из м од у л ей пред у см а трива ет выпол н ен ие т иповой за д а чи с у ка за н ием всех пу н ктов м ен ю, привод ящ их к ее решен ию. Резу л ь - та ты ра счетов ин терпретиру ются с т очки зрен ия сод ерж а н ия реша ем ой за - д а чи и сра вн ива ются с резу л ь та та м и а н а л огичн ых ра счетов, провед ен н ых в
MS Excel.
С цел ь ю проверки зн а н ий и за крепл ен ия н а выков в пособии привед ен о д оста точн ое кол ичество за д а н ий д л я са м остоятел ь н ой ра боты.
2.К ЛА С ТЕРНЫ Й А НА Л И З
2.1.Тео рети ческ и е о сно вы
К ластерн ы й ан али з пред ста вл яет собой ста тистические м етод ы, испол ь зу ем ые д л я кл а ссиф ика ции м н огом ерн ых объектов ил и событий в от- н осител ь н о од н ород н ые гру ппы, которые н а зыва ют кл а стера м и. О бъекты в
ка ж д ом |
кл а ст ере д ол ж н ы быт ь похож и д ру г н а |
д ру га |
в бол ь ш ей ст епен и, |
|||||||
чем н а |
объект ы д ру гих кл а ссов, и отл ича т ь ся от объект ов д ру гих кл а ст еров |
|||||||||
сил ь н ее, чем от объектов собствен н ого кл а сса . |
К л а стерн ый а н а л из та кж е |
|||||||||
н а зыва ют кл а ссиф ика цион н ым а н а л изом ил и числ ен н ой т а ксон ом ией. |
||||||||||
В экон ом ике он испол ь зу ется д л я д остиж |
ен ия |
сл ед у ющ их цел ей: сег- |
||||||||
м ен т а ции рын ка , изу чен ия повед ен ия поку па тел ей, |
опред ел ен ия кон ку рен - |
|||||||||
тоспособн ост и н ового това ра , сокра щ ен ия ра зм ерн ости д а н н ыхи д р. |
||||||||||
О бычн о в за д а ча х кл а ст ерн ого а н а л иза исход н ые д а н н ые пред ст а вл яют |
||||||||||
в ф орм е прям оу гол ь н ой та бл ицы, |
ка ж д а я строка |
которой пред ста вл яет ре- |
||||||||
зу л ь т а т изм ерен ия p призн а ков н а соответству ющ ем объект е: |
|
|
||||||||
|
æ |
L x |
öx |
|
x |
|
11 |
|
||
|
ç |
L x |
1p ÷ |
|
x |
12 |
|
|||
|
X = ç |
|
x |
|
22 |
21 |
(2.1) |
|||
|
|
2 p ÷, |
|
|
||||||
|
ç |
|
M |
÷ M L |
|
M |
|
|
||
|
ç |
|
|
÷ |
|
|
|
|
|
|
|
ç |
|
|
÷ |
|
|
|
|
|
|
|
è 1 |
2 L xnp øx n x n |
|
|
||||||
гд е n–числ о объектов, под л еж а щ ихкл а ссиф ика ции. |
|
|
|
|
||||||
Ч исл овые зн а чен ия призн а ков, вход ящ их в м а трицу , могу т |
соответст- |
|||||||||
вова ть |
трем типа м перем ен н ых: |
ка чествен н ым , |
ра н говым и |
кол ичествен - |
н ым . К ачествен н ы е перемен н ы е , ка к пра вил о, прин им а ют д ва и бол ее зн а -
чен ий, кот орым , хотя и м ож |
н о поста вить в соот вет ствие н екоторые числ а , |
|
н о эти числ а н е бу д у т отра ж |
а ть ка ку ю-л ибо у поряд очен н ость зн а чен ий ка - |
|
чествен н ых перем ен н ых. И это н у ж н о у читыва ть |
при опред ел ен ии бл изо- |
|
ст и. З н а чен ия ран говы х перем ен н ы х , в отл ичие от |
ка чест вен н ых, у поряд о- |
чен ы. Их м ож н о прон у м ерова т ь н а ту ра л ь н ым и числ а м и. О д н а ко а риф м етические опера ции н а д этим и числ а м и н е им еют см ысл а . К оли чествен н ы е перем ен н ы е обл а д а ют свойством у поряд очен н ост и, и н а д н им и, в отл ичие от д ру гих, м ож н о привод ит ь а риф м ет ические опера ции.
Ж ел а тел ь н о, чтобы вся та бл ица исход н ых д а н н ых соот вет ствова л а од - н ом у типу перем ен н ых. Е сл и это н е та к, то ра зн ые т ипы перем ен н ых ст а - ра ются свести к ка ком у -то од н ом у типу перем ен н ых. Са м ый прост ой явл я- ет ся процед у ра свед ен ия к ка чествен н ым перем ен н ым . Су ть этой процед у - ры в сл ед у ющ ем . Е сл и есть кол ичест вен н ые д а н н ые, то он и сн а ча л а свод ятся к ра н говым, д л я чего обл а сть зн а чен ий кол ичествен н ых перем ен н ых ра з- бива ет ся н а ин терва л ы, которые н у м еру ются числ а м и н а ту ра л ь н ого ряд а . Ра н говые перем ен н ые м ож н о счит а ть ка чествен н ым и, есл и н е у чит ыва т ь у поряд очен н ость их зн а чен ий. В свою очеред ь , ка чествен н ые перем ен н ые
перевод ят ся |
в д ихотом ические по |
сл ед у ющ ем у |
пра вил у . |
К а ж д ое из воз- |
|||||||||
м ож н ых зн а чен ий ка чествен н ой перем ен н ой за м ен яется |
н а |
1, есл и ка чест- |
|||||||||||
вен н а я перем ен н а я прин ял а это зн а чен ие, и 0 –в противн ом сл у ча е. |
|
||||||||||||
В т ех сл у ча ях, когд а все пока за тел и кол ичествен н ые, |
ча сто возн ика ет |
||||||||||||
пробл ем а их н орм ирова н ия, |
поскол ь ку ра зл ичие в ед ин ица х изм ерен ия д е- |
||||||||||||
л а ет эти пока за т ел и н есопост а вим ым и. Т а к, |
н а прим ер, |
при кл а ссиф ика ции |
|||||||||||
пром ышл ен н ых пред прият ий по |
резу л ь т а та м |
ф ин а н сово-хозяйствен н ой |
|||||||||||
д еятел ь н ост и в описа н ие вкл юча ются та кие пока за тел и, ка к прибыл ь , |
рен - |
||||||||||||
та бел ь н ость , |
себестоим ость , коэф ф ициен т т еку щ ей л иквид н ости и т.д . |
П о |
|||||||||||
прибыл и пред прият ия м огу т ра зл ича ть ся н а |
д есятки и сотн и тысяч ед ин иц, |
||||||||||||
а по рен т а бел ь н ости –н а ед ин ицы, а то и д есятые д ол и ед ин ицы. |
Т а ка я н е- |
||||||||||||
сопост а вим ость пра ктически перечеркива ет |
ид ею м н огом ерн ой кл а ссиф и- |
||||||||||||
ка ции, та к ка к он а |
а втом а т ически бу д ет осу щ ествл ять ся по бол ее м а сшт а б- |
||||||||||||
н ом у |
пока за тел ю. |
П оэтом у |
процед у ре н епосред ст вен н ого ра зн есен ия |
объ- |
|||||||||
ектов |
по кл а сса м |
д ол ж н а |
пред шествова ть |
процед у ра |
привед ен ия |
всех |
|||||||
пока за тел ей |
к |
сопоста вим ом у |
вид у , |
котору ю |
прин ято |
н а зыва ть |
|||||||
н ормиВ рованпр ктическихи е м . |
ра счет а х ча щ е д ру гих испол ь зу ются |
д ва |
под ход а к |
н орм ирова н ию. О д ин изн ихсвяза н с ид еей ста тистической ста н д а ртиза ции, осу щ ествл яем ой по ф орм у л е
|
xн |
= |
x − x j |
, |
ij |
(2.2) |
|
|
|
||||
|
ij |
|
σ j |
|
|
|
|
|
|
|
|
||
гд е xн –н орм ирова н н ый |
j -ый пока за т ел ь i -го объект а ; |
|
||||
ij |
|
|
|
|
|
|
xij –зн а чен ие j -го пока за тел я i -го объекта ; |
|
|||||
x j –сред н ее зн а чен ие |
j -го пока за т ел я по всем у м н ож еству |
кл а ссиф и- |
||||
циру ем ыхобъектов; |
|
|
|
|
|
|
σ j –сред н еква д ра т ическое откл он ен ие |
j -го пока за т ел я. |
|
П ри испол ь зова н ии т а кой н орм ировки все пока за тел и, описыва ющ ие кл а ссиф ициру ем ый объект, привод ят ся к вид у , когд а сред н ее ра вн о 0, а ра з- брос вокру г сред н его ра вен 1.
В торой |
под ход пред у см а трива ет преобра зова н ие пока за т ел ей пу т ем |
|||||||||
отобра ж |
ен ия ин т ерва л а |
их возм ож н ых зн а чен ий н а |
пром еж у ток [ 01;]. Э т о |
|||||||
осу щ ествл яется с пом ощ ь ю ф орм у л ы |
− xmin |
|
|
|
||||||
|
|
|
|
|
|
x |
|
|
|
|
|
|
|
|
xн |
= |
|
j |
,ij |
|
(2.3) |
|
|
|
|
|
|
|
||||
|
|
|
|
ij |
|
x j |
− xminj |
|
max |
|
|
|
|
|
|
|
|
|
|||
min |
= |
xij }; |
max |
|
|
xij }. { |
max |
|
|
|
гд е x j |
|
{x j min= |
|
i |
|
|
||||
|
|
|
i |
|
|
|
|
|
|
Т а ким обра зом , с пом ощ ь ю н орм ирова н ия у д а ет ся изба вить ся от н еж е- л а тел ь н ого вл иян ия ра зн ом а сшта бн ости пока за тел ей н а степен ь схож ест и м еж д у объект а м и. Са м у схож есть ча щ е всего опред ел яют л ибо с пом ощ ь ю
н екоторой ф у н кции r(xi , xk ), ха ра ктеризу ющ ей бл изость |
i -го и |
k -го объ- |
|
|||||||||||||||||||
ектов, л ибо по вел ичин е ра сстоян ия ρ(xi , xk ) |
м еж |
д у |
объекта м и, |
им ея вви- |
|
|||||||||||||||||
д у , что ка ж |
д ый объект |
м ож ет |
быть |
пред ст а вл ен |
точкой p -м ерн ого про- |
|
||||||||||||||||
ст ра н ства . |
Д л я |
ф у н кции |
схож ести |
|
r(xi , xk ) |
д ол ж |
н ы выпол н ять ся у сл овия |
|
||||||||||||||
сим м етрии, т .е. |
r( |
, |
) = r( |
, x |
i |
),xи у xсл овиеx м а ксим а л ь н ого сход ства с |
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
k |
i |
k |
|
|
|
|
|
|
|
|
|
|
са м им собой r( |
i |
i ) = |
|
r( |
i , x,k )x. Д л maxя ρ(xi , xk ) |
эти у сл овия выпол н я- |
|
|||||||||||||||
ют ся а втом а т ически. |
k |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
В ыборм еры сход ст ва явл яется од н им из у зл овых м ом ен тов в за д а ча х |
|
|||||||||||||||||||||
кл а ссиф ика ции, |
та к ка к от н ее, |
в осн овн ом , |
за висит при д а н н ом а л горит м е |
|
||||||||||||||||||
кл а ссиф ика ции окон ча тел ь н ый ва риа н т |
ра збиен ия объектов |
н а |
кл а ссы. В |
|
||||||||||||||||||
ка ж д ом кон кретн ом |
сл у ча е этот |
выбор осу щ ест вл яет ся |
в за висим ост и от |
|
||||||||||||||||||
цел и иссл ед ова н ия и природ ы са м их кл а ссиф ициру ем ых объектов. В са м ом |
|
|||||||||||||||||||||
общ ем сл у ча е, когд а |
м еж |
д у пока за т ел ям и объектов су щ еству ет вза им освязь |
|
|||||||||||||||||||
и, кром е того, он и им еют ра зл ичн у ю степен ь |
зн а чим ост и д л я провод им ой |
|
||||||||||||||||||||
кл а ссиф ика ции, испол ь зу ют обобщ ен н ое (взвеш ен н ое) расстоян и е М ахала- |
|
|||||||||||||||||||||
н оби са |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ρ |
|
|
|
|
|
|
|
k |
T |
−1 |
i |
|
|
|
T |
|
|
|
−(2x.4)) x |
x( x )( , |
|
|
|
|
|
|
|
|
|
i |
|
ik− xk )Λx , Σ= Λ( |
||||||||||||
гд е Σ−1 –кова риа цион н а я м а трица |
ген ера л ь н ой совоку пн ост и, из которой |
|
||||||||||||||||||||
извл ечен ы н а бл юд ен ия (объект ы, под л еж а щ ие кл а ссиф ика ции); |
|
|
||||||||||||||||||||
Λ –н екотора я сим м етрическа я |
н еотрица тел ь н о-опред ел ен н а я м а трица |
|
||||||||||||||||||||
весовыхкоэф ф ициен тов (ка к пра вил о, это м а трица д иа гон а л ь н а я). |
|
|||||||||||||||||||||
В о м н огих ситу а циях д л я опред ел ен ия сход ства |
м еж |
д у |
объект а м и ис- |
|
||||||||||||||||||
пол ь зу ют ся ча ст н ые сл у ча и ра сстоян ия М а ха л а н обиса . Т а к, при ед ин ичн ых |
|
|||||||||||||||||||||
Λи Σ из(2.4) пол у ча ется обычн ое Евкли дово расстоян и е |
|
|
|
|
||||||||||||||||||
|
|
|
ρ(x , x ) = |
|
|
åp (x |
− xkj )2. |
|
ij |
|
|
i |
k |
(2.5) |
|
|||||||
|
|
|
|
|
|
|
|
|
j =1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
О пред ел ят ь похож ест ь по этом у |
ра сстоян ию обычн о реком ен д у ет ся в тех |
|
||||||||||||||||||||
сл у ча ях, когд а : |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1) н а бл юд ен ия |
извл ечен ы |
из ген ера л ь н ых совоку пн ост ей, |
им еющ их |
|
||||||||||||||||||
м н огом ерн ое н орм а л ь н ое ра спред ел ен ие с д иа гон а л ь н ой кова риа цион н ой |
|
|||||||||||||||||||||
м а трицей, а все ком пон ен ты векторов н а бл юд ен ий xi , xk вза им н о н еза ви- |
|
|||||||||||||||||||||
сим ы и им еют од н у и ту |
ж е д исперсию; |
|
|
|
|
|
|
|
|
|
|
|
||||||||||
2) все ком пон ен т ы векторов н а бл юд ен ий xi , xk |
од ин а ково ва ж н ы д л я |
|
||||||||||||||||||||
кл а ссиф ика ции; |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3) ин ту итивн ое пред ст а вл ен ие о |
ст епен и |
схож ести |
м еж |
д у |
объекта м и |
|
||||||||||||||||
совпа д а ет с пон ят ием геом етрического ра сстоян ия м еж д у |
н им и в призн а ко- |
|
||||||||||||||||||||
вом простра н стве. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В сл у ча е, когд а Σ явл яется ед ин ичн ой м а т рицей, |
а Λ –д иа гон а л ь н ой, |
||||||||||||||||
сход ст во м еж |
д у |
объекта м и изм еряет ся вел ичин ой взвешен н ого Евкли дова |
|||||||||||||||
расстоян и я |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ρ(x , x )= |
p |
( |
|
|
− x w) |
2.x |
ij |
j |
i |
(2.6) |
|
|||
|
|
|
|
|
|
å |
|
|
|
kj |
|
|
k |
|
|||
|
|
|
|
|
|
j =1 |
|
|
|
|
|
|
|
|
|
|
|
Э та м ера |
схож |
ести прим ен яется в т ех сл у ча ях, когд а |
ка ж д ом у |
призн а ку |
xj |
||||||||||||
векторов |
н а бл юд ен ий приписыва ется |
н екоторый вес |
wj , пропорцион а л ь - |
||||||||||||||
н ый степен и ва ж |
н ост и j -го призн а ка |
в реша ем ой за д а че кл а ссиф ика ции. |
|||||||||||||||
|
|
|
|
p |
|
|
|
|
|
|
|
|
|
|
|
|
|
О бычн о |
0 ≤ wj ≤ 1 и å wj = 1. |
О пред ел ен ие весовых коэф ф ициен т ов, |
по |
||||||||||||||
|
|
|
j=1 |
|
|
|
|
|
|
|
|
|
|
|
|
||
су ти, явл яется са м остоят ел ь н ой за д а чей, решен ие которой, ча щ е всего, |
по- |
||||||||||||||||
ру ча ет ся эксперта м . |
|
|
|
|
|
|
|
|
|
|
|
|
|||||
Е сл и все призн а ки изм ерен ы в н ом ин а л ь н ой шка л е и за д а ются д ихото- |
|||||||||||||||||
м ическим и перем ен н ым и, т о степен ь |
схож ест и |
опред ел яет ся |
с пом ощ ь ю |
||||||||||||||
Хем м и н гово расстоян и я |
|
p |
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
ρ(x , x |
) = å |
|
x |
− xkj |
, |
|
ij |
i |
k |
(2.7) |
|
||
ра вн ого числ у |
н есовпа д ен ий. |
j=1 |
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
||||||
В н екоторых сл у ча ях исход н а я ин ф орма ция обобъекта х, |
под л еж а щ их |
||||||||||||||||
кл а ссиф ика ции, |
за д а ет ся н е призн а ковым простра н ст вом , а ква д ра тн ой м а т- |
||||||||||||||||
рицей R = (rik ), |
, = |
|
, хаi раk ктеризу ющ ей вза им н ые ра сстоян ия м еж д у |
||||||||||||||
, 1n |
|||||||||||||||||
объект а м и. Т огд а отпа д а ет н еобход им ость |
в испол ь зова н ии выш е ра ссмот- |
||||||||||||||||
рен н ыхра сстоян ий д л я опред ел ен ия меры сход ства м еж |
д у объекта м и. |
|
|||||||||||||||
Н а ибол ее ра спростра н ен н ым и а л горитм а м и кл а стерн ого а н а л иза явл я- |
|||||||||||||||||
ет ся иера рхические (д еревообра зн ые) |
процед у ры. О н и быва ют д ву х типов: |
||||||||||||||||
а гл ом ера т ивн ые и д ивизим н ые. |
В а гл ом ера тивн ых а л горитм а х н а ча л ь н ым |
явл яется ра збиен ие, состоящ ее из n - од н оэл ем ен тн ых кл а ссов, а кон ечн ым
–из од н ого кл а сса . В д ивизим н ых все н а оборот: н а ча л ь н ым явл яется од ин кл а сс, а кон ечн ым –n-од н оэл ем ен т н ыхкл а ссов.
П рин ицип, который пол ож ен в осн ову |
иера рхических а гл ом ера тивн ых |
(д ивизим н ых) а л горит мов, за кл юча ется в |
посл ед ова тел ь н ом объед ин ен ии |
(ра зд ел ен ии) гру пп эл ем ен тов сн а ча л а са м ых бл изких (д а л еких), а за тем все бол ее отд а л ен н ых (бл изких) д ру г от д ру га . Д л я реа л иза ции этого прин ципа н а ка ж д ом ша ге кл а ссиф ика ции требу ется построен ие м а трицы вза им н ых ра сстоян ий м еж д у объекта м и. Э то д ел а ет чрезвыча йн о гром озд кой вычис- л ит ел ь н у ю схем у , реа л изу ющ у ю д а н н ый под ход .
Бол ее эф ф ект ивн ым явл яется м етод кл а ссиф ика ции по д ереву кра т- ча йших ра сстоян ий, в котором оригин а л ь н а реш ен а пробл ем а пересчет а м а трицы вза им н ых ра сстоян ий. В этом м етод е посл ед ова т ел ь н о, ша г за ш а -
гом , строит ся связн ое дерево |
кратчай ши х расстоян и й . |
Ф орм а л ь н о про- |
||||||
цед у ра построен ия та кого д ерева выгл яд ит сл ед у ющ им обра зом . |
|
|||||||
Н а н у л евом ша ге ф орм иру ются три вектор-строки по пра вил а м : |
|
|||||||
1-а я строка –это строка |
из вза им н ых ра сстоян ий первого объекта |
со |
||||||
всем и оста л ь н ым и |
|
|
|
|
|
|
|
|
ρ1 = ρ(x , x |
|
), k = |
|
; |
(2.8) |
|
||
k |
1, n |
|
||||||
k |
1 |
|
|
|
|
|
|
|
2-а я ст рока –это строка , эл ем ен ты которой ра вн ы ра сст оян иям м еж |
д у |
|||||||
вершин а м и д ерева и ра спол ож |
ен н ые в т ой посл ед ова т ел ь н ости, в которой |
|||||||
вершин ы под соед ин ял ись к д ереву |
(н а |
н у л евом ша ге, когд а д ерево состоит |
||||||
изод н ой вершин ы, ед ин ствен н ым эл ем ен т ом этой строки явл яет ся 0) |
|
|||||||
R1 = {0}; |
(2.9) |
|
||||||
3-я строка –это строка из н ом еров вершин (объектов), ра спол ож ен н ых |
||||||||
в той посл ед ова т ел ь н ости, в |
которой строил ось д ерево |
кра тча йших ра с- |
ст оян ий (н а н у л евом ша ге в этой строке стоит т ол ь ко од ин эл ем ен т –н ом ер первой верш ин ы д ерева )
K1 = {}1 . |
(2.10) |
Н а i -ом ш а ге опред ел яется вершин а , бл иж |
а йша я к ф ра гм ен т у у ж е по- |
ст роен н ого д ерева пу тем вычисл ен ия м ин им а л ь н ого эл ем ен та строки {ρki−1},
k = Arg min {ρki−1}, |
k = |
|
. |
(2.11) |
1, n |
||||
ρkk¹0 |
|
|
|
|
Испол ь зу я н а йд ен н ый н ом ербл иж а йшей верш ин ы, ф орм иру ют ся три |
||||
вектор-ст роки по сл ед у ющ им пра вил а м : |
|
|
|
|
1-а я строка ф орм иру ется из м ин им а л ь н ых ра сстоян ий пу тем сопоста в- |
||||
л ен ия теку щ ей строки ра сстоян ий построен н ого ф ра гм ен та |
д ерева д о вер- |
шин , |
н е вкл ючен н ых в |
этот ф ра гм ен т, со строкой вза им н ых ра сст оян ий, |
||||||||
бл иж |
а йшего к ф ра гм ен ту эл ем ен т а k |
|
,k = |
|
|
|
|
|||
|
ρk = |
ρk |
ρ xk xk }, |
|
;, |
min{ (2.12) |
||||
|
1(, n |
|||||||||
2-а я строка попол н яет ся н ом ером объекта , бл иж |
а йшего к построен н ом у |
|||||||||
ф ра гм ен т у д ерева |
|
|
i-1 k K; |
|
|
|
|
|
||
|
|
i |
= |
K |
|
|
(2.13) |
|||
3-я ст рока попол н яется |
зн а чен ием |
ра сстоян ия |
от |
построен н ого ф ра г- |
||||||
м ен т а д ерева д о бл иж а йшей верш ин ы, |
котора я н а i -ом |
ша ге вкл юча ется в |
||||||||
соста в ф ра гм ен та д ерева |
|
|
|
|
|
|
|
|
|
|
|
|
Ri |
= Ri−1 ρk . |
|
|
|
|
(2.14) |
||
П роцесс прод ол ж а ется |
д о пол н ого исчерпа н ия |
всего м н ож |
ества кл а с- |
|||||||
сиф ициру ем ыхобъектов. |
|
|
|
|
|
|
|
|
||
П осл е построен ия |
д ерева |
вычисл яет ся |
сред н ее зн а чен ие |
ра сстоян ий |
||||||
м еж д у его вершин а м и |
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
n |
|
|
|
|
ρ |
= |
|
å ρk , |
(2.15) |
|
|
|
|
|
|
||||||
|
|
|
n −1 k =1 |
|
|
|
||
которое прин им а ется за пороговое. |
|
|
|
|
||||
В 3-ей строке ищ у тся м а ксим у м ы, т.е. т а кие ра сстоян ия, д л я которых |
||||||||
выпол н яет ся н ера вен ст во |
|
|
|
|
|
|
||
ρ −1 < ρ |
<kρk +1. k |
(2.16) |
|
|
||||
В се н а йд ен н ые м а ксим а л ь н ые зн а чен ия сра вн ива ют ся с пороговым |
|
. |
||||||
ρ |
Е сл и он и превосход ят и |
пороговое, то прин им а ет ся решен ие обу д а л ен ии |
соответству ющ его ребра |
из построен н ого д ерева . О ст а вшиеся посл е этой |
процед у ры связн ые ф ра гм ен ты д ерева обра зу ют кл а ссы. П еречен ь объектов ка ж д ого кл а сса опред ел яется по 2-ой строке, н а ход ящ ейся по построен ию во вза им н оод н озн а чн ом соответствии с 3-ей строкой.
П ол у ча ем ые с пом ощ ь ю кл а стер-процед у р резу л ь та ты н е обл а д а ют д оста точн ой у стойчивость ю в том см ысл е, что выборд ру гой ф орм у л ы д л я ра счета ра сстоян ий ил и н езн а чит ел ь н ые изм ен ен ия пра вил кл а ссиф ика ции м огу т привести к ра зн ым резу л ь та та м . П оэтом у пред ста вл яет ин терес сра в-
н ит ел ь н ый а н а л из ка чества |
ра збиен ий, пол у ча ем ых с пом ощ ь ю ра зл ичн ых |
||||||||||||
способов. С эт ой цел ь ю ввод ят пон ят ие фун кци он ала Q(S ) качества раз- |
|||||||||||||
би ен и я S , опред ел ен н ого н а м н ож естве всех возм ож н ых ра збиен ий. Т огд а |
|||||||||||||
н а ил у чш им |
ра збиен ием S |
счита ется та кое, |
при котором |
д остига ется экс- |
|||||||||
трем у м |
та кого |
ф у н кцион а л а . Ра ссм от рим |
н а ибол ее ра спростра н ен н ые |
||||||||||
ф у н кцион а л ы ка чества ра збиен ия. |
|
|
|
|
|
|
ρ(xi , xk ) в |
||||||
П у сть |
д л я опред ел ен ия степен и сход ст ва |
выбра н а м етрика |
|
||||||||||
простра н стве X и |
= ( 1 |
2 K,, Sm,)–Sн SекотороеS |
ф иксирова н н ое ра збиен ие |
||||||||||
объектов |
1 |
2 |
K,, xn ,. xТ огдx а м ож н о за писа т ь |
сл ед у ющ ие ф у н кцион а л ы ка - |
|||||||||
чества ра збиен ия: |
|
|
|
|
|
|
|
|
|
||||
§ |
су м м а вн у трикл а ссовыхд исперсий |
|
|
|
|
|
|
||||||
|
|
|
|
|
1( |
)= åm |
åρ 2 ( |
i , xk )x; |
Q |
S(2.17) |
|||
|
|
|
|
|
|
k =1xi Sk |
|
|
|
|
|
|
|
§ |
су м м а |
попа рн ых вн у трикл а ссовых ра сст оян ий м еж д у |
|
эл ем ен т а м и |
|||||||||
|
кл а ссов |
|
2 ( |
) = åm |
å ρ( |
i , x j )x. |
Q |
S (2.18) |
|||||
|
|
|
|
|
|
k =1 |
, Sxki |
xj |
|
|
|
|
|
Э ти крит ерии позвол яют в цел ом оцен ить |
ка чество пол у чен н ого ва риа н т а |
||||||||||||
кл а ссиф ика ции и, |
кром е того, с их пом ощ ь ю мож н о у точн ить |
кл а ссиф ика - |
|||||||||||
цию по д ереву |
|
кра тча йших ра сстоян ий, перера спред ел ив |
м еж |
д у кл а сса м и |
|||||||||
вершин ы, присоед ин ен н ые к д ереву |
посл ед н им и. |
|
|
|
|
2.2. Реш ени е ти по во й задачи
З адание 2.2.1. В ком м ерческий ба н к О А О «Д ру г» обра тил ись ру ково- д ит ел и 12 кру пн ых пред приятий г. Ворон еж а с прось бой о пред оста вл ен ии кред ит а . Специа л исты кред ит н ого от д ел а ба н ка с цел ь ю прин ятия н а д еж н о- го решен ия (т .е. решен ия, га ра н тиру ющ его возвра т кред ита ) по у д овл етворен ию эт их прось брешил и в перву ю очеред ь попыта ть ся ра зд ел ить пред - приятия н а гру ппы в соответ ствии с ихф ин а н совым состоян ием . В ка честве ф а кторов, опред ел яющ их ф ин а н совое состоян ие пред прият ий, был и выбра - н ы н еоборот н ые а ктивы ( x1), оборот н ые а ктивы ( x2 ), собст вен н ый ка пита л
( x3), д ол госрочн ые обяза тел ь ства ( x4 ), кра ткосрочн ые обяза тел ь ства ( x5 ), выру чка от реа л иза ции ( x6 ), себестоим ость ( x7 ), чист а я прибыл ь ( x8). З н а -
чен ия эт их пока за тел ей привед ен ы в та бл. 2.2.1. Осу щ ествите кл а стериза - цию пред приятий и сд ел а йте вывод ы о цел есообра зн ост и пред ст а вл ен ия кред ит а той ил и ин ой обра зова вшейся гру ппе.
Табли ца 2.2.1
П ок азат е ли, харак т еризую щ ие де ят е льност ь пре дприят ий, обрат ивш ихся вба нк за к ре дит ом
П ред - |
x1 |
x2 |
x3 |
x4 |
x5 |
x6 |
x7 |
x8 |
приятие |
||||||||
1 |
5116652 |
1655737 |
4912417 |
619623 |
1240349 |
6391468 |
5820259 |
532581 |
2 |
1226241 |
1224983 |
1457028 |
93921 |
900275 |
5027062 |
3462529 |
499271 |
3 |
5851307 |
1460596 |
421161 |
395121 |
1295621 |
4489673 |
2291589 |
67368 |
4 |
86188 |
840198 |
93900 |
604792 |
227694 |
141282 |
122932 |
10 |
5 |
213652 |
289893 |
187876 |
138430 |
177239 |
474607 |
439172 |
8238 |
6 |
292249 |
410349 |
44432 |
14565 |
643601 |
684336 |
636529 |
-36067 |
7 |
107355 |
265899 |
132056 |
7656 |
233542 |
293423 |
302575 |
110 |
8 |
155221 |
797983 |
74255 |
860 |
878949 |
244337 |
249286 |
-133140 |
9 |
2852 |
69444 |
-27284 |
913 |
98667 |
173460 |
126278 |
-27697 |
10 |
292001 |
130363 |
129216 |
155051 |
138097 |
357466 |
312348 |
-5967 |
11 |
659633 |
1295344 |
132248 |
1650653 |
1172076 |
1671660 |
1626270 |
122137 |
12 |
170298 |
666081 |
616076 |
582 |
219721 |
1002735 |
807602 |
117997 |
|
|
|
|
|
|
|
|
|
2.2.1.1. Решен и е с пом ощью MS Excel
1.Ввод исход н ыхд а н н ых.
2.Н орм ирова н ие пока за тел ей по ф орм у л е (2.3) и оф орм л ен ие резу л ь т а - тов в вид е та бл. 2.2.2.
Табли ца 2.2.2
Нормирова нные пок азат е лиде ят е льност ипре дприят ий
|
|
|
|
|
|
|
|
|
П ред - |
xн |
xн |
xн |
xн |
xн |
xн |
xн |
xн |
приятие |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
-1- |
-2- |
-3- |
-4- |
-5- |
-6- |
-7- |
-8- |
-9- |
1 |
1 |
1 |
1 |
0,3752 |
0,9538 |
1 |
1 |
1 |
2 |
0,2092 |
0,7285 |
0,3005 |
0,0566 |
0,6697 |
0,7817 |
0,5862 |
0,9500 |
|
|
|
|
|
|
|
|
|