Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Учебное пособие по ТСиСА

.pdf
Скачиваний:
54
Добавлен:
02.04.2015
Размер:
5.34 Mб
Скачать

буют, как правило, относительной независимости частных составляющих.

Следовательно, в основу формирования комплексного показателя, оценивающего организацию структуры, формализованной графом, должен быть положен анализ и устранение на основе этого анализа взаимовлияния (коррелированности) частных показателей искусственными математическими способами, с целью получения наиболее объективной оценки значимости и вклада каждого показателя в характеристику организации структуры.

Таким образом, имеется множество признаков, которые в своей совокупности определяют некоторое результирующее свойство. Необходимо по проявлению этих признаков установить силу их влияния на рассматриваемое свойство независимо от влияния друг на друга. Данная общая постановка типична для задач факторного анализа, в котором, при помощи методов многомерных статистических исследований, строятся аналитические зависимости для результирующего признака от предполагаемых значащих факторов. Для факторного анализа основных показателей топологических свойств наиболее целесообразно использовать метод главных компонент (МГК), вследствие того, что этот метод обладает рядом существенных достоинств, к основным из которых относятся:

обнаружение скрытых, но объективно существующих закономерностей, обуславливающих взаимовлияние факторов;

описание исследуемого свойства числом главных компонент, значительно меньшим, чем число исходных признаков;

выделение главных компонент, которые содержат в среднем больше информации, чем отдельные признаки;

выявление и изучение стохастических связей признаков с главными компонентами, что позволяет определять исходные признаки, наиболее связанные с найденными главными компонентами;

линейность и некоррелированность главных компонент. Основная идея МГК состоит в переходе к новой системе ко-

ординат, которая совпадает с главными осями корреляционного эллипса (если, например, рассматривать два признака), и оценке важности, информативности каждой из новых переменных - главных компонент.

В данном случае формирование исходной матрицы для построения уравнений главных компонент основано на моделировании определенной совокупности структур и расчете показателей топологических свойств для каждой из них. В качестве исходной была принята последовательная структура, граф которой показан на рис.4.4, а суть моделирования последующих структур заключалась в добавлении случайным образом (в данном случае равновероятным) нового ребра в предшествующий граф.

Следовательно, для n=10 количество возможных графов составило (для одной реализации) n(n-1)/2-(n-1)+1=37.

1

2

. . .

n

Рис. 4.4. Граф последовательной структуры

Если {X, Y, Z, ...} множество признаков размерностью k, которому соответствует множество их значений, то на основе исходной информационной матрицы можно определить парные коэффициенты корреляции rxy, rxz, ..., ryz, ... и построить корреляционную матрицу Mr. Предполагая, что уравнения главных компонент линейны, т.е.

λ11X+β1Y+γ1Z+...

λ22X+β2Y+γ2Z+...

.................................

λkkX+βkY+γkZ+...

где λ1, λ2, ..., λn главные компоненты.

При этом коэффициенты αi, βi, γi, ... находятся методом собственных значений и собственных векторов корреляционной матрицы. Для этого необходимо решить характеристическое уравнение:

Mr=0,

 

1 − λ1

rxy

rxz

...

 

 

 

 

 

ryx

1 − λ2

ryz

...

 

 

 

rzx

rzy

1 − λ3

...

 

= 0,

 

...

...

...

...

 

 

 

...

...

...

1 − λk

 

 

которое можно записать иначе:

λk - Iλk-1 - Jλk-2 - ... + Hλ - P = 0,

где I = λ

λ

...λ

k-1

+ λ λ

...λ

k

+ ...;

1

2

 

 

2 3

 

 

J = λ1λ2...λk-2 + λ2λ3...λk-1 + ...;

H = λ1 + λ2 + ... + λk;

 

 

P = λ1 λ2

... λk.

 

 

 

Каждому λi соответствует собственный вектор: уравнение главной компоненты. При этом собственные векторы должны быть ортнормированы, т.е.

αi2 + βi2 + γi2 = 1.

Важно отметить, что если λ12=...=λk, то нет никакого преимущества любых новых осей по сравнению с осями X, Y, Z,

..., т.к. информативность новых осей не увеличилась. Из этого следует, что применение МГК не имеет смысла в силу одинако-

вого влияния исходных признаков на результирующее свойство. Следовательно, необходима проверка гипотезы

H0: l1=l2=...=lk,

при альтернативной

H1: не все li равны.

В данном случае используется статистика, подчиняющаяся c2- распределению:

c2 = -(k-1)ln½Mr½

с числом степеней свободы

h = k( k − 1 ) , 2

где k – число исходных признаков.

Данная статистика оценивает значимость всей корреляционной матрицы, а не отдельных коэффициентов корреляции.

Если гипотеза H0 отвергается, то информативность, значимость i-ой главной компоненты определиться из выражения:

Λi = λi 100. k

С учетом изложенного, основные этапы анализа показателей топологических свойств методом главных компонент приведены на рис.4.5.

Формирование исходной матрицы показателей

топологических свойств

Построение корреляционной матрицы Mr

Вычисление собственных значений и собственных векторов корреляционной матрицы

Проверка гипотезы о равенстве собственных значений

Формирование матрицы факторных нагрузок

Построение уравнений главных компонент

Рис. 4.5. Этапы анализа показателей топологических свойств МГК

Рассчитав значения показателей топологических свойств для каждой вновь полученной структуры, проанализировав сформированное таким образом множество этих значений МГК, определена матрица факторных нагрузок, которая имеет следующий вид:

 

 

0,977

0,041

− 0,087

0,132

0,049

0,118

0,018

0,000

 

 

 

 

 

 

 

 

 

 

− 0,647

− 0,209

0,711

0,090

0,147

− 0,033

0,001

0,000

 

 

 

 

 

 

0,977

0,041

− 0,087

0,132

0,049

0,118

0,018

0,000

 

 

 

 

M f

=

0,688

0,445

− 0,267

0,455

0,215

− 0,053

− 0,007

0,000

 

 

 

.

0,085

0,961

0,113

− 0,199

0,094

0,046

− 0,059

0,000

 

 

 

 

 

 

 

 

 

 

 

0,008

0,979

0,089

− 0,118

− 0,063

− 0,105

0,057

0,000

 

 

 

 

 

 

− 0.836

0,361

0,185

0,307

− 0,066

0,187

0,020

0,000

 

 

 

 

 

 

− 0,882

− 0,162

− 0,070

− 0,147

0,450

0,014

0,022

0,007

 

 

 

 

В этой матрице каждый столбец соответствует новой переменной - главной компоненте, а строка содержит набор коэффициентов, с которыми показатели топологических свойств входят в ту или иную компоненту. При этом первая строка соответствует относительной связности, вторая - неравномерности распределения ребер в графе, третья - избыточности ребер, четвертая - относительной компактности, пятая - однородности вершин, шестая - однородности ребер, седьмая - ацикличности и восьмая - централизации.

Кроме того, результатом расчетов является также информативность главных компонент, оцениваемая по вкладу в общую дисперсию. Вклад каждой компоненты в общую дисперсию показан на рис.4.6. Так, для 1-й главной компоненты информативность составляет около 92%, что позволяет исключить остальные компоненты из дальнейшего рассмотрения.

Проценты

100

90

80

70

60

50

40

30

20

10

0

1-я

2-я 3-я

4-я

5-я

6-я

7-я

8-я

Компоненты

Рис. 4.6. Инф ормативность главных компонент

Таким образо м, отнормировав коэффициенты первого столбца матрицы фа кторных нагрузок, получен комплексный показатель организации структуры, представленной графом

Φ

о

= 0,192C + 0,127(1− ε 2 ) + 0,192R + 0,135Q

+ 0,017K э + 0,009K св +

(4.23)

 

отн

о

о

 

 

+ 0,164(1−ψ () ) + 0,173 (1− δ ).

 

 

 

 

 

 

 

Весовые коэфф ициенты при показателях топологических свойств в выражени и (4.23) имеют смысл их «чистой» значимости и влияния на результирующее свойство - органи зацию структуры. Как видно из выражения (4.23) организация структуры практически полнос тью определяется ее целостностью и радиальностью, что позв оляет существенно упростить решение задач синтеза требуемой структуры.

StriT

4.4. Идентификация структур

Задачу идентификации структур можно сформулировать, как задачу оптимизации множества расстояний в многомерном пространстве показателей топологических свойств. При этом каждая структура характеризуется числовым набором этих показателей, а для каждой типовой структуры они могут быть найдены, как показано в табл.П.1 (см. Прил. 1), по количеству элементов (вершин графа) идентифицируемой структуры.

Следовательно, любая структура представляет собой точку в пространстве показателей топологических свойств. Тогда

min{ϖ (Str,StrT )}

(4.24)

i

можно считать критерием идентификации, в котором ω - метрика пространства, Str - идентифицируемая структура, а - i-я типо-

вая структура.

При построении метрики данного пространства, необходимо учитывать тот факт, что большинство показателей топологических свойств коррелированно. Поэтому наиболее целесообразно, в данном случае, использовать корреляционную метрику, которая имеет следующий вид:

 

1

k

k

 

 

 

 

ω (Str , Str T ) =

∑ ∑

 

(1

 

rij

 

)(xij − xijT )

,

(4.25)

 

 

 

 

2 i =1

j =1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где xij , xijT

rij

лей.

- значения показателей топологических свойств идентифицируемой и типовой структур соответственно;

- коэффициент корреляции i-го и j-го показате-

Для правомерности использования метрики (4.25), при i=j естественно положить rij = 0. Остальные коэффициенты корреля-

ции сведены в корреляционную матрицу основных показателей топологических свойств, показанную в табл.4.1.

Для экспресс оценки структуры, можно воспользоваться приближенными расчетами, основанными на метрике Евклида для двух наименее зависимых показателей. Из табл.4.1 видно, что

min{rij } = 0,024 для Qотн и Kосв . Кроме того, этот коэффициент кор-

i , j

реляции (как и некоторые другие), по критерию Стьюдента является незначимым. Тогда выражение (4.25) можно представить в другом виде:

 

 

 

1

 

 

ω (Str, Str T ) = (Qотн − QотнТ

) 2 + ( Kосв

− Kосв Т

) 2

 

.

(4.26)

2