Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Сербенюк С.Н. Применение математико-статистических моделей для картографирования географических комплексов

.pdf
Скачиваний:
8
Добавлен:
23.10.2023
Размер:
4.14 Mб
Скачать

©■ ^

Коэффициент ранговой корреляции по Кендаллу вычисляется

по формуле

 

2 S

N

 

|<г = я ( п - 1 )

Аналогично j г

находится кг

в пределах от - I до

+1. При вычислении „г обычно номера первой последова­

тельности располагают в возрастающем-порядке от I до а

и под каждым из них выписывают номер из второй последо­

вательности. Тогда все Хіц принимают значения +1 и, сле­

довательно, S определяется по значениям yih. Часто такой

прием неудобен, .например, при вычислении корреляционных

матриц. На простом примере проиллюстрируем общий слу-

чай вычисления ц г .

Последователь-

I

I

3

2

4

6

5

ности

П

Ранги

4

2

5

3

6

I

Попарные комбинации рангов и значения Х{кдля последо­

вательности I .

Т

3

2

4

6

5

 

0

+1

+1

+1

+ 1

4- 1

 

І - І

І-З

1-2

1-4

і- €

1-5

 

 

О

-1

+ і

+1

+ 1

 

 

3-3

3-2

3-4

3-6

3-5

 

 

 

О

+ 1

1

+ 1

 

 

 

2-2

2-4

2-6

2-5

 

 

 

 

0

+ і

+1

5

 

 

 

4-4

4-6

4 -

 

 

 

 

О

- 1

 

 

 

 

 

6-6

6-5

 

 

 

 

 

 

0

5

 

 

 

 

 

5 -

Попарные комбинации рангов и значения уік для последо-

тщательности П.

 

 

 

 

 

I

.4

2

5

3

•-6

 

о

■м

+1

+ 1

1-3

•fi

 

І - І

1-4

1-2

1-5

1-6

 

 

О

-1

+ і

- і

+1

 

 

4—4

4-2

4-5

4-3

4-6

 

 

 

О

+1

+ і

+ i

 

 

 

2-2

2-5

2-3

2-6

 

 

 

 

О

-1

+ i

 

 

 

 

5-5

5-3

5-6

 

 

 

 

 

О

+ i

 

 

 

 

 

3-3

3-6

 

 

 

 

 

 

0*

 

 

 

 

 

 

6-6

 

S = Z ЗД„=/ 0 * О А / I *

I

/+/I * I

/+

/I * I /+'

/ I * I /+ / I * I /+ / О « Ö /+ / - I *- I /+ / I XI /+

/ -1 * I /+ / I XI /+ / о * О /+ / I X I /+ /

IX I /+

/ I * I /+ / о * о А / - I XI /+ /

I * I А / о Xо А

/ I X- I а /

о Xо / =

CH-I+I+I+I+I+OI+I-I+I+0+M +I+

0-І+І+0-Г+0=9.

Такси алгоритм удобен для расчета корреляционных мат­ риц по Кендаллу на ЭВМ.

Следует заметить, что коэффициент ранговой корреля­

ции sг

по Спирмену

теоретически

и практически предпо­

чтительнее коэффициента „г по Кендаллу /

Б.Л. ван дер Вар­

ден,

I960

/ .

 

 

 

 

в /

Ранговая корреляционная матрица

 

Для расчёта ранговой корреляционной матрицы элемен­

ты х ік матрицы

(il)

заменяют порядковыми номерами / ран­

гами/

рщ

/ і

= І ,

2 , . . . , п ;

k = I ,

2 , . . . , гп/.

- гг -

Используя способ Спирмена, элементы ранговой корреля­ ционной матрицы можно расчитать ьо формуле

П р о г р а м м а З

ВЫЧИСЛЕНИЕ РАНГОВОЙ КОРРЕЛЯЦИОННОЙ МАТРИЦЫ

/ ранговые

переменные

в матрице X заданы столбцами /

Begin

in te g e r

 

д, р ,

q., ш,

п;

 

 

роо42

Cn,m);

 

b eg in

r e a l

-di

 

 

a rra u

g

Qi:n,

ism ],

Rs

[lsm ,

l:m ];

 

poo42

( g

) i

f o r

p :=

i

ste p

1 u n til

m do

b eg in

Re

[p,p]

I = l i

 

 

 

 

 

 

f o r

 

q := p + 1 s te p " ! u n t i l a do

 

b eg in

d

s =

J

!= о;

i o r

д

:= д + 1

w hile Д-n do

d i=

d +

( g

 

[;),?] -

g

Cd»4L]

)f2 ;

 

Rs

!>,<£]

:=

i

-

( 6 « d )

/

(n |3

- n )i

 

Re

[ij,p]

!=

Rs

[p,q]

 

end

end;

 

p !0 4 l C Rs ) i

sto p

end

end

 

 

П р о г р а м м а

 

4

 

 

 

 

 

ВЫЧИСЛЕНИЕ

РАНГОВОЙ

КОРРЕЛЯЦИОННОЙ

МАТРИЦЫ

/ранговые переменные в матрице X заданы строками/

begin

in te g e r

 

j , р, q, m, n;

 

 

 

 

poo42 C n,

m );

begin

r e a l

d;

 

 

 

arrau

g

[i:m ,

i:n ] ,

 

Rs

[і:ш ,

l:m] ;

 

poo42

(

g

)i

f o r

 

p

:=

1

step

1

u n til m do

begin

Ss

[p,p]

:=

j.;

 

 

 

 

 

 

 

 

fo r

q

:=

p

+

1 £be£

 

u n til

m do

 

 

 

begin

d

:=

j

:=

o;

 

fo r

q

:=

d

+

1 w hile

j ^ n do

d := d

+

C g

 

 

-

g

Obd]

) |2 ;

 

 

 

Rs DP . d

 

:=

1

-

C 6 X d

)

/

C nf3

-

n);

 

Rs

[q,pj

: =

Rs

[p,q|

 

end

 

end;

 

 

 

 

РІ04-1 ( Rs ) ;

step

 

end

end

 

 

 

 

 

 

Объяснения

к

программам

3 и 4.

 

n - переменная, указывающая длину ряда из поряд-'

 

новых

номеров

объектов

 

по

 

данному

признаку;

щ -

переменная,

указывающая

количество признаков.;

q -

идентификатор

массива

ранговой матрицы.

 

/ п * т

-

для

программы

І и

 

ш и п ' -

для

 

программы

2 /;

 

 

 

 

 

 

 

 

 

 

 

Исходная информация для программ: П,Ш, q.

 

Результат

-

матрица

Rs

корреляций

т хт.

МЕТОД ГЛАВНЫХ КОМПОНЕНТ

§ I . Геометрический смысл метода главных компонент

Метод главных компонент / компонентный анализ / с точки зрения геометрии сводится к переходу к но­

вой ортогональной системе координат. Если представить

И объектов

в виде

точек

в Ш-

мерном

пространстве,

каждая ось которого

соответствует

одному из парамет­

ров,

то облако точек

будет, иметь-форму, близкую к

т -

мерному эллипсоиду /

Г.' Харман,1972

/ .

Естественно

по­

этому

взять

систему координат,

образованную главными

осями

этого

эллипсоида.

Главные

компоненты выделяют

следующим образом.

 

 

 

 

 

 

Строят новую систему координат-такую, что первая

е

её ось идёт в направлении наибольшего изменения в со­ вокупности исходных параметров. Вторая ось идет орто­ гонально к первой и в направлении наибольшего измене­

ния из оставшихся

параметров.

Этот процесс

продолжа-

ют до

тех пор,пока

не построят

р новых

о с е й ( р ^ т ) .

Пусть

Х1( х г, Хз —исходные параметры и

точки

наблюде­

ний располагаются в

эллипсоиде /

рис. I

/ .

 

- 2b -

У

\

Рис. I . Преобразование системы координат в методе главных компонент

Оси новой системы координат'совпадут с главными полуосями эллипсоида. Главные компоненты Z,, Z ,,Z,

являются линейными комбинациями походных параметров

t T 1 е.

От новых координат можно вернуться к

старым,

записав

где

хг обозначает г -к )

компоненту,

а 1% ,

- вео

р

переменной в г -

й компоненте. .

 

 

 

Таким образом, если взять главные

оси эллипсоида

в

качестве компонент, то

каждая последующая компонен­

та будет давать меньший вклад в суммарную дисперсию,

чем

предыдущая / s ? ä s | = . . . = s «

./- Другими

словами,

на

первую компоненту приходится

максимально

возможная

ц ~:П2

доля суммарной дисперсии; вторая компонента учитывает максимум дисперсии в подпространстве, которое получит­

ся после исключения первой компоненты / соответствующей оси координат / и т . д.

Поскольку метод главных компонент связан с суммар­ ной дисперсией параметров, то он наиболее эффективен, когда все параметры приводятся в одних единицах изме­

рения. Поэтому параметры выражают в стандартной форме,

чтобы дисперсия параметра была равна 'единице,а,.,3ледова-

тельно, суммарная дисперсия равна m .

В качестве исходного материала для компонентного

анализа мы будем использовать корреляционную матрицу.

Вычисление последней описано' в

главе I .

§ 2 . Вычисление

главных

компонент

Множество главных компонент представляет собой

удачную систему

координат,

а

соответствующие диспер­

сии компонент характеризуют их статистические свойства. В практике статистических исследований, как правило,

используют главные компоненты с большими дисперсиями. Компоненты, тлеющие малые дисперсии, отбрасываются. Например, если различия между географическими объсктзми сводятся к двум линейным комбинациям, то исследова­ тель может изучать именно эти две величины. Другие ли­ нейные комбинации не принимаются во внимание, т. к. они мало изменяются от одного объекта к другому и. следовательно, дают мало информации о различиях между объектами.

 

Главные компоненты

являются-

характеристическими

/ собственными /

векторами корреляционной /

ковариаци­

онной /

 

матрицы. Решив характеристическое

уравнение

 

 

 

 

 

 

|R = À l|= o ,

ч

 

( а )

где

I

-

единичная матрица,

получают m

действительных

положительных корней

Л .Каждому характеристическому

корню

/

собственному

числу /

соответствует

характе­

ристический вектор.

 

 

 

 

 

 

 

 

 

 

Наибольший корень является дисперсией первой глав­

ной

компоненты и

т. д . , следовательно,

 

наименьший ко -

рень будет дисперсией последней главной компоненты.

Корреляционная матрица

R

 

наблюденных величин X П0Д~

вергается диагонализации

так,

что

 

 

 

 

 

 

 

 

ft=UAU,

 

 

(й)

где

U

-

ортогональная матрица,

полученная

из R

 

А - диагональная матрица состоящая из собствен­

 

ных

чисел

Л

матрицы

R .

 

 

 

Матрица '

 

 

W = U A V l,

 

 

 

 

полученная из разложения

(24], оказывается составлен­

ной из

коэффициентов

корреляции между параметрами X

и главными компонентами

 

 

 

 

 

 

 

 

 

 

 

 

 

Zi

Z 2

 

 

 

 

 

 

 

 

 

V*

 

ши toil

 

w lm

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

W = U A

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

' ‘ ' ^mm

X m

 

Сумма квадратов

элементов

строки

есть

дисперсия

данного параметра, которая равна единице. Сумма квад­ ратов чисел по столбцам явт^ется дисперсией главных компонент, т . е.

 

U^+uV, +••■ + ÎDmt = Al

. .

 

.......................................

(26)

Из выражения (2б) видно,

что A i является

оценкой

силы линейной

связи между

Zr и вектором наблюдённых

переменных X

 

 

При интерпретации результатов компонентного анали­

за , безотносительно к другим компонентам, направление любой из них может быть изменено на противоположное

умножением

 

 

соответствующего

столбца

матрицы

W

на -1 /Г.Харман,

1972/.

 

 

 

 

 

 

 

 

Подробное изложение алгоритма вычисления главных

компонент можно

найти в

работах

Д. Лоули,

А. Макс­

велла

/ 1 9 6 7 '/ .

и

С.

Н.

 

Сербенюка

/

1972 / .

Эта

схема

вычисления

/по

методу Хотеллинга/

 

была

исполь­

зована

для составления

программы

5.

 

 

 

 

П р о г р а м м а

 

5

 

 

 

 

 

 

 

 

 

 

ВЫЧИСЛЕНИЕ

ВЕСОВ

.ДЛЯ

ГЛАВНЫХ

КОМПОНЕНТ

 

b e g in

in te g e r

р,

q,

m,

гаг, к,

і ; роо42

(

га, та

);

begin

r e a l

q l,

max,

sp,

I s p ,

eps;

 

 

 

 

a r r a u

u,

u l,

u2

[l:m ],

R,

Rk. [l:m ,

i:in],

 

 

1 [1 •mzf],

s'/

[lim z .lim ],

 

w

[j.:m,

l:m z];

 

 

 

poo42 ( eps, R ) ;

к :=

о;

 

 

 

 

 

 

 

Ml: f o r

q

:=

1

s te p

1

u n t i l m

do

 

 

 

 

b eg in

 

ql := о ; f од p : = 1 s te p 1 u n t i l m do

; qi

:=

q i

+

R

[p ,q ]i

u

[q]

:=

q l

end

 

 

!

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

max

in: u

[1]

;

f o r

q

:=s

1 ste p

i

u n t i l m

dn

i f

u

[q]

â

 

max

th e n

max : =

u

[q] i

 

 

 

f o r

q

:=

1

 

ste p

1

u n t i l

 

m do

 

 

 

 

 

 

u [q]

:=

u

[q]

/

max;

 

 

 

 

 

 

 

 

 

 

М2:

q l:=

o;

 

f o r

p :=

1

 

ste p

1

u n t i l

m

do_

u l

jp]

:=

u

[p] ;

 

 

 

 

 

 

 

 

 

 

 

 

f o r

p

:=

1

ste p

1

u n til

 

m

do

 

 

 

 

 

 

begin

ql

:=

o;

f o r

q

:=

1

s te p

1

u n til

m do

ql

:=

ql

+

u

[q]

xR

[q,p] ;

Ù2

[p]

:=

ql

end

f o r

p

:=

1

 

ste p

1

u n t i l

m do

 

 

 

 

 

 

u fp]

:=

u2

 

[p ];

max

:=

u [1 ];

 

 

 

 

 

f o r

p

:=

1

 

ste p

1

u n til

 

m do

 

 

 

 

 

 

i f

u

[p]

h

 

max

th e n

max :=

u

[p] )

 

 

 

f o r

p

:=

1

 

ste p

1

u n t i l

m do

 

 

 

 

 

 

u [p]

:=

u

[p]

/

max;

 

 

 

 

 

 

 

 

 

 

f o r

о := 1s te p 1 u n t i l m do

 

 

 

 

 

 

i f

( u [p]

-

 

u l [pj

) X eps

th e n

go

to

М2;

Соседние файлы в папке книги из ГПНТБ