
книги из ГПНТБ / Сербенюк С.Н. Применение математико-статистических моделей для картографирования географических комплексов
.pdf©■ ^
Коэффициент ранговой корреляции по Кендаллу вычисляется
по формуле
|
2 S |
N |
|
|<г = я ( п - 1 ) |
|
Аналогично j г |
находится кг |
в пределах от - I до |
+1. При вычислении „г обычно номера первой последова
тельности располагают в возрастающем-порядке от I до а
и под каждым из них выписывают номер из второй последо
вательности. Тогда все Хіц принимают значения +1 и, сле
довательно, S определяется по значениям yih. Часто такой
прием неудобен, .например, при вычислении корреляционных
матриц. На простом примере проиллюстрируем общий слу-
чай вычисления ц г .
Последователь- |
I |
I |
3 |
2 |
4 |
6 |
5 |
ности |
П |
Ранги |
4 |
2 |
5 |
3 |
6 |
I |
Попарные комбинации рангов и значения Х{кдля последо
вательности I .
Т |
3 |
2 |
4 |
6 |
5 |
|
0 |
+1 |
+1 |
+1 |
+ 1 |
4- 1 |
|
І - І |
І-З |
1-2 |
1-4 |
і- € |
1-5 |
|
|
О |
-1 |
+ і |
+1 |
+ 1 |
|
|
3-3 |
3-2 |
3-4 |
3-6 |
3-5 |
|
|
|
О |
+ 1 |
1 |
+ 1 |
|
|
|
2-2 |
2-4 |
2-6 |
2-5 |
|
|
|
|
0 |
+ і |
+1 |
5 |
|
|
|
4-4 |
4-6 |
4 - |
|
|
|
|
|
О |
- 1 |
|
|
|
|
|
6-6 |
6-5 |
|
|
|
|
|
|
0 |
5 |
|
|
|
|
|
5 - |
Попарные комбинации рангов и значения уік для последо-
тщательности П. |
|
|
|
|
|
|
I |
.4 |
2 |
5 |
3 |
•-6 |
|
о |
■м |
+1 |
+ 1 |
1-3 |
•fi |
|
І - І |
1-4 |
1-2 |
1-5 |
1-6 |
|
|
|
О |
-1 |
+ і |
- і |
+1 |
|
|
4—4 |
4-2 |
4-5 |
4-3 |
4-6 |
|
|
|
О |
+1 |
+ і |
+ i |
|
|
|
2-2 |
2-5 |
2-3 |
2-6 |
|
|
|
|
О |
-1 |
+ i |
|
|
|
|
5-5 |
5-3 |
5-6 |
|
|
|
|
|
О |
+ i |
|
|
|
|
|
3-3 |
3-6 |
|
|
|
|
|
|
• 0* |
|
|
|
|
|
|
6-6 |
|
S = Z ЗД„=/ 0 * О А / I * |
I |
/+/I * I |
/+ |
/I * I /+' |
||
/ I * I /+ / I * I /+ / О « Ö /+ / - I *- I /+ / I XI /+ |
||||||
/ -1 * I /+ / I XI /+ / о * О /+ / I X I /+ / |
IX I /+ |
|||||
/ I * I /+ / о * о А / - I XI /+ / |
I * I А / о Xо А |
|||||
/ I X- I а / |
о Xо / = |
CH-I+I+I+I+I+OI+I-I+I+0+M +I+ |
0-І+І+0-Г+0=9.
Такси алгоритм удобен для расчета корреляционных мат риц по Кендаллу на ЭВМ.
Следует заметить, что коэффициент ранговой корреля
ции sг |
по Спирмену |
теоретически |
и практически предпо |
|||
чтительнее коэффициента „г по Кендаллу / |
Б.Л. ван дер Вар |
|||||
ден, |
I960 |
/ . |
|
|
|
|
в / |
Ранговая корреляционная матрица |
|
||||
Для расчёта ранговой корреляционной матрицы элемен |
||||||
ты х ік матрицы |
(il) |
заменяют порядковыми номерами / ран |
||||
гами/ |
рщ |
/ і |
= І , |
2 , . . . , п ; |
k = I , |
2 , . . . , гп/. |
- гг -
Используя способ Спирмена, элементы ранговой корреля ционной матрицы можно расчитать ьо формуле
П р о г р а м м а З
ВЫЧИСЛЕНИЕ РАНГОВОЙ КОРРЕЛЯЦИОННОЙ МАТРИЦЫ
/ ранговые |
переменные |
в матрице X заданы столбцами / |
||||||||||
Begin |
in te g e r |
|
д, р , |
q., ш, |
п; |
|
|
|||||
роо42 |
Cn,m); |
|
b eg in |
r e a l |
-di |
|
|
|||||
a rra u |
g |
Qi:n, |
ism ], |
Rs |
[lsm , |
l:m ]; |
|
|||||
poo42 |
( g |
) i |
f o r |
p := |
i |
ste p |
1 u n til |
m do |
||||
b eg in |
Re |
[p,p] |
I = l i |
|
|
|
|
|
|
|||
f o r |
|
q := p + 1 s te p " ! u n t i l a do |
|
|||||||||
b eg in |
d |
s = |
J |
!= о; |
i o r |
д |
:= д + 1 |
w hile Д-n do |
||||
d i= |
d + |
( g |
|
[;),?] - |
g |
Cd»4L] |
)f2 ; |
|
||||
Rs |
!>,<£] |
:= |
i |
- |
( 6 « d ) |
/ |
(n |3 |
- n )i |
|
|||
Re |
[ij,p] |
!= |
Rs |
[p,q] |
|
end |
end; |
|
||||
p !0 4 l C Rs ) i |
sto p |
end |
end |
|
|
П р о г р а м м а |
|
4 |
|
|
|
|
|
||||||||
ВЫЧИСЛЕНИЕ |
РАНГОВОЙ |
КОРРЕЛЯЦИОННОЙ |
МАТРИЦЫ |
|||||||||||||
/ранговые переменные в матрице X заданы строками/ |
||||||||||||||||
begin |
in te g e r |
|
j , р, q, m, n; |
|
|
|
|
|||||||||
poo42 C n, |
m ); |
begin |
r e a l |
d; |
|
|
|
|||||||||
arrau |
g |
[i:m , |
i:n ] , |
|
Rs |
[і:ш , |
l:m] ; |
|
||||||||
poo42 |
( |
g |
)i |
f o r |
|
p |
:= |
1 |
step |
1 |
u n til m do |
|||||
begin |
Ss |
[p,p] |
:= |
j.; |
|
|
|
|
|
|
|
|
||||
fo r |
q |
:= |
p |
+ |
1 £be£ |
|
u n til |
m do |
|
|
|
|||||
begin |
d |
:= |
j |
:= |
o; |
|
fo r |
q |
:= |
d |
+ |
1 w hile |
j ^ n do |
|||
d := d |
+ |
C g |
|
|
- |
g |
Obd] |
) |2 ; |
|
|
|
|||||
Rs DP . d |
|
:= |
1 |
- |
C 6 X d |
) |
/ |
C nf3 |
- |
n); |
|
|||||
Rs |
[q,pj |
: = |
Rs |
[p,q| |
|
end |
|
end; |
|
|
|
|
||||
РІ04-1 ( Rs ) ; |
step |
|
end |
end |
|
|
|
|
|
|||||||
|
Объяснения |
к |
программам |
3 и 4. |
|
|||||||||||
n - переменная, указывающая длину ряда из поряд-' |
||||||||||||||||
|
новых |
номеров |
объектов |
|
по |
|
данному |
признаку; |
||||||||
щ - |
переменная, |
указывающая |
количество признаков.; |
|||||||||||||
q - |
идентификатор |
массива |
ранговой матрицы. |
|||||||||||||
|
/ п * т |
- |
для |
программы |
І и |
|
ш и п ' - |
для |
||||||||
|
программы |
2 /; |
|
|
|
|
|
|
|
|
|
|
||||
|
Исходная информация для программ: П,Ш, q. |
|||||||||||||||
|
Результат |
- |
матрица |
Rs |
корреляций |
т хт. |
МЕТОД ГЛАВНЫХ КОМПОНЕНТ
§ I . Геометрический смысл метода главных компонент
Метод главных компонент / компонентный анализ / с точки зрения геометрии сводится к переходу к но
вой ортогональной системе координат. Если представить
И объектов |
в виде |
точек |
в Ш- |
мерном |
пространстве, |
|||
каждая ось которого |
соответствует |
одному из парамет |
||||||
ров, |
то облако точек |
будет, иметь-форму, близкую к |
т - |
|||||
мерному эллипсоиду / |
Г.' Харман,1972 |
/ . |
Естественно |
по |
||||
этому |
взять |
систему координат, |
образованную главными |
|||||
осями |
этого |
эллипсоида. |
Главные |
компоненты выделяют |
||||
следующим образом. |
|
|
|
|
|
|
Строят новую систему координат-такую, что первая
е
её ось идёт в направлении наибольшего изменения в со вокупности исходных параметров. Вторая ось идет орто гонально к первой и в направлении наибольшего измене
ния из оставшихся |
параметров. |
Этот процесс |
продолжа- |
||
ют до |
тех пор,пока |
не построят |
р новых |
о с е й ( р ^ т ) . |
|
Пусть |
Х1( х г, Хз —исходные параметры и |
точки |
наблюде |
||
ний располагаются в |
эллипсоиде / |
рис. I |
/ . |
|
- 2b -
У
\
Рис. I . Преобразование системы координат в методе главных компонент
Оси новой системы координат'совпадут с главными полуосями эллипсоида. Главные компоненты Z,, Z ,,Z,
являются линейными комбинациями походных параметров
t T 1 е.
От новых координат можно вернуться к |
старым, |
записав |
|||
где |
хг обозначает г -к ) |
компоненту, |
а 1% , |
- вео |
|
р |
-й |
переменной в г - |
й компоненте. . |
|
|
|
|
Таким образом, если взять главные |
оси эллипсоида |
||
в |
качестве компонент, то |
каждая последующая компонен |
та будет давать меньший вклад в суммарную дисперсию,
чем |
предыдущая / s ? ä s | = . . . = s « |
./- Другими |
словами, |
на |
первую компоненту приходится |
максимально |
возможная |
ц ~:П2
доля суммарной дисперсии; вторая компонента учитывает максимум дисперсии в подпространстве, которое получит
ся после исключения первой компоненты / соответствующей оси координат / и т . д.
Поскольку метод главных компонент связан с суммар ной дисперсией параметров, то он наиболее эффективен, когда все параметры приводятся в одних единицах изме
рения. Поэтому параметры выражают в стандартной форме,
чтобы дисперсия параметра была равна 'единице,а,.,3ледова-
тельно, суммарная дисперсия равна m .
В качестве исходного материала для компонентного
анализа мы будем использовать корреляционную матрицу.
Вычисление последней описано' в |
главе I . |
||
§ 2 . Вычисление |
главных |
компонент |
|
Множество главных компонент представляет собой |
|||
удачную систему |
координат, |
а |
соответствующие диспер |
сии компонент характеризуют их статистические свойства. В практике статистических исследований, как правило,
используют главные компоненты с большими дисперсиями. Компоненты, тлеющие малые дисперсии, отбрасываются. Например, если различия между географическими объсктзми сводятся к двум линейным комбинациям, то исследова тель может изучать именно эти две величины. Другие ли нейные комбинации не принимаются во внимание, т. к. они мало изменяются от одного объекта к другому и. следовательно, дают мало информации о различиях между объектами.
|
Главные компоненты |
являются- |
характеристическими |
||||||||||
/ собственными / |
векторами корреляционной / |
ковариаци |
|||||||||||
онной / |
|
матрицы. Решив характеристическое |
уравнение |
||||||||||
|
|
|
|
|
|
|R = À l|= o , |
ч |
|
( а ) |
||||
где |
I |
- |
единичная матрица, |
получают m |
действительных |
||||||||
положительных корней |
Л .Каждому характеристическому |
||||||||||||
корню |
/ |
собственному |
числу / |
соответствует |
характе |
||||||||
ристический вектор. |
|
|
|
|
|
|
|
|
|
||||
|
Наибольший корень является дисперсией первой глав |
||||||||||||
ной |
компоненты и |
т. д . , следовательно, |
|
наименьший ко - |
|||||||||
рень будет дисперсией последней главной компоненты. |
|||||||||||||
Корреляционная матрица |
R |
|
наблюденных величин X П0Д~ |
||||||||||
вергается диагонализации |
так, |
что |
|
|
|
||||||||
|
|
|
|
|
ft=UAU, |
|
|
(й) |
|||||
где |
U |
- |
ортогональная матрица, |
полученная |
из R |
||||||||
|
А - диагональная матрица состоящая из собствен |
||||||||||||
|
ных |
чисел |
Л |
матрицы |
R . |
|
|
|
|||||
Матрица ' |
|
|
W = U A V l, |
|
|
|
|
||||||
полученная из разложения |
(24], оказывается составлен |
||||||||||||
ной из |
коэффициентов |
корреляции между параметрами X |
|||||||||||
и главными компонентами |
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
Zi |
Z 2 |
|
|
|
|
|
|
|
|
|
|
V* |
|
ши toil |
|
w lm |
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
[Щ |
|
|
|
|
W = U A |
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
' ‘ ' ^mm |
X m |
|
||
Сумма квадратов |
элементов |
строки |
есть |
дисперсия |
данного параметра, которая равна единице. Сумма квад ратов чисел по столбцам явт^ется дисперсией главных компонент, т . е.
|
U^+uV, +••■ + ÎDmt = Al |
. . |
|
|
....................................... |
(26) |
|
Из выражения (2б) видно, |
что A i является |
оценкой |
|
силы линейной |
связи между |
Zr и вектором наблюдённых |
|
переменных X |
• |
|
|
При интерпретации результатов компонентного анали
за , безотносительно к другим компонентам, направление любой из них может быть изменено на противоположное
умножением |
|
|
соответствующего |
столбца |
матрицы |
W |
||||||||||
на -1 /Г.Харман, |
1972/. |
|
|
|
|
|
|
|
|
|||||||
Подробное изложение алгоритма вычисления главных |
||||||||||||||||
компонент можно |
найти в |
работах |
Д. Лоули, |
А. Макс |
||||||||||||
велла |
/ 1 9 6 7 '/ . |
и |
С. |
Н. |
|
Сербенюка |
/ |
1972 / . |
Эта |
|||||||
схема |
вычисления |
/по |
методу Хотеллинга/ |
|
была |
исполь |
||||||||||
зована |
для составления |
программы |
5. |
|
|
|
|
|||||||||
П р о г р а м м а |
|
5 |
|
|
|
|
|
|
|
|
|
|
||||
ВЫЧИСЛЕНИЕ |
ВЕСОВ |
.ДЛЯ |
ГЛАВНЫХ |
КОМПОНЕНТ |
|
|||||||||||
b e g in |
in te g e r |
р, |
q, |
m, |
гаг, к, |
і ; роо42 |
( |
га, та |
); |
|||||||
begin |
r e a l |
q l, |
max, |
sp, |
I s p , |
eps; |
|
|
|
|
||||||
a r r a u |
u, |
u l, |
u2 |
[l:m ], |
R, |
Rk. [l:m , |
i:in], |
|
|
|||||||
1 [1 •mzf], |
s'/ |
[lim z .lim ], |
|
w |
[j.:m, |
l:m z]; |
|
|
|
|||||||
poo42 ( eps, R ) ; |
к := |
о; |
|
|
|
|
|
|
|
|||||||
Ml: f o r |
q |
:= |
1 |
s te p |
1 |
u n t i l m |
do |
|
|
|
|
b eg in |
|
ql := о ; f од p : = 1 s te p 1 u n t i l m do |
||||||||||||||||
; qi |
:= |
q i |
+ |
R |
[p ,q ]i |
u |
[q] |
:= |
q l |
end |
|
|
||||||
! |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
max |
in: u |
[1] |
; |
f o r |
q |
:=s |
1 ste p |
i |
u n t i l m |
dn |
||||||||
i f |
u |
[q] |
â |
|
max |
th e n |
max : = |
u |
[q] i |
|
|
|
||||||
f o r |
q |
:= |
1 |
|
ste p |
1 |
u n t i l |
|
m do |
|
|
|
|
|
|
|||
u [q] |
:= |
u |
[q] |
/ |
max; |
|
|
|
|
|
|
|
|
|
|
|||
М2: |
q l:= |
o; |
|
f o r |
p := |
1 |
|
ste p |
1 |
u n t i l |
m |
do_ |
||||||
u l |
jp] |
:= |
u |
[p] ; |
|
|
|
|
|
|
|
|
|
|
|
|
||
f o r |
p |
:= |
1 |
ste p |
1 |
u n til |
|
m |
do |
|
|
|
|
|
|
|||
begin |
ql |
:= |
o; |
f o r |
q |
:= |
1 |
s te p |
1 |
u n til |
m do |
|||||||
ql |
:= |
ql |
+ |
u |
[q] |
xR |
[q,p] ; |
Ù2 |
[p] |
:= |
ql |
end |
||||||
f o r |
p |
:= |
1 |
|
ste p |
1 |
u n t i l |
m do |
|
|
|
|
|
|
||||
u fp] |
:= |
u2 |
|
[p ]; |
max |
:= |
u [1 ]; |
|
|
|
|
|
||||||
f o r |
p |
:= |
1 |
|
ste p |
1 |
u n til |
|
m do |
|
|
|
|
|
|
|||
i f |
u |
[p] |
h |
|
max |
th e n |
max := |
u |
[p] ) |
|
|
|
||||||
f o r |
p |
:= |
1 |
|
ste p |
1 |
u n t i l |
m do |
|
|
|
|
|
|
||||
u [p] |
:= |
u |
[p] |
/ |
max; |
|
|
|
|
|
|
|
|
|
|
|||
f o r |
о := 1s te p 1 u n t i l m do |
|
|
|
|
|
|
|||||||||||
i f |
( u [p] |
- |
|
u l [pj |
) X eps |
th e n |
go |
to |
М2; |