 
        
        книги из ГПНТБ / Сербенюк С.Н. Применение математико-статистических моделей для картографирования географических комплексов
.pdf©■ ^
Коэффициент ранговой корреляции по Кендаллу вычисляется
по формуле
| 
 | 2 S | N | 
| 
 | |<г = я ( п - 1 ) | |
| Аналогично j г | находится кг | в пределах от - I до | 
+1. При вычислении „г обычно номера первой последова
тельности располагают в возрастающем-порядке от I до а
и под каждым из них выписывают номер из второй последо
вательности. Тогда все Хіц принимают значения +1 и, сле
довательно, S определяется по значениям yih. Часто такой
прием неудобен, .например, при вычислении корреляционных
матриц. На простом примере проиллюстрируем общий слу-
чай вычисления ц г .
| Последователь- | I | I | 3 | 2 | 4 | 6 | 5 | 
| ности | П | Ранги | 4 | 2 | 5 | 3 | 6 | 
| I | 
Попарные комбинации рангов и значения Х{кдля последо
вательности I .
| Т | 3 | 2 | 4 | 6 | 5 | 
 | 
| 0 | +1 | +1 | +1 | + 1 | 4- 1 | 
 | 
| І - І | І-З | 1-2 | 1-4 | і- € | 1-5 | 
 | 
| 
 | О | -1 | + і | +1 | + 1 | 
 | 
| 
 | 3-3 | 3-2 | 3-4 | 3-6 | 3-5 | 
 | 
| 
 | 
 | О | + 1 | 1 | + 1 | 
 | 
| 
 | 
 | 2-2 | 2-4 | 2-6 | 2-5 | 
 | 
| 
 | 
 | 
 | 0 | + і | +1 | 5 | 
| 
 | 
 | 
 | 4-4 | 4-6 | 4 - | |
| 
 | 
 | 
 | 
 | О | - 1 | 
 | 
| 
 | 
 | 
 | 
 | 6-6 | 6-5 | 
 | 
| 
 | 
 | 
 | 
 | 
 | 0 | 5 | 
| 
 | 
 | 
 | 
 | 
 | 5 - | 
Попарные комбинации рангов и значения уік для последо-
| тщательности П. | 
 | 
 | 
 | 
 | 
 | |
| I | .4 | 2 | 5 | 3 | •-6 | 
 | 
| о | ■м | +1 | + 1 | 1-3 | •fi | 
 | 
| І - І | 1-4 | 1-2 | 1-5 | 1-6 | 
 | |
| 
 | О | -1 | + і | - і | +1 | 
 | 
| 
 | 4—4 | 4-2 | 4-5 | 4-3 | 4-6 | 
 | 
| 
 | 
 | О | +1 | + і | + i | 
 | 
| 
 | 
 | 2-2 | 2-5 | 2-3 | 2-6 | 
 | 
| 
 | 
 | 
 | О | -1 | + i | 
 | 
| 
 | 
 | 
 | 5-5 | 5-3 | 5-6 | 
 | 
| 
 | 
 | 
 | 
 | О | + i | 
 | 
| 
 | 
 | 
 | 
 | 3-3 | 3-6 | 
 | 
| 
 | 
 | 
 | 
 | 
 | • 0* | 
 | 
| 
 | 
 | 
 | 
 | 
 | 6-6 | 
 | 
| S = Z ЗД„=/ 0 * О А / I * | I | /+/I * I | /+ | /I * I /+' | ||
| / I * I /+ / I * I /+ / О « Ö /+ / - I *- I /+ / I XI /+ | ||||||
| / -1 * I /+ / I XI /+ / о * О /+ / I X I /+ / | IX I /+ | |||||
| / I * I /+ / о * о А / - I XI /+ / | I * I А / о Xо А | |||||
| / I X- I а / | о Xо / = | CH-I+I+I+I+I+OI+I-I+I+0+M +I+ | ||||
0-І+І+0-Г+0=9.
Такси алгоритм удобен для расчета корреляционных мат риц по Кендаллу на ЭВМ.
Следует заметить, что коэффициент ранговой корреля
| ции sг | по Спирмену | теоретически | и практически предпо | |||
| чтительнее коэффициента „г по Кендаллу / | Б.Л. ван дер Вар | |||||
| ден, | I960 | / . | 
 | 
 | 
 | 
 | 
| в / | Ранговая корреляционная матрица | 
 | ||||
| Для расчёта ранговой корреляционной матрицы элемен | ||||||
| ты х ік матрицы | (il) | заменяют порядковыми номерами / ран | ||||
| гами/ | рщ | / і | = І , | 2 , . . . , п ; | k = I , | 2 , . . . , гп/. | 
- гг -
Используя способ Спирмена, элементы ранговой корреля ционной матрицы можно расчитать ьо формуле
П р о г р а м м а З
ВЫЧИСЛЕНИЕ РАНГОВОЙ КОРРЕЛЯЦИОННОЙ МАТРИЦЫ
| / ранговые | переменные | в матрице X заданы столбцами / | ||||||||||
| Begin | in te g e r | 
 | д, р , | q., ш, | п; | 
 | 
 | |||||
| роо42 | Cn,m); | 
 | b eg in | r e a l | -di | 
 | 
 | |||||
| a rra u | g | Qi:n, | ism ], | Rs | [lsm , | l:m ]; | 
 | |||||
| poo42 | ( g | ) i | f o r | p := | i | ste p | 1 u n til | m do | ||||
| b eg in | Re | [p,p] | I = l i | 
 | 
 | 
 | 
 | 
 | 
 | |||
| f o r | 
 | q := p + 1 s te p " ! u n t i l a do | 
 | |||||||||
| b eg in | d | s = | J | != о; | i o r | д | := д + 1 | w hile Д-n do | ||||
| d i= | d + | ( g | 
 | [;),?] - | g | Cd»4L] | )f2 ; | 
 | ||||
| Rs | !>,<£] | := | i | - | ( 6 « d ) | / | (n |3 | - n )i | 
 | |||
| Re | [ij,p] | != | Rs | [p,q] | 
 | end | end; | 
 | ||||
| p !0 4 l C Rs ) i | sto p | end | end | 
 | ||||||||
| 
 | П р о г р а м м а | 
 | 4 | 
 | 
 | 
 | 
 | 
 | ||||||||
| ВЫЧИСЛЕНИЕ | РАНГОВОЙ | КОРРЕЛЯЦИОННОЙ | МАТРИЦЫ | |||||||||||||
| /ранговые переменные в матрице X заданы строками/ | ||||||||||||||||
| begin | in te g e r | 
 | j , р, q, m, n; | 
 | 
 | 
 | 
 | |||||||||
| poo42 C n, | m ); | begin | r e a l | d; | 
 | 
 | 
 | |||||||||
| arrau | g | [i:m , | i:n ] , | 
 | Rs | [і:ш , | l:m] ; | 
 | ||||||||
| poo42 | ( | g | )i | f o r | 
 | p | := | 1 | step | 1 | u n til m do | |||||
| begin | Ss | [p,p] | := | j.; | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||
| fo r | q | := | p | + | 1 £be£ | 
 | u n til | m do | 
 | 
 | 
 | |||||
| begin | d | := | j | := | o; | 
 | fo r | q | := | d | + | 1 w hile | j ^ n do | |||
| d := d | + | C g | 
 | 
 | - | g | Obd] | ) |2 ; | 
 | 
 | 
 | |||||
| Rs DP . d | 
 | := | 1 | - | C 6 X d | ) | / | C nf3 | - | n); | 
 | |||||
| Rs | [q,pj | : = | Rs | [p,q| | 
 | end | 
 | end; | 
 | 
 | 
 | 
 | ||||
| РІ04-1 ( Rs ) ; | step | 
 | end | end | 
 | 
 | 
 | 
 | 
 | |||||||
| 
 | Объяснения | к | программам | 3 и 4. | 
 | |||||||||||
| n - переменная, указывающая длину ряда из поряд-' | ||||||||||||||||
| 
 | новых | номеров | объектов | 
 | по | 
 | данному | признаку; | ||||||||
| щ - | переменная, | указывающая | количество признаков.; | |||||||||||||
| q - | идентификатор | массива | ранговой матрицы. | |||||||||||||
| 
 | / п * т | - | для | программы | І и | 
 | ш и п ' - | для | ||||||||
| 
 | программы | 2 /; | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||
| 
 | Исходная информация для программ: П,Ш, q. | |||||||||||||||
| 
 | Результат | - | матрица | Rs | корреляций | т хт. | ||||||||||
МЕТОД ГЛАВНЫХ КОМПОНЕНТ
§ I . Геометрический смысл метода главных компонент
Метод главных компонент / компонентный анализ / с точки зрения геометрии сводится к переходу к но
вой ортогональной системе координат. Если представить
| И объектов | в виде | точек | в Ш- | мерном | пространстве, | |||
| каждая ось которого | соответствует | одному из парамет | ||||||
| ров, | то облако точек | будет, иметь-форму, близкую к | т - | |||||
| мерному эллипсоиду / | Г.' Харман,1972 | / . | Естественно | по | ||||
| этому | взять | систему координат, | образованную главными | |||||
| осями | этого | эллипсоида. | Главные | компоненты выделяют | ||||
| следующим образом. | 
 | 
 | 
 | 
 | 
 | 
 | ||
Строят новую систему координат-такую, что первая
е
её ось идёт в направлении наибольшего изменения в со вокупности исходных параметров. Вторая ось идет орто гонально к первой и в направлении наибольшего измене
| ния из оставшихся | параметров. | Этот процесс | продолжа- | ||
| ют до | тех пор,пока | не построят | р новых | о с е й ( р ^ т ) . | |
| Пусть | Х1( х г, Хз —исходные параметры и | точки | наблюде | ||
| ний располагаются в | эллипсоиде / | рис. I | / . | 
 | |
- 2b -
У
\
Рис. I . Преобразование системы координат в методе главных компонент
Оси новой системы координат'совпадут с главными полуосями эллипсоида. Главные компоненты Z,, Z ,,Z,
являются линейными комбинациями походных параметров
t T 1 е.
| От новых координат можно вернуться к | старым, | записав | |||
| где | хг обозначает г -к ) | компоненту, | а 1% , | - вео | |
| р | -й | переменной в г - | й компоненте. . | 
 | |
| 
 | 
 | Таким образом, если взять главные | оси эллипсоида | ||
| в | качестве компонент, то | каждая последующая компонен | |||
та будет давать меньший вклад в суммарную дисперсию,
| чем | предыдущая / s ? ä s | = . . . = s « | ./- Другими | словами, | 
| на | первую компоненту приходится | максимально | возможная | 
ц ~:П2
доля суммарной дисперсии; вторая компонента учитывает максимум дисперсии в подпространстве, которое получит
ся после исключения первой компоненты / соответствующей оси координат / и т . д.
Поскольку метод главных компонент связан с суммар ной дисперсией параметров, то он наиболее эффективен, когда все параметры приводятся в одних единицах изме
рения. Поэтому параметры выражают в стандартной форме,
чтобы дисперсия параметра была равна 'единице,а,.,3ледова-
тельно, суммарная дисперсия равна m .
В качестве исходного материала для компонентного
анализа мы будем использовать корреляционную матрицу.
| Вычисление последней описано' в | главе I . | ||
| § 2 . Вычисление | главных | компонент | |
| Множество главных компонент представляет собой | |||
| удачную систему | координат, | а | соответствующие диспер | 
сии компонент характеризуют их статистические свойства. В практике статистических исследований, как правило,
используют главные компоненты с большими дисперсиями. Компоненты, тлеющие малые дисперсии, отбрасываются. Например, если различия между географическими объсктзми сводятся к двум линейным комбинациям, то исследова тель может изучать именно эти две величины. Другие ли нейные комбинации не принимаются во внимание, т. к. они мало изменяются от одного объекта к другому и. следовательно, дают мало информации о различиях между объектами.
| 
 | Главные компоненты | являются- | характеристическими | ||||||||||
| / собственными / | векторами корреляционной / | ковариаци | |||||||||||
| онной / | 
 | матрицы. Решив характеристическое | уравнение | ||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | |R = À l|= o , | ч | 
 | ( а ) | ||||
| где | I | - | единичная матрица, | получают m | действительных | ||||||||
| положительных корней | Л .Каждому характеристическому | ||||||||||||
| корню | / | собственному | числу / | соответствует | характе | ||||||||
| ристический вектор. | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||
| 
 | Наибольший корень является дисперсией первой глав | ||||||||||||
| ной | компоненты и | т. д . , следовательно, | 
 | наименьший ко - | |||||||||
| рень будет дисперсией последней главной компоненты. | |||||||||||||
| Корреляционная матрица | R | 
 | наблюденных величин X П0Д~ | ||||||||||
| вергается диагонализации | так, | что | 
 | 
 | 
 | ||||||||
| 
 | 
 | 
 | 
 | 
 | ft=UAU, | 
 | 
 | (й) | |||||
| где | U | - | ортогональная матрица, | полученная | из R | ||||||||
| 
 | А - диагональная матрица состоящая из собствен | ||||||||||||
| 
 | ных | чисел | Л | матрицы | R . | 
 | 
 | 
 | |||||
| Матрица ' | 
 | 
 | W = U A V l, | 
 | 
 | 
 | 
 | ||||||
| полученная из разложения | (24], оказывается составлен | ||||||||||||
| ной из | коэффициентов | корреляции между параметрами X | |||||||||||
| и главными компонентами | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||||
| 
 | 
 | 
 | 
 | 
 | 
 | Zi | Z 2 | 
 | 
 | 
 | 
 | 
 | |
| 
 | 
 | 
 | 
 | V* | 
 | ши toil | 
 | w lm | 
 | 
 | 
 | ||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | [Щ | |
| 
 | 
 | 
 | W = U A | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ' ‘ ' ^mm | X m | 
 | ||
| Сумма квадратов | элементов | строки | есть | дисперсия | |||||||||
данного параметра, которая равна единице. Сумма квад ратов чисел по столбцам явт^ется дисперсией главных компонент, т . е.
| 
 | U^+uV, +••■ + ÎDmt = Al | . . | |
| 
 | ....................................... | (26) | |
| Из выражения (2б) видно, | что A i является | оценкой | |
| силы линейной | связи между | Zr и вектором наблюдённых | |
| переменных X | • | 
 | 
 | 
При интерпретации результатов компонентного анали
за , безотносительно к другим компонентам, направление любой из них может быть изменено на противоположное
| умножением | 
 | 
 | соответствующего | столбца | матрицы | W | ||||||||||
| на -1 /Г.Харман, | 1972/. | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||||
| Подробное изложение алгоритма вычисления главных | ||||||||||||||||
| компонент можно | найти в | работах | Д. Лоули, | А. Макс | ||||||||||||
| велла | / 1 9 6 7 '/ . | и | С. | Н. | 
 | Сербенюка | / | 1972 / . | Эта | |||||||
| схема | вычисления | /по | методу Хотеллинга/ | 
 | была | исполь | ||||||||||
| зована | для составления | программы | 5. | 
 | 
 | 
 | 
 | |||||||||
| П р о г р а м м а | 
 | 5 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||
| ВЫЧИСЛЕНИЕ | ВЕСОВ | .ДЛЯ | ГЛАВНЫХ | КОМПОНЕНТ | 
 | |||||||||||
| b e g in | in te g e r | р, | q, | m, | гаг, к, | і ; роо42 | ( | га, та | ); | |||||||
| begin | r e a l | q l, | max, | sp, | I s p , | eps; | 
 | 
 | 
 | 
 | ||||||
| a r r a u | u, | u l, | u2 | [l:m ], | R, | Rk. [l:m , | i:in], | 
 | 
 | |||||||
| 1 [1 •mzf], | s'/ | [lim z .lim ], | 
 | w | [j.:m, | l:m z]; | 
 | 
 | 
 | |||||||
| poo42 ( eps, R ) ; | к := | о; | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||||
| Ml: f o r | q | := | 1 | s te p | 1 | u n t i l m | do | 
 | 
 | 
 | 
 | |||||
| b eg in | 
 | ql := о ; f од p : = 1 s te p 1 u n t i l m do | ||||||||||||||||
| ; qi | := | q i | + | R | [p ,q ]i | u | [q] | := | q l | end | 
 | 
 | ||||||
| ! | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
| max | in: u | [1] | ; | f o r | q | :=s | 1 ste p | i | u n t i l m | dn | ||||||||
| i f | u | [q] | â | 
 | max | th e n | max : = | u | [q] i | 
 | 
 | 
 | ||||||
| f o r | q | := | 1 | 
 | ste p | 1 | u n t i l | 
 | m do | 
 | 
 | 
 | 
 | 
 | 
 | |||
| u [q] | := | u | [q] | / | max; | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||
| М2: | q l:= | o; | 
 | f o r | p := | 1 | 
 | ste p | 1 | u n t i l | m | do_ | ||||||
| u l | jp] | := | u | [p] ; | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||
| f o r | p | := | 1 | ste p | 1 | u n til | 
 | m | do | 
 | 
 | 
 | 
 | 
 | 
 | |||
| begin | ql | := | o; | f o r | q | := | 1 | s te p | 1 | u n til | m do | |||||||
| ql | := | ql | + | u | [q] | xR | [q,p] ; | Ù2 | [p] | := | ql | end | ||||||
| f o r | p | := | 1 | 
 | ste p | 1 | u n t i l | m do | 
 | 
 | 
 | 
 | 
 | 
 | ||||
| u fp] | := | u2 | 
 | [p ]; | max | := | u [1 ]; | 
 | 
 | 
 | 
 | 
 | ||||||
| f o r | p | := | 1 | 
 | ste p | 1 | u n til | 
 | m do | 
 | 
 | 
 | 
 | 
 | 
 | |||
| i f | u | [p] | h | 
 | max | th e n | max := | u | [p] ) | 
 | 
 | 
 | ||||||
| f o r | p | := | 1 | 
 | ste p | 1 | u n t i l | m do | 
 | 
 | 
 | 
 | 
 | 
 | ||||
| u [p] | := | u | [p] | / | max; | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||
| f o r | о := 1s te p 1 u n t i l m do | 
 | 
 | 
 | 
 | 
 | 
 | |||||||||||
| i f | ( u [p] | - | 
 | u l [pj | ) X eps | th e n | go | to | М2; | |||||||||
