
книги из ГПНТБ / Сербенюк С.Н. Применение математико-статистических моделей для картографирования географических комплексов
.pdf
|
|
|
- |
ІО - |
|
|
|
|
|
персий |
слагаемых а х |
и у, |
ещё один член, |
линейный |
отно |
||||
сительно а: |
|
|
|
|
|
|
|
|
|
|
М (а х - а к + у - у )1 = |
|
|
|
|||||
|
“M (x -x )* + ? a M (x - £ )(y - ö > M (y - { )j? (5) |
||||||||
Коэффициент при 2 а |
в правой |
части |
/ 5 / |
называют |
кова |
||||
риацией |
случайных |
величин |
X |
и |
у |
. Чтобы получить |
ис |
||
тинный коэффициент |
корреляции |
р |
, |
нужно ковариацию раз |
делить на произведение средних квадратических отклонений:
M (x - Ä J ( y - y )
|
|
|
Sx Sy |
(e) |
|
|
|
|
|
|
б / Выборочный коэффициент корреляции |
|||
|
Предположим, |
что |
в 'результате |
наблюдений получены |
П |
пар значений |
/ х , |
, у, |
, у„ / , причём дан |
ные |
пары / х і > уі / |
являются независимыми случайными |
величинами с одинаковым двумерным распределением. В ка честве оценки для дисперсии slx+g 'применим выборочную дисперсию
Поэтому оценку для ковариации М (х -х)(у-у) можно определить лить, воспользовавшись выборочной ковариацией
|
|
£ | j ( X i - x ) ( y r 0 ) , |
|
|
( 8> |
|||
: где к и y являются выборочными средними величинами. |
||||||||
|
Для того, чтобы получить оценку для |
Q |
, разделим |
|||||
выборочную |
ковариацию |
на произведение |
выборочных квад |
|||||
ратических |
отклонений |
бх бу |
. Такая оценка |
называется |
||||
выборочным коэффициентом корреляции |
|
|
|
|||||
|
Известно, что |
значения |
Г находятся в |
пределах от |
||||
- і |
до + 1. Если |
Jr равно + і |
юіи - і , |
то |
это указывает |
|||
на |
функциональную, (соответственно) прямую или-обратную |
|||||||
связь. Связь между X |
и у отсутствует, |
если f = о . |
||||||
|
Средняя квадратическая ошибка коэффициента корреля^ |
|||||||
ции подсчитывается по формуле |
|
|
|
|||||
|
в / Корреляционная матрица |
|
|
(10) |
||||
|
|
|
|
|||||
|
Допустим, что мы веДѳм наблюдения за |
m -мерным |
||||||
вектором-строкой |
независимых переменных |
X* |
||||||
Если у нас |
есть возможность |
выполнить |
ft |
наблюдений |
над различными значениями вектора-строки X.' , то резуль таты наблюдений можно представить матрицей
Âfï . Xiz • **Хніі
G!)
Xjn X-tn- * 'Х.ШЛ
Статистические |
свойства |
этой матрицы задаются ковариа |
ционной m*m |
матрицей / |
Налимов В .В. ,1971 [І |
|
бі |
Г бібг ■• • |
гбібт |
|
С |
Г бгбі |
б\ |
■ ■■Гбібт |
|
= |
|
|
|
|
|
Г |
Гбтбг ■ ■ ■ |
бт |
|
или для центрированных переменных |
||||
|
2 2 x î |
2 |
] x , x j ••• 2 2 Xi |
|
r _ J _ I j X ï X i S j X î |
• • • 2 2 з с гх |
|||
° |
ri |
|
|
|
(12)
(13)
Х І Х . Х ,! ] х тХг ••• 2 2 'X^,
Диагональные элементы матрицы С являются дисперсия:.™,
внеднагонэльныековариациями. Если элементы матрицы разделить на соответствующие произведения сгедннх квад ратических отклонений или вычислить ковариационную мат
рицу для стандартизированных переменных |
X * =X{/Ê£C,TO мы |
|||
получим корреляционную матрицу_ |
|
|||
|
1 |
Ъг |
■ ■ ■ Пт |
|
R |
П. |
1 |
П т |
И |
= |
|
|
|
|
|
Іті |
Ии |
1 |
|
По диагонали |
матрицы R |
стоят единицы, а |
недпагснальные |
элементы - обычные парные выборочные коэртещиенты корре ляции.
В практической деятельности, чаете нормируют кэздув переменную. Это означает, что все величины в данном ряду измеряются относительно их среднего значения и делятся на их среднее квадратическое отклонение. Полученные таким образом новые величины имеют нулевое среднее значение и единичное среднее квадратическое отклонение. Поэтому мат рица ковариаций заменяется матрицей корреляций.
Исследование структуры корреляционной матрицы для целей картографирования географических комплексов мож но осуществить различными способами: как простыми, ви зуальными, так и более сложными, аналитическими. Путем простых перегруппировок элементов матрицы мы можем, на пример, охарактеризовать географическое распределение, явлений с различными показателями корреляционных связей, исследовать тенденции пространственного изменения пока зателей корреляции. Структуру корреляционных матриц мож но также исследовать с помощью компонентного анализа, позволяющего установить весомость тех или иных показа телей, особенности их пространственного распределения и определить их роль в ’формировании географических комп лексов.
Ниже приведем два варианта программы для вычисления корреляционной матрицы.
П р о г р а м м а |
I |
|
|
|
|
|
||
ВЫЧПСЛЕій'Е КОРРЕЛЯЦІОННОЙ |
МАТРИЦЫ |
|
|
|||||
/переменные в матрице X-заданы |
столбцами |
/ |
||||||
be "in |
integer j, |
p, |
q, |
J., n; |
poo42 |
(n,m); |
||
beein |
real xs, ys, |
st, |
s2, s3, |
sx, |
sy} |
\ |
||
arrau |
g |
[isu,l:m], |
R [1:m,l :m) ; poo42 (g); |
|||||
for p :=i |
step i until m do |
|
|
|
begin E Гр,р1:= ii
f o r |
q |
t—P+1 ste p |
i |
u n t i l |
m |
do |
|
|||||
b e g in |
|
s i |
1= |
s2 |
» = |
s 3 |
l= |
o| |
|
|
||
f o r |
d |
»= |
1 |
ste p |
1 |
u n t i l |
n |
do |
|
|||
b e g in |
|
s i *= s i + g [ d iP ] l s 2 ;= s 2 + g [d iq ] |
||||||||||
endI |
x s |
1= |
s l / n | |
y s |
<= |
s 2 / n | s i i = |
s2 »= oj |
|||||
f o r |
d |
*= |
1 |
ste p |
1 u n t i l n |
do, |
|
|||||
b e g in s i ) = s i + (g [d ,p ] - x s ) { 2 1 |
|
|||||||||||
s2 |
1= |
s 2 |
+ |
(g |
£d»q] |
- |
y s ) f 2 |
end I |
|
|||
s x l= s q r t ( s l / n ) | |
s y |
|
s q r t ( s 2 / n ) | |
|||||||||
fo r ' |
d |
•= i |
ste p |
1 |
u n t i l |
n |
do |
|
||||
s5 »= s? + (g [d»Pl |
- xs) * (g [djqj |
- ys)( |
||||||||||
H |
tp»€) |
1= |
s3 |
/ |
( a x s x |
x s y ) | |
|
|||||
H |
(|q ,p ] |
1=3 |
H |
{ p jq j |
end |
end) |
|
РІ04І ( H ),
■ sto p end end
П р о г р а м м а |
2 |
|
|
|
|
|
|
|
|
|
|
||||||
ВЫЧИСЛЕНИЕ КОРРЕЛЯЦИОННОЙ МАТРИЦЫ |
|
|
|
|
|
||||||||||||
/переменные |
|
в |
матрице |
X заданы строками/ |
|
|
|
||||||||||
b eg in |
|
in te g e r |
|
j , |
р , |
g, |
m, |
n; |
|
poo42 ( n, m ); |
|
||||||
b eg in |
|
r e a i |
x s, |
y s, |
s i , |
s2, |
s3 , |
sx, |
sy | |
|
|
|
|||||
a rra u |
|
g |
[l:m , |
l i n ] , |
E [ lm , |
lim ] ; |
poo42 |
( g |
)\ |
||||||||
f o r |
p |
!= |
|
1 |
ste p |
1 |
u n til |
m do |
|
|
|
|
|
|
|||
b eg in |
|
E |
|
[PiP] |
:= |
li |
|
|
|
|
|
|
|
|
|
||
f o r |
q |
:= |
P |
+ |
1 |
ste p |
1 u n t i l |
m |
do |
|
|
|
|
||||
beqin |
|
s i |
|
:= |
S2 |
!= |
s3 |
t = |
о ; |
|
|
|
|
|
|
|
|
f o r |
о |
:= |
|
1 |
ste p |
1 |
u n t i l |
n do |
|
|
|
|
|
|
|||
begin |
si |
|
:= si + g [p,d]i |
s2 |
J= s2 + g |
[q,j] |
|
||||||||||
end; |
|
xs |
:= |
s i |
/ |
n; |
ys |
!= |
s2 |
/ |
n; |
s i |
s= |
s2:= |
о |
||
for |
à := 1 step 1 until n do |
|
|
|
|
|
|
||||||||||
b eg in |
|
s i |
|
:= |
s i |
+ ( |
g |
[p,d] |
- xs |
)f2 ; |
|
|
|
|
|||
s2 := |
|
s2 + |
( |
g |
[ q ,j] |
- ys |
)f2 |
end; |
|
|
|
|
sx ; = s q r t ( s i / n ) ; |
sy : = s q r t ( s2 / n ) ; |
||||||
f o r |
д := i s te p 1 u n t i l n do |
|
|||||
s3 s= s3 + ( g £p, j j - x s ) X ( g [q ,d ] - y s ) i |
|||||||
fi [p .q ] i= |
зЗ / |
( |
n x s x x s y |
) ; |
R [q ,p ] := R [>,<£] |
||
' end. |
’end; |
plo41 |
( |
R ); |
stop |
efiâ SM |
|
Объяснения к программам. I |
и 2. |
a - переменная, указывающая длину статистических рядов; ,щ - переменная, указывающая количество статистических
рядов;
ч- идентификатор массива матрицы X ( n » m ) - для про граммы I и( i x n ) - для программы 2 / .
Исходная информация для программ: n , m , q . Результат - матрица R /корреляций ( « m ) .
§2. Непараметрическая корреляция
Ь/ Коэффициент ранговой корреляции 6Г по Спирмену
Отдельные географические объекты могут обладать таким признаком, который не имеет точной количествен ной оценки, но позволяет сравнить объекты друг с дру гом. В этом случае возможно упорядочить совокупность
объектов, приписав каждому из них порядковый номер /р а н г/,
Если стоит задача проверить зависимость двух ранговых
признаков, то рассматривают выборку из п независимых объектов и каждому из них приписывают два порядковых
номера, соответственно двум признакам. По этим порядко вым номерам вычисляют коэффициент ранговой корреляции. Обычно приписывают порядковые номера в соответствии с убыванием признака: первый номер приписывается наилучше
му объекту в данном классе и т .д .
Если п объектам по двум сравниваемым признакам при
писаны порядковые номера, то для того,чтобы арифметичес кое среднее равнялось нулю, из'этих номеров вычитают
(п + 1 )/2 . |
, |
а |
затем |
все результаты удваивают и обозна |
||||||||||
чают |
/для первого |
признака |
/ |
|
и у». |
/ |
для |
второго |
||||||
признака |
/ . |
В данном |
случае |
Хі |
и Уі |
выражаются целыми |
||||||||
числами. Такой |
порядковый |
номер |
/ |
Х і |
или у* / равен |
|||||||||
k - I |
|
. если |
по .данному признаку |
этот |
объект |
превосходит |
||||||||
I |
других объектов |
и при |
этом |
его |
самого превосходят К |
|||||||||
объектов(k + I = п + і) |
/ Б Д . |
ван |
дер |
Варден, |
I9 6 0 /. Сум |
|||||||||
ма ' квадратов порядковых номеров |
Хі |
или |
yt |
равна |
||||||||||
It |
|
|
П |
|
|
|
|
|
|
|
|
|
|
|
ÇS Уі= (п-іА(п-з)
Коэффициент ранговой корреляции |
определяется форму |
лой
П
где |
Xi=2(pf-(n +i)/a/, |
Уі = 2(рГ-(п+1)/2), |
||||
з* |
, _p{“ |
- ранги для |
признаков х* и |
y t соответственно. |
||
|
З н а ч е н и я н а х о д я т с я в |
пределах |
от-1 |
до +1 . Зна |
||
чение-1 |
достигается |
тогда, |
когда оба ряда |
полностью про- |
г$62 |
Гос. |
тивоположны друг |
другу ( х * у *о) . |
0 |
значение -1 |
достига |
|||||||
ется тогда, когда оба ряда полностью |
совпадают(х-у =о). |
||||||||||
При вычислении sr |
удобен |
способ, |
когда для |
каждого |
|||||||
объекта вычисляют разность d i |
порядковых |
номеров |
по двум |
||||||||
признакам. Тогда |
п |
|
|
|
|
|
|
|
|
||
|
|
3 Ç d\ |
|
6 |
|
|
|
|
|
||
іГ |
* |
2 n(n=-i)(n+i)~ I_ n(n-I)(n+1) ' |
|
|
|
||||||
Существенность sr |
можно установить, |
используя |
таб |
||||||||
лицу I критических величин |
„г |
при данном |
числе |
n |
|||||||
/ А. Бернстейн, |
|
1968 |
/ . |
Если |
вычисленная |
величина |
5г < |
||||
величины по таблице, |
то sr |
считается |
не |
существенным. |
|||||||
Если аг^величине |
по таблице, |
то sr |
считается существен- і |
||||||||
НЫМ. |
|
|
|
|
|
|
|
|
|
|
|
Т а б л и ц а |
I |
|
|
|
|
|
|
|
|
|
|
КРИП'ІЧЕСКИЕ ВЕЛИЧИНЫ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ РАШ’ОВ |
|||||||||||
СПИРМЕНА |
|
|
|
|
|
|
|
|
|
|
|
|
|
Уровень |
существенности |
|
|
|
|||||
h |
|
|
0.05 |
|
|
|
0.01 |
|
|
||
4 : |
|
1.000 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
5 |
|
0.900 |
|
|
|
|
І.ССО |
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
6 |
|
0.829 |
|
|
|
С. 943 |
|
|
|||
7 |
|
0.714 |
|
|
|
С.893 |
|
|
|||
8 |
|
Q.643 |
|
|
|
0.833 |
|
|
|||
9 |
|
0.600 |
|
|
|
0.783 |
|
|
|||
10 |
|
0.564 |
|
|
|
0.746 |
|
|
|||
12 |
|
0.506 |
|
|
|
0.712 |
|
|
|||
14 |
|
0.456 |
|
|
|
• 0.645 |
|
|
|||
16 |
|
0.425 |
|
|
|
0.601 |
|
|
18 |
0.399 |
0.564 |
20 |
0.377 |
0.534 |
22 |
0.359 |
0.508 |
24 |
0.343 |
0.485 |
26 |
0.329 |
0.465 |
28 |
0.317 |
0.448 |
30 |
0.306 |
0.432 |
б / Коэффициент ранговой корреляции |
кг |
по Кендаллу |
|
Пусть имеется гг объектов, упорядоченных |
по двум |
||
признакам. Для каждой пары объектов / |
і , |
к |
/ опреде |
лим функцию, принимающую значения: + і, |
если |
|
порядковые |
номера одного объекта превосходят соответствующие поряд ковые номера другого объекта, и -1 в противном случае.
Если x tk и у1к-случайные величины, которые при всех і и к определяются равенствами
+ 1, |
Xt* x k , |
+ 1, |
0, |
*1= *и, |
Уік=< 0, |
-1, |
*1 > Xk , |
-1 , |
У |
< Ук, |
|
У |
= Ук, |
( i s ) |
У |
> Ук, |
|
то зта функция для пары объектов / і , К / равна произве дению х ік yik . Сумма S произведений всех пар
s-Z |
Уік |
по абсолютной величине |
не превосходит |