Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Сербенюк С.Н. Применение математико-статистических моделей для картографирования географических комплексов

.pdf
Скачиваний:
9
Добавлен:
23.10.2023
Размер:
4.14 Mб
Скачать

 

 

 

-

ІО -

 

 

 

 

 

персий

слагаемых а х

и у,

ещё один член,

линейный

отно­

сительно а:

 

 

 

 

 

 

 

 

 

М (а х - а к + у - у )1 =

 

 

 

 

“M (x -x )* + ? a M (x - £ )(y - ö > M (y - { )j? (5)

Коэффициент при 2 а

в правой

части

/ 5 /

называют

кова­

риацией

случайных

величин

X

и

у

. Чтобы получить

ис­

тинный коэффициент

корреляции

р

,

нужно ковариацию раз­

делить на произведение средних квадратических отклонений:

M (x - Ä J ( y - y )

 

 

 

Sx Sy

(e)

 

 

 

 

 

б / Выборочный коэффициент корреляции

 

Предположим,

что

в 'результате

наблюдений получены

П

пар значений

/ х ,

, у,

, у„ / , причём дан­

ные

пары / х і > уі /

являются независимыми случайными

величинами с одинаковым двумерным распределением. В ка­ честве оценки для дисперсии slx+g 'применим выборочную дисперсию

Поэтому оценку для ковариации М (х -х)(у-у) можно определить лить, воспользовавшись выборочной ковариацией

 

 

£ | j ( X i - x ) ( y r 0 ) ,

 

 

( 8>

: где к и y являются выборочными средними величинами.

 

Для того, чтобы получить оценку для

Q

, разделим

выборочную

ковариацию

на произведение

выборочных квад­

ратических

отклонений

бх бу

. Такая оценка

называется

выборочным коэффициентом корреляции

 

 

 

 

Известно, что

значения

Г находятся в

пределах от

- і

до + 1. Если

Jr равно + і

юіи - і ,

то

это указывает

на

функциональную, (соответственно) прямую или-обратную

связь. Связь между X

и у отсутствует,

если f = о .

 

Средняя квадратическая ошибка коэффициента корреля^

ции подсчитывается по формуле

 

 

 

 

в / Корреляционная матрица

 

 

(10)

 

 

 

 

 

Допустим, что мы веДѳм наблюдения за

m -мерным

вектором-строкой

независимых переменных

X*

Если у нас

есть возможность

выполнить

ft

наблюдений

над различными значениями вектора-строки X.' , то резуль­ таты наблюдений можно представить матрицей

Âfï . Xiz • **Хніі

G!)

Xjn X-tn- * 'Х.ШЛ

Статистические

свойства

этой матрицы задаются ковариа­

ционной m*m

матрицей /

Налимов В .В. ,1971

 

бі

Г бібг ■• •

гбібт

С

Г бгбі

б\

■ ■■Гбібт

=

 

 

 

 

Г

Гбтбг ■ ■ ■

бт

или для центрированных переменных

 

2 2 x î

2

] x , x j ••• 2 2 Xi

r _ J _ I j X ï X i S j X î

• • • 2 2 з с гх

°

ri

 

 

 

(12)

(13)

Х І Х . Х ,! ] х тХг ••• 2 2 'X^,

Диагональные элементы матрицы С являются дисперсия:.™,

внеднагонэльныековариациями. Если элементы матрицы разделить на соответствующие произведения сгедннх квад­ ратических отклонений или вычислить ковариационную мат­

рицу для стандартизированных переменных

X * =X{/Ê£C,TO мы

получим корреляционную матрицу_

 

 

1

Ъг

■ ■ ■ Пт

 

R

П.

1

П т

И

=

 

 

 

 

Іті

Ии

1

 

По диагонали

матрицы R

стоят единицы, а

недпагснальные

элементы - обычные парные выборочные коэртещиенты корре­ ляции.

В практической деятельности, чаете нормируют кэздув переменную. Это означает, что все величины в данном ряду измеряются относительно их среднего значения и делятся на их среднее квадратическое отклонение. Полученные таким образом новые величины имеют нулевое среднее значение и единичное среднее квадратическое отклонение. Поэтому мат­ рица ковариаций заменяется матрицей корреляций.

Исследование структуры корреляционной матрицы для целей картографирования географических комплексов мож­ но осуществить различными способами: как простыми, ви­ зуальными, так и более сложными, аналитическими. Путем простых перегруппировок элементов матрицы мы можем, на­ пример, охарактеризовать географическое распределение, явлений с различными показателями корреляционных связей, исследовать тенденции пространственного изменения пока­ зателей корреляции. Структуру корреляционных матриц мож­ но также исследовать с помощью компонентного анализа, позволяющего установить весомость тех или иных показа­ телей, особенности их пространственного распределения и определить их роль в ’формировании географических комп­ лексов.

Ниже приведем два варианта программы для вычисления корреляционной матрицы.

П р о г р а м м а

I

 

 

 

 

 

ВЫЧПСЛЕій'Е КОРРЕЛЯЦІОННОЙ

МАТРИЦЫ

 

 

/переменные в матрице X-заданы

столбцами

/

be "in

integer j,

p,

q,

J., n;

poo42

(n,m);

beein

real xs, ys,

st,

s2, s3,

sx,

sy}

\

arrau

g

[isu,l:m],

R [1:m,l :m) ; poo42 (g);

for p :=i

step i until m do

 

 

 

begin E Гр,р1:= ii

f o r

q

t—P+1 ste p

i

u n t i l

m

do

 

b e g in

 

s i

1=

s2

» =

s 3

l=

o|

 

 

f o r

d

»=

1

ste p

1

u n t i l

n

do

 

b e g in

 

s i *= s i + g [ d iP ] l s 2 ;= s 2 + g [d iq ]

endI

x s

1=

s l / n |

y s

<=

s 2 / n | s i i =

s2 »= oj

f o r

d

*=

1

ste p

1 u n t i l n

do,

 

b e g in s i ) = s i + (g [d ,p ] - x s ) { 2 1

 

s2

1=

s 2

+

(g

£d»q]

-

y s ) f 2

end I

 

s x l= s q r t ( s l / n ) |

s y

 

s q r t ( s 2 / n ) |

fo r '

d

•= i

ste p

1

u n t i l

n

do

 

s5 »= s? + (g [d»Pl

- xs) * (g [djqj

- ys)(

H

tp»€)

1=

s3

/

( a x s x

x s y ) |

 

H

(|q ,p ]

1=3

H

{ p jq j

end

end)

 

РІ04І ( H ),

■ sto p end end

П р о г р а м м а

2

 

 

 

 

 

 

 

 

 

 

ВЫЧИСЛЕНИЕ КОРРЕЛЯЦИОННОЙ МАТРИЦЫ

 

 

 

 

 

/переменные

 

в

матрице

X заданы строками/

 

 

 

b eg in

 

in te g e r

 

j ,

р ,

g,

m,

n;

 

poo42 ( n, m );

 

b eg in

 

r e a i

x s,

y s,

s i ,

s2,

s3 ,

sx,

sy |

 

 

 

a rra u

 

g

[l:m ,

l i n ] ,

E [ lm ,

lim ] ;

poo42

( g

)\

f o r

p

!=

 

1

ste p

1

u n til

m do

 

 

 

 

 

 

b eg in

 

E

 

[PiP]

:=

li

 

 

 

 

 

 

 

 

 

f o r

q

:=

P

+

1

ste p

1 u n t i l

m

do

 

 

 

 

beqin

 

s i

 

:=

S2

!=

s3

t =

о ;

 

 

 

 

 

 

 

f o r

о

:=

 

1

ste p

1

u n t i l

n do

 

 

 

 

 

 

begin

si

 

:= si + g [p,d]i

s2

J= s2 + g

[q,j]

 

end;

 

xs

:=

s i

/

n;

ys

!=

s2

/

n;

s i

s=

s2:=

о

for

à := 1 step 1 until n do

 

 

 

 

 

 

b eg in

 

s i

 

:=

s i

+ (

g

[p,d]

- xs

)f2 ;

 

 

 

 

s2 :=

 

s2 +

(

g

[ q ,j]

- ys

)f2

end;

 

 

 

 

sx ; = s q r t ( s i / n ) ;

sy : = s q r t ( s2 / n ) ;

f o r

д := i s te p 1 u n t i l n do

 

s3 s= s3 + ( g £p, j j - x s ) X ( g [q ,d ] - y s ) i

fi [p .q ] i=

зЗ /

(

n x s x x s y

) ;

R [q ,p ] := R [>,<£]

' end.

’end;

plo41

(

R );

stop

efiâ SM

Объяснения к программам. I

и 2.

a - переменная, указывающая длину статистических рядов; ,щ - переменная, указывающая количество статистических

рядов;

ч- идентификатор массива матрицы X ( n » m ) - для про­ граммы I и( i x n ) - для программы 2 / .

Исходная информация для программ: n , m , q . Результат - матрица R /корреляций ( « m ) .

§2. Непараметрическая корреляция

Ь/ Коэффициент ранговой корреляции 6Г по Спирмену

Отдельные географические объекты могут обладать таким признаком, который не имеет точной количествен­ ной оценки, но позволяет сравнить объекты друг с дру­ гом. В этом случае возможно упорядочить совокупность

объектов, приписав каждому из них порядковый номер /р а н г/,

Если стоит задача проверить зависимость двух ранговых

признаков, то рассматривают выборку из п независимых объектов и каждому из них приписывают два порядковых

номера, соответственно двум признакам. По этим порядко­ вым номерам вычисляют коэффициент ранговой корреляции. Обычно приписывают порядковые номера в соответствии с убыванием признака: первый номер приписывается наилучше­

му объекту в данном классе и т .д .

Если п объектам по двум сравниваемым признакам при­

писаны порядковые номера, то для того,чтобы арифметичес­ кое среднее равнялось нулю, из'этих номеров вычитают

(п + 1 )/2 .

,

а

затем

все результаты удваивают и обозна­

чают

/для первого

признака

/

 

и у».

/

для

второго

признака

/ .

В данном

случае

Хі

и Уі

выражаются целыми

числами. Такой

порядковый

номер

/

Х і

или у* / равен

k - I

 

. если

по .данному признаку

этот

объект

превосходит

I

других объектов

и при

этом

его

самого превосходят К

объектов(k + I = п + і)

/ Б Д .

ван

дер

Варден,

I9 6 0 /. Сум­

ма ' квадратов порядковых номеров

Хі

или

yt

равна

It

 

 

П

 

 

 

 

 

 

 

 

 

 

 

ÇS Уі= (п-іА(п-з)

Коэффициент ранговой корреляции

определяется форму­

лой

П

где

Xi=2(pf-(n +i)/a/,

Уі = 2(рГ-(п+1)/2),

з*

, _p{“

- ранги для

признаков х* и

y t соответственно.

 

З н а ч е н и я н а х о д я т с я в

пределах

от-1

до +1 . Зна­

чение-1

достигается

тогда,

когда оба ряда

полностью про-

г$62

Гос.

тивоположны друг

другу ( х * у *о) .

0

значение -1

достига­

ется тогда, когда оба ряда полностью

совпадают(х-у =о).

При вычислении sr

удобен

способ,

когда для

каждого

объекта вычисляют разность d i

порядковых

номеров

по двум

признакам. Тогда

п

 

 

 

 

 

 

 

 

 

 

3 Ç d\

 

6

 

 

 

 

 

іГ

*

2 n(n=-i)(n+i)~ I_ n(n-I)(n+1) '

 

 

 

Существенность sr

можно установить,

используя

таб­

лицу I критических величин

„г

при данном

числе

n

/ А. Бернстейн,

 

1968

/ .

Если

вычисленная

величина

5г <

величины по таблице,

то sr

считается

не

существенным.

Если аг^величине

по таблице,

то sr

считается существен- і

НЫМ.

 

 

 

 

 

 

 

 

 

 

 

Т а б л и ц а

I

 

 

 

 

 

 

 

 

 

 

КРИП'ІЧЕСКИЕ ВЕЛИЧИНЫ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ РАШ’ОВ

СПИРМЕНА

 

 

 

 

 

 

 

 

 

 

 

 

 

Уровень

существенности

 

 

 

h

 

 

0.05

 

 

 

0.01

 

 

4 :

 

1.000

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

 

0.900

 

 

 

 

І.ССО

 

 

 

 

 

 

 

 

 

 

 

 

 

6

 

0.829

 

 

 

С. 943

 

 

7

 

0.714

 

 

 

С.893

 

 

8

 

Q.643

 

 

 

0.833

 

 

9

 

0.600

 

 

 

0.783

 

 

10

 

0.564

 

 

 

0.746

 

 

12

 

0.506

 

 

 

0.712

 

 

14

 

0.456

 

 

 

• 0.645

 

 

16

 

0.425

 

 

 

0.601

 

 

18

0.399

0.564

20

0.377

0.534

22

0.359

0.508

24

0.343

0.485

26

0.329

0.465

28

0.317

0.448

30

0.306

0.432

б / Коэффициент ранговой корреляции

кг

по Кендаллу

Пусть имеется гг объектов, упорядоченных

по двум

признакам. Для каждой пары объектов /

і ,

к

/ опреде­

лим функцию, принимающую значения: + і,

если

 

порядковые

номера одного объекта превосходят соответствующие поряд­ ковые номера другого объекта, и -1 в противном случае.

Если x tk и у1к-случайные величины, которые при всех і и к определяются равенствами

+ 1,

Xt* x k ,

+ 1,

0,

*1= *и,

Уік=< 0,

-1,

*1 > Xk ,

-1 ,

У

< Ук,

 

У

= Ук,

( i s )

У

> Ук,

 

то зта функция для пары объектов / і , К / равна произве­ дению х ік yik . Сумма S произведений всех пар

s-Z

Уік

по абсолютной величине

не превосходит

Соседние файлы в папке книги из ГПНТБ