книги / Статистика и анализ геологических данных
..pdfМетод ближайшего соседа. Существует еще один способ ис следования подобластей, на которые разбита некоторая об ласть, называемый методом ближайшего соседа. Анализируе мые в этом случае данные представляют собой не множество точек, расположенных внутри некоторой заданной области, а расстояния между наиболее близкими парами точек. Преи мущество метода ближайшего соседа заключается в том, что он дает возможность получать некоторую информацию о при роде распределения точек, которая весьма далека от простого принятия или отклонения проверяемой гипотезы [31].
В условиях случайного распределения точек на плоскости математическое ожидание расстояния (ожидаемое среднее рас
стояние) Д между каждой точкой и ближайшей к ней соседней точкой определяется следующей формулой:
Д |
1 |
(6.8) |
|
2 /р |
|||
|
’ |
где р — плотность точек в изучаемой области, которая опреде ляется как число точек, приходящихся на единицу площади, причем площадь измеряется квадратами единиц, используемых для измерения расстояний между точками. Так, например, если расстояние между точками выражено в милях, то р подсчиты вается как число точек, приходящихся на квадратную милю.
Мы можем также измерить расстояние между каждой точ кой и соответствующей ей ближайшей соседней точкой и вы
числить наблюдаемое среднее значение этих расстояний D. От
ношение |
Pi |
|
R |
- 4 А- |
(6.9) |
представляет собой статистику метода ближайшего соседа, ко торая принимает значения в интервале от 0 до 2,15, где 0 соот ветствует случаю, когда все точки сведены в одну и расстояние между ними равно 0. Если критерий принял значение, равное 1, это соответствует случайному расположению точек, а макси мальная величина критерия 2,15 характеризует распределение точек, имеющих тенденцию к рассеянию. На фиг. 6.4 приведены примеры расположения точек, соответствующих трем различ ным случаям. Если точки расположены случайно, то теоретиче ское значение стандартного отклонения оценки среднего рас стояния между ближайшими точками будет определено сле
дующим выражением:
0,26136 (6. 10)
0д_ VW
где N — число измерений расстояния между парами точек. Воп рос о константе в числителе этой дроби рассмотрен в работе
Фиг. 6.4. Значения статистики метода ближайшего соседа для различных схем расположения точек на картах.
а — точки_ сгруппированы: |
£>=0,12, |
Д=0,24, |
/?=0,50; |
б — случайное расположение___точек: |
D =0,40, Д=0,32, R = 1,25; |
в — точки |
размещ ены в |
верш инах шестиугольников: D =0,50, |
|
|
|
Д=0,33, |
Я=2,15. |
Кинга [19] и Кендалла и Морана [18]. Располагая значениями D, А и о д , нетрудно построить критерий для проверки гипотезы
о случайном распределении |
рассматриваемого |
набора точек |
Z = |
- ~ А-. |
(6.11) |
|
ад |
|
Если проверяемая гипотеза верна, то Z будет значением случайной величины, распределение которой близко к нормаль ному. Нулевая гипотеза должна быть отклонена, если Z превы сит допустимое значение, соответствующее заданному уровню значимости, которое можно найти в табл. 3.8.
Мы проиллюстрируем применение метода ближайшего со седа на примере «карты», приведенной на фиг. 6.5. Эта «карта» в действительности представляет полированную поверхность каменной облицовки фасада здания банка в университетском
|
|
|
Т а б л и ц а 6.3 |
Координаты магнетитовых зерен на полированной |
|||
|
анортозитовой плите |
|
|
|
Расстояние от нижнего левого угла плиты, см |
||
горизонтальное |
вертикальное |
горизонтальное |
вертикальное |
1 |
86 |
38 |
25 |
2 |
41 |
38 |
7 |
4 |
3 |
41 |
51 |
4 |
15 |
46 |
2 |
8 |
9 5 . |
47 |
12 |
9 |
13 |
45 |
82 |
7 |
35 |
50 |
83 |
8 |
44 |
49 |
96 |
10 |
58 |
50 |
13 |
12 |
88 |
51 |
25 |
14 |
2 |
56 |
12 |
22 |
2 |
58 |
40 |
21 |
56 |
59 |
28 |
22 |
53 |
60 |
61 |
24 |
31 |
62 |
70 |
27 |
12 |
66 |
0 |
27 |
34 |
66 |
15 |
28 |
76 |
65 |
75 |
37 |
14 |
69 |
38 |
37 |
61 |
69 |
83 |
27 |
85 |
71 |
27 |
И |
25 |
76 |
1 |
15 |
15 |
77 |
4 |
3593
---с-----------------
весьма полезными. Проверку гипотезы о равномерном случай ном распределении зерен магнетита можно провести с помощью одного из рассматриваемых ранее способов — разделения на бо лее дробные участки или же с помощью метода ближайшего соседа. Вычисления можно делать вручную или составить не
большую программу для ЭВМ и вычислить необходимые рас стояния по данным табл. 6.3.
Фиг. 6.6. Изображение контрольных точек для задачи топографического кар тирования.
За единицу масштаба выбрали 50 футов, |
начало отсчета — левый нижний угол; |
над уровнем |
моря — в футах. |
и Y — картируемая характеристика, заданная как функция на множестве значений координат. На фиг. 6.6 приведен типич ный набор точек с соответствующими им значениями результа тов измерения абсолютных отметок топографической поверх ности. Эти данные получены при мензульной съемке и равно мерно распределены на изучаемой площади с учетом заданного масштаба карты. Все эти данные с соответствующими им коор динатами приведены в табл. 6.4. Для удобства за начало коор динат принят левый нижний угол карты, а значения коорди натных отсчетов выражены в произвольных единицах (одна еди ница— 50 футов). Положение точек наблюдения можно было бы выразить и в любых других единицах, что не повлияло бы на результаты.
В ЭВМ вводится только матрица координат и топографи ческих отметок в порядке, удобном для последующих построе ний. После этого задается прямоугольная сеть точек, на основе которых будут строиться изолинии. В описанных в этой главе системах построения карт в изолиниях на ЭВМ расстояние между точками сети выбирается автоматически и равно рас стоянию между строк печатающего устройства вычислительной машины. В программах математического обеспечения графопо строителей обычно предусмотрен контроль этого интервала
оператором. Уменьшение длины шага графопостроителя обеспе чивает более красивый вид карты, так как делает линии более сглаженными. Однако это приводит к значительному увеличе нию числа точек сети, для которых должны быть выполнены определенные вычисления, что увеличивает время работы ЭВМ и как следствие увеличивает стоимость составления карты. Об суждение всех этих вопросов не входит в наши задачи, но де тальное их рассмотрение можно найти в трудах фирмы IBM [16], Палмера [32] и Уолтерса [37].
На фиг. 6.7, а изображена серия наблюдений, причем каждая точка охарактеризована значениями координат Xi и Хг, а тккже значением высоты над уровнем моря, которое приведено справа
от каждой точки. |
|
|
|
)- |
( |
|
|
\ |
iЬ ( |
|
|
/ \ |
/ |
|
|
/ |
\ |
) |
( |
V) |
|
|
6.1 |
5,7 |
5,3 |
5.8 |
о |
О |
О |
6 |
7,0 |
6,5 |
6,0 |
5,2 |
О |
О |
о |
О |
7,6 |
7,0 |
6.0 |
5,7 |
О |
О |
о |
О |
7.2 |
7,0 |
6.2 |
5,5 |
О |
О |
О |
О |
Фиг. 6.7. Последовательность вычислений для построения изолиний при на хождении значений в узлах сетки.
а — исходная сеть неравномерно расположенных контрольных точек на карте; числа ука зывают абсолютные отметки; б — равномерная сеть, в узлах которой вычисляются зна чения; в — расположение четырех ближайших контрольных точек по отношению к точке равномерной сети: эти четыре ближайших значения используются для вычисления зна чения в этой точке; г — окончательный результат вычисления отметок в каждой точке
равномерной сети.
Набор точек можно перенумеровать, т. е. приписать каждой точке номер i. Следовательно, в новых обозначениях точка с но мером i будет обладать координатами Хц и Х2ь а также абсо лютной отметкой Yi. На фиг. 6.7,6 приведена выбранная пра вильная сеть точек, по которой будут строиться изолинии. Каж дой из этих точек можно приписать соответствующий номер к. Таким образом, точка этой сети с номером к будет обладать
-""S
координатами Xik, Х2к и вычисленным значением Yk. Нам нужно
высчитать оценку Yk по п ближайшим к ней исходным точкам наблюдения. Следовательно, сначала нужно найти эти п бли жайших точек и подсчитать соответствующие им расстояния от точки с номером к заданной сети. В математическом обес печении ЭВМ обычно имеется стандартная программа такого поиска, и поэтому мы на ней останавливаться не будем. Это совсем не умаляет важности этого этапа в построении карты, но заметим, что эффективность выполнения этой операции во многом зависит от быстродействия ЭВМ.
Допустим, что с помощью некоторого метода мы определим п ближайших тбчек к заданной точке с номером к. Согласно
теореме Пифагора, расстояние Dik от точки с |
номером i до |
точки с номером к будет равно |
|
Dik = V (Xik — Xn)2-j-(X2k — X2I)2. |
(6.12) |
Вычислив расстояние Dik для всех п ближайших точек, можно подсчитать значение Yk по следующей формуле:
2 (Yi/D,k)
(6.13)
2 (l/Dik)
1=1
Процесс этих вычислений можно показать на примере дан ных, приведенных на фиг. 6.7, в. Мы произвольно выберем че-
тыре ближайшие точки (т. е. |
п =4) |
и подсчитаем Yk. На |
||
фиг. 6.7, в числа |
1, 2, 3, 4 являются номерами точек. Тогда |
|||
D,k= V |
( 2 ,0 - 1,5)2+ ( 3 , 0 - 3,6)2 -=1/061 = 0,78, |
|||
D2k= V |
(2,0 |
- 3,0)2+ (3,0 |
— 3,0)2 = |
У ТМ = 1 .0 0 , |
D3k = У (2,0 |
—2,0)2-}-(3,0 |
—2,4)2 == У о М = 0,60, |
||
D4k = 1 / ( 2 ,0 - 1 ,0 ) 2+ ( 3 , 0 |
- 2 , 9 ) 2 = |
] / Ш = 1,00. |
Используя полученные расстояния, можно вычислить Yk. Числитель выражения (6.13) будет равен
6.0 |
. 6.0 |
. 7.0 |
. 7.0 |
_ оо |
0,78 |
1.00 + |
0.60 |
1.00 |
— |
Соответственно |
знаменатель |
определяется как сумма |
||
1 |
, 1 , |
1 |
. ! |
= 4,95, |
0,78 |
1.00 |
0,60 |
1.00 |
так что
32,36 |
=6,54. |
|
4.96 |
||
|
Точно так же можно выполнить эту процедуру и для осталь ных точек заданной сети, которая со всеми вычисленными зна-
С |
PROGRAM |
6 . 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
с |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
С |
R O U T I N E G R I D |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
С |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
С |
PROGRAM Т О COMPUTE A |
R E C TAN G U LAR G R I D |
OF |
V A L U E S |
I N T E R P O L A T E D |
||||||||||||||||||
C |
FROM |
I R R E G U L A R L Y |
S PA C E D |
MAP |
D A T A . |
M A T R I X |
OF G R I D |
V A L U E S |
I S |
||||||||||||||
C |
P R I N T E D |
OUT |
AND |
A LS O |
P L O T T E D |
A S |
A |
L I N E |
P R I N T E R |
CONTOUR |
|
|
|||||||||||
C |
MAP B Y |
S U B R O U T IN E |
P L O T . |
|
A CONTR OL' |
CA RD |
I S |
F I R S T READ |
T H A T |
||||||||||||||
C |
C O N T R O LS T H E |
S I Z E |
O F T H E |
F I N I S H E D M A P . |
|
SEE |
BELOW |
FOR |
FORMAT |
||||||||||||||
C |
S P E C I F I C A T I O N . |
|
|
N E X T |
D A T A ARE RE AD |
I N |
AS |
AN |
N B Y |
3 M A T R I X , |
|||||||||||||
C |
WHERE |
N |
I S T H E |
|
NUMBER |
O F O B S E R V A T I O N S . |
|
T H E |
F I R S T |
COLUMN |
C O N - |
||||||||||||
C |
T A I N S |
X I ( E A S T - W E S T OR |
ACR OSS |
T H E M A P) |
C O - O R D I N A T E , |
T H E |
SECOND |
||||||||||||||||
C |
COLUMN |
C O N T A I N S |
X 2 ( N O R T H - S O U T H |
OR |
DOWN |
T H E |
M A P ) , |
AND |
THE |
T H I R D |
|||||||||||||
C |
COLUMN |
C O N T A I N S |
T H E |
D E P E N D E N T V A R I A B L E . |
|
T H E MAP AS |
PRODUCED |
||||||||||||||||
C |
B Y P L O T |
W I L L |
HAVE |
9 |
E Q U A L L Y S P A C E D |
CO NT OUR BAN D S |
S C A L E D |
|
|||||||||||||||
C |
BETWEEN |
T H E |
M A XIM U M |
AND |
M I N I M U M |
V A L U E S |
O F |
Y . |
|
|
|
|
|
||||||||||
C |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
C |
S U B R O U T IN E S |
R E Q U I R E D |
ARE |
R E AD M , |
P R I N T M , |
AND |
P L O T . |
|
|
|
|
||||||||||||
C |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
D I M E N S I O N D A T A ( 2 0 0 , 3 ) , D I S T ( 2 0 0 ) , A M A P ( 6 0 , 1 0 0 ) |
|
|
|
|
|
|||||||||||||||||
C |
N D * 2 0 0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
C . . . |
RE AD MAP CO N TR OL CA RD |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
C . . . |
FO RMAT |
OF C ONTROL CA RD |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
C |
|
|
C O L . |
1 - 8 W ID T H |
OF MAP |
I N I N C H E S |
|
|
|
|
|
|
|
||||||||||
C |
|
|
C O L . |
9 - 1 6 |
X I |
V A L U E O F |
L E F T EDGE |
OF |
MAP |
|
|
|
|
|
|||||||||
C |
|
|
C O L . |
1 7 - 2 4 |
X I |
V A L U E |
O F |
R I G H T |
EDGE O F MAP |
|
|
|
|
||||||||||
C |
|
|
C O L . |
2 5 - 3 2 |
X 2 |
V A L U E |
O F |
BOTTOM |
EDGE |
OF |
MAP |
|
|
|
|||||||||
C |
|
|
C O L . |
3 3 - 4 0 |
X 2 |
X2 V A L U E |
O F |
TOP |
EDGE |
OF |
MAP |
|
|
|
|||||||||
C |
RE AD |
( 5 , 1 0 0 1 ) |
|
W I D T H , X |
I M I N , X I M A X , X 2 M I N , X2MAX |
|
|
|
|
|
|
||||||||||||
C |
|
|
|
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
C... |
C A L C U L A T E MAP |
|
S I Z E |
AND |
S C A L E |
PAR A M ET ER S |
|
|
|
|
|
|
|
||||||||||
C |
I W « W I D T H * I 0 . 0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
I H B W I D T H * 6 . 0 * ( X 2 M A X - X 2 M I N ) / ( X I M A X - X I M I N ) |
|
|
|
|
|
|
|
|||||||||||||||
|
D X I = ( X I M A X - X I M I N ) / F L O A T ( I W - 1 ) |
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
D X 2 * ( X 2 M A X - X 2 M I N ) / F L O A T ( I H - I ) |
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
C |
S M A L L a ( D X 1 * D X l + D X 2 * D X 2 ) / l 0 0 0 0 . 0 |
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
C . . . |
RE AD |
AND P R I N T |
I N P l t t |
D A T A M A T R I X |
|
|
|
|
|
|
|
|
|
|
|||||||||
C |
C A L L R E A D M ( D A T A , N , M , N D , 3 ) |
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
C A L L P R I N T M ( D A T A , N , M , N D , 3 ) |
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
C |
W R I T E ( 6 , 2 0 0 1 ) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
C . . . |
C A L C U L A T E M AP V A L U E S |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
C |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|