Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Статистика и анализ геологических данных

..pdf
Скачиваний:
2
Добавлен:
12.11.2023
Размер:
21.12 Mб
Скачать

Фиг. 6.45. Произведение карты стандартного отклонения размеров зерен на карту асимметрии размеров зерен в осадках, собранных на побережье Север­ ной Каролины.

Первоначальные параметры размеров стандартизированы, как это показано на фиг. 6.42. Положительные площади (заштрихованы) указывают на высокую корреляцию между картами поверхностей; области отрицательных значений указывают на обратную корре­ ляцию между картами.

Фиг. 6.46. Поверхности тренда третьей степени для стратиграфических фор­ маций в северо-западном Канзасе [28].

Возраст: а — меловой; б — пермский;

в — пенсильванский; г — миссисипский; д — ордо­

викский;

е — докембрийский.

нуля; множества данных с увеличивающимся разбросом имеют возрастающие таксономические расстояния между точками.

На фиг. 6.46 изображен ряд поверхностей тренда третьей сте­ пени, подобранный для последовательности формаций на неко­ торой площади в северо-западном Канзасе. В табл. 6.13 приве­

т а б л и ц а 6.13

Матрица коэффициентов корреляции между коэффициентами поверхности тренда третьей степени (коэффициент р0 исключен из рассмотрения) [29]

Возраст

 

б

 

 

д

 

а. Меловой

1,000

 

 

 

 

 

б. Пермский

0,684

1,000

 

 

 

 

в. Пенсильванский

0,672

0,250

1,000

 

 

 

г. Миссисипский

- 0 ,5 4 7

- 0 ,0 3 2

-0 ,0 3 6

1,000

 

 

д. Ордовикский

- 0 ,0 0 2

- 0 ,0 1 0

0,521

0,256

1,000

 

е. Верхний

-0 ,4 7 0

-0 ,4 8 6

-0 ,8 3 8

-0 ,2 4 8

- 0 ,6 9 3

1,000

докембрий

дена матрица коэффициента корреляции между соответствую­ щими коэффициентами каждой поверхности. В табл. 6.14

Т а б л и ц а 6.14

Матрица таксономических расстояний между коэффициентами поверхностей тренда третьей степени (коэффициент р0 исключен из рассмотрения) [29]

Возраст

 

б

 

 

д

а. Меловой

0 ,0 0 0

 

 

 

 

б. Пермский

0,510

0 ,0 0 0

 

 

 

в. Пенсильванский

0,565

0,691

0 ,0 0 0

 

 

г. Миссисипский

1,316

0,975

1,108

0 ,0 0 0

 

д. Ордовикский

0,943

0,789

0,629

0,936

0 ,0 0 0

е. Верхний

2,096

1,839

2,296

2,057

2,205

докембрий

приведена

матрица таксономических расстояний между теми

же самыми

поверхностями. Исследование этих двух матриц

28*

показывает, что относительное сходство, выявляемое этими двумя мерами, в обоих случаях одинаковое.

Уравнение поверхности тренда, полученное на основании од­ ного множества контрольных точек в регионе, может сильно от­ личаться от уравнения той же степени, полученного для других точек в том же регионе. Однако форма двух поверхностей тренда может быть одной и той же, и обе могут давать одинаково хо­ рошую аппроксимацию. Это вытекает из того факта, что урав­ нение тренда является уравнением регрессии на географических

координатах,

построенным по некоторому множеству данных

с указанным

местоположением, поэтому любое изменение по­

следних отражается в коэффициентах. По этой причине сравне­ ния между коэффициентами тренда обоснованны, если для по­ строения сравниваемых поверхностей тренда использовались одни и те же выборочные данные. Далее, абсолютные значения коэффициентов регрессии иногда подвержены сильным флуктуа­ циям, в особенности для высоких степеней, что является резуль­ татом машинного округления и отбрасывания избыточных раз­ рядов. Эти факторы ограничивают применимость данного ме­ тода сравнения карт поверхностей.

СПИСОК ЛИТЕРАТУРЫ

 

 

 

 

 

 

 

 

 

 

1. A g te rb e rg

F . Р .у Computer techniques in

geology,

Earth-Science Reviews, 3,

 

47—77,

1967.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Общий обзор, в который включено несколько примеров двумерного ана­

 

лиза.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2.

B e rry В . J . L .,

M a rb le

D . F .,

e d s.y Spatial analysis, a reader

in statistical

 

geography, Prentice-Hall, Inc., Englewood Cliffs, N. J., 512, 1968.

 

 

Подборка статей в этом томе представит интерес как для геологов, так и

3.

для географов. Многие из них взяты из малодоступных источников.

 

B la is R .

A ., C arlie r Р . A., Application of

geostatistics in ore evaluation, Ore

 

Reserve Estimation and Grade Control, 9, 41—68, 1967.

 

 

 

4.

Это одна из лучших статей о крайгинге, написанная на английском языке.

C h ay es

F .y On deciding whether trend surfaces of

progressively

higher

order

5.

are meaningful, Bull. Geological Soc. America, 81,

 

1273—1278,

1970.

 

C h orley

R .

J ., H a g g e tt

P .y Trend-surface

mapping

in geographical research,

 

Trans. Inst. British Geographers, Publ. No. 37, 47—67, 1965.

 

 

 

 

Необычайно ясное изложение с детерминистских позиций анализа поверх­

 

ностей тренда, большая часть примеров связана с геологией. Эта статья

6.

содержится в сборнике 2 под номером IV.7.

 

 

 

 

 

 

C och ran

W. Т.,

a n d

o th e rs, What is the

fast Fourier transform? Proc. Inst.

7.

Electrical and Electronics Engineers, 55,

1664—1674,

1967.

 

& Sons, Inc.,

C ole

J .

P „

K in g

 

C. A . M .t Quantitative geography, John Wiley

 

New York, 692,

1968.

 

 

 

 

 

 

 

 

 

 

 

 

Замечательный обзор анализа пространственных данных с точки зрения

 

географа. Часть 2 «Пространственные распределения и соотношения» бли­

8.

же всего

примыкает

к

вопросам,

излагаемым

в

этой главе.

 

 

 

C ote

L.

 

D a v is

J.

О.,

M a rk s W.,

M cG o u g h R .

J .,

M ehr E .,

P ie rso n

W. J

 

Jr .,

R o p er

J . F .,

Step h en so n

G ., V etter

R . C., The

direction

spectrum

of a

wind generated sea as determined from data obtained by the stereowave observation project, New York Univ. Meteorological Papers, 2, No. 6, 88, 1960.

9.

D a v is

J .

 

C .,

P re sto n

F .

 

W.,

Optical processing — an alternative

to

digital

 

computing,

in F en n e r

P .,

ed .,

Symposium on quantitative

geology,

Geolo-

 

ical Soc. America, Spec. Paper, 1972.

 

 

 

 

 

 

 

 

Boveton

J .

H ., P a r sle y

A .

/.,

Experimental evaluation of trend surface dis­

 

tortions induced by inadequate data-point distributions, Trans. Sec. b, Inst.

 

Mining and Metallurgy, В 197—B208,

1970.

 

 

 

 

 

 

 

 

На основе большого числа экспериментов обсуждается вопрос о влиянии

 

распределения данных точек на поверхность тренда. Фиг. 6.19 и 6.20 за­

11.

имствованы из этой статьи.

 

 

 

С., KWIKR8, a FORTRAN IV program

E s le r

J .

Е .,

S m ith Р .

F .,

D a v is

J .

 

for multiple

regerssion

 

and

geologic trend analysis, Kansas Geological

12.

Survey Computer Contribution, 28, 31, 1968.

geography, St.

 

Martin’s

Press,

H a g g e tt

P.,

Locational

analysis

in

human

 

 

New York, 339, 1965.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Современная книга, содержащая много методов, которые могут оказаться

 

новыми для геологов. Часть 2 «Методы пространственного анализа» по­

 

священа выборочным схемам, классификации регионов и проверке ста­

 

тистических гипотез о пространственных соотношениях.

 

 

 

 

 

13.

H a rb a u g h

J .

М .,

A

computer

method for four-variable trend analysis illus­

 

trated by a study of oil-gravity variations in southeastern Kansas, Kansas

14.

Geological Survey Bull., 171, 58, 1964.

 

 

in

stratigraphic

H a rb a u g h

J .

W., M erriam

D .

F .,

Computer applications

15.

analysis, John Wiley & Sons, Inc., New York, 282, 1968.

 

 

 

 

 

H a rb a u g h

J .

W.,

P re sto n

 

F .

W., Fourier series analysis in geology, Com­

 

puters and Computer Applications in Mining and Exploration, School of

 

Mines, Univ. Arizona, Tucson, R1—R46, 1966.

 

 

 

 

 

 

 

 

В работе рассматриваются вопросы, связанные с построением поверхно­

 

стей тренда по геологическим данным на основе простых и двойных ря­

 

дов Фурье. Эта статья входит в сборник 2 под номером IV-8.

 

 

16. IBM,

Numerical

surface

techniques

and contour map plotting, International

 

Business Machines, Data Processing Applications, White Plains, N. Y., 35,

 

1965.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Введение в методы построения карт.

 

 

 

 

 

 

 

17.

Ja m e s

W.

R ., FORTRAN

IV

program using double Fourier series for sur­

 

face fitting of irregularly spaced

data, Kansas

Geological

Survey

Com­

 

puter Contribution, 5, 19, 1966.

 

 

 

квадратов для

аппроксимации

 

Краткое

изложение

метода

наименьших

 

геологических данных

отрезком

двойного

ряда

Фурье. Фиг.

6.25

взята

18.

из этой статьи.

 

 

 

 

 

 

 

 

Р.,

Geometrical

probability,

Hafner

Publ.

K e n d a ll

М .

G .,

M o ran

 

Р .

А .

 

 

Co., New York, 125, 1963.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Гл. 2 посвящена распределению точек на плоскости.

 

 

 

 

 

19.

K in g

L .

/.,

Statistical

analysis

in

geography,

Prentice-Hall,

Inc.,

Engle­

 

wood Cliffs, N. J., 288, 1969.

 

 

 

 

 

 

 

 

 

 

 

 

Курс статистики повышенной трудности во многом перекрывается с этой

 

книгой.

Проверка

гипотез

о

 

распределении

рассматривается

в

гл. 5,

 

а тренд-анализ поверхностей — в гл. 6.

 

 

 

 

 

 

 

20.

K och

G.

S .,

Jr .,

L in k

R .

 

F.,

Statistical analysis of geological data, 1, John

 

Wiley & Sons, Inc., New York, 375, 1970.

 

 

 

 

 

 

 

21.

K och

G.

S .,

Jr .,

L in k

R .

 

F.,

Statistical analysis of geological data, 2, John

 

Wiley & Sons, Inc., New York, 438, 1971.

 

 

 

 

 

 

 

 

Тренд-анализ поверхностей рассматривается в гл. 9, а систематическое

 

Изложение теории и применения поверхностей отклика — в гл.

12.

 

 

22.

K rig e D . G.,

Two-dimensional weighted moving average trend surfaces for

 

ore valuation, Proc. Symposium on mathematical statistics and computer

 

applications in ore valuation, Johannesburg, 13—38, 1966.

 

 

 

Критика тренд-анализа поверхностей и обсуждение схем скользящего

 

среднего для предсказания рудных содержаний. В статье, за которой сле­

 

дует статья Крайга, указываются пункты, по которым имеются разно­

 

гласия между двумя лагерями, стоящими на противоположных точках

 

зрения. Читайте также статью Уиттена и следующее за нею обсуждение,

23.

содержащиеся в том же томе.

 

 

 

 

Ann Arbor, Mich.,

L i J .

С. R .y

Statistical

inference, 2, Edwards Bros. Inc.,

 

575,

1964.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В гл. 30 излагаются критерии криволинейной регрессии, которые допу­

24.

скают непосредственное обобщение на поверхности тренда.

 

M atk ero n

G.,

Principles

of

geostatistics, Economic Geology, 58, 1246—1266,

 

1963.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Этот обзор теории регионализированных переменных и применения край-

 

гинга написан человеком, внесшим наибольший вклад в разработку этих

 

вопросов. Хотя читать ее труднее, чем статью 3, она более доступна, так

 

как опубликована в более распространенном журнале.

 

 

 

25.

M ath ero n

G.,

Kriging

or

polynomial

interpolation

procedures,

Canadian

 

Inst, of Mining Bull., 60, 1041— 1045, 1967.

 

 

 

 

26.

M en d en h all

W .t Introduction to linear

models and the design and analysis

 

of experiments, Wadsworth Publ. Co.,

Inc., Belmont,

Calif., 465,

1968.

 

В гл. 10 рассмотрены вопросы подгонки поверхностей отклика к экспери­

27.

ментальным схемам.

 

 

e d s ., Computer applications

in the Earth scien­

M erriam D . F ., C ocke N . С .,

 

ces, Colloquium on trend analysis, Kansas Geological Survey Computer

 

Contribution,

12, 62, 1967.

 

 

 

 

 

 

 

 

 

Сборник одиннадцати статей, посвященных анализу тренд-поверхностей,

 

большинство из которых имеет статистический уклон.

 

 

 

28.

M erriam

D .

F .,

H a rb a u g h

 

J .

W.> Trend-surface

analysis of regional and

 

residual components of geologic structure in Kansas, Kansas Geological

 

Survey Spec. Dist. Publ. 11, 27, 1964.

 

 

 

 

 

29.

M erriam

D .

F .t S n e a th

P . H . A., Quantitative comparison of contour maps,

 

Jour. Geophysical Research, 71, 1105—1115, 1966.

 

 

 

 

 

Метод сравнения карт на основании коэффициентов корреляции тренд-

 

поверхностей в этой статье описывается при помощи данных из статьи 28.

 

Мы воспользовались таблицами, взятыми отсюда. Они приведены под но­

 

мерами 6.13 и 6.14.

 

 

 

 

 

 

 

 

 

30.

M ills F .

С.,

Statistical methods, 3rd ed., Holt, Rinehart, and Winston, New

31.

York, 842, 1955.

 

 

 

 

 

 

 

 

 

 

N e ft

D .

S . f

Statistical analysis for areal distributions, Monograph 2, Re­

 

gional Science Research Inst., Philadelphia, Pa., 172, 1966.

 

 

Компактное изложение вводного курса статистики, предназначенное для

32.

географов.

 

В.,

Automated

mapping,

Proc. 4th Australian Computer Conf.,

P a lm e r J . А .

 

Adelaide, 463—466, 1969.

 

 

 

 

 

 

 

 

 

Экспериментальные выводы о влиянии изменений контрольных парамет­

 

ров на эффективность оконтуривания.

 

 

 

 

 

33.

R o b in so n

J .

 

Е .\

Spatial filtering of geological

data,

Review of

the Inter.

 

Statistical Inst., 38, 21—32, 1970.

 

 

 

 

 

 

Хорошо иллюстрированное изложение анализа Фурье и пространственной

 

фильтрации, связанное с вопросами картирования, в особенности с кар­

34.

тированием подпочвенных структур.

 

 

 

Structural analysis

R o b in so n

J .

 

Е .,

C h arlesw o rth

Н . А .

K .t E llis

М .

 

 

using spatial filtering in interior plains of south-central Alberta, Bull.

 

American Assoc.

Petroleum

Geologists, 53, 2341—2367,

1969.

 

35.

Описание двумерного

анализа

Фурье и фильтрации структурных данных.

S a m p so n

R . /.,

D a v is

J .

С.,

Three-dimensional response surface program

 

in FORTRAN II for the IBM 1620 computer, Kansas Geological Survey

36.

Computer Contribution, 10, 20, 1967.

tables

for

locating elliptical

S in g e r

D .

A .,

W ickm an

F .

£., Probability

 

targets with square, rectangular, and hexagonal point-nets, Pennsylvania

 

State

Univ. Mineral Sciences

Experiment Station

Spec.

Publ., 1—69, 100,

37.

1969.

 

R . £., Contouring by

machine, A user’s guide, Bull. American As­

W alters

 

soc. Petroleum Geologists, 53, 2324—2340, 1969.

 

 

38.

Основополагающее и доступное изложение вопросов картирования.

W atson

G. S . y Trend-surface

analysis, Jour. Inter. Assoc. Mathematical Geo­

 

logy, 3, No. 3, 215—226, 1971.

 

 

 

 

 

39.

W hitten

£. H . T .f The

general

linear equation in prediction of gold content

 

in' Witwatersrand rocks, South Africa, Proc., Symposium on mathematical

 

statistics and computer applications in ore

valuation, Johannesburg, 124—

 

141,

1966.

 

 

 

 

 

 

 

 

 

Глава 7 АНАЛИЗ МНОГОМЕРНЫХ ДАННЫХ

В предыдущих главах мы рассмотрели анализ данных, пред­ ставляющих измерения одной переменной на каждом образце или наблюдаемом объекте. В гл. 5 и 6 мы изучили влияние гео­ графических или временных координат на выборочные характе­ ристики. Теперь мы остановимся на методах анализа многомер­ ных данных, в которых каждый наблюдаемый объект характе­ ризуется несколькими переменными. Многомерные методы позволяют одновременно изучать изменение набора характерис­ тик. Существует множество примеров геологических данных, к которым применимы методы многомерного анализа. Среди них можно назвать химические анализы, в которых переменные яв­ ляются процентными содержаниями или частями на миллион редких элементов; такие измерения в потоках, как сток воды, ко­ личество взвешенных частиц, глубина, содержание диссоцииро­ ванных твердых веществ, содержание кислорода, а также па­ леонтологические характеристики, как, например, множество из­ мерений, сделанных на особях некоторого ископаемого вида. Вспоминается и ряд других примеров. Некоторые из них яв­ ляются простыми обобщениями рассмотренных ранее задач, дру­ гие принадлежат к совершенно новому классу проблем.

Многомерные методы являются необычайно мощными, так как они позволяют исследователю работать с большим числом переменных, чем он может осознать сам. Однако они являются сложными, как с теоретической, так и с методологической точки зрения. Статистические критерии и процедуры большинства из этих методов разработаны лишь при очень сильных ограниче­ ниях. Вид этих критериев и их поведение при более слабых до­ пущениях (которые обычно используются при решении большин­ ства реальных задач) плохо изучены. В самом деле, некоторые из рассмотренных ниже процедур совсем не имеют теоретиче­ ского обоснования, а критерии значимости для них еще не со­ зданы. Тем не менее эти методы кажутся наиболее перспектив­ ными и многообещающими в геологических исследованиях.

В большинстве геологических задач приходится иметь дело со сложными комбинациями действующих факторов, которые не удается выделить в чистом виде и изучать изолированно. Зача­ стую бывает трудно принять обоснованное правильное решение относительно какой-либо из переменных. В этом случае лучший способ решения задачи состоит в ее всестороннем исследовании, которое позволяет выделить наиболее важные факторы. Методы, изложенные в данной главе, могут оказать в этом существенную помощь.

Множественная регрессия

Мы начнем нашу последнюю главу с изложения известных вещей, которые, однако, будут представлены в несколько нетра­ диционном и более общем виде. Это вопросы регрессии, которые включают теорию аппроксимации полиномиальными кривыми (изложенную в гл. 5) и анализ поверхностей тренда (рассмот­ ренный в гл. 6). Теперь, однако, мы не будем ограничиваться рассмотрением функций только расстояния или пространствен­ ных координат. Любую наблюдаемую переменную можно рас­ сматривать как функцию любой другой переменной, измеренной на тех же образцах. В гл. 5 мы изучали зависимость влажности осадка от глубины его залегания. Таким же образом можно из­ мерить процентное содержание монтмориллонита в осадке и со­ держание в нем воды. Мы могли бы измерить и еще несколько переменных, таких, как содержание органических веществ, сред­ ний размер зерен и общую плотность, а также изучить зависи­ мость содержания воды от изменения каждой или всех вместе взятых переменных. В некотором 'смысле переменные можно считать пространственными и изучать изменения, происходящие в направлении, определенном переменной. Это обычный прием; мы пользуемся им всякий раз, когда наносим на график зависи­ мость одной переменной от другой, используя при этом про­ странственную шкалу вместо первоначальной, по которой эти переменные были измерены. Такая замена с использованием р-мерного пространства широко применяется в литературе по многомерному статистическому анализу. Так же как поверхность тренда является двумерным аналогом аппроксимирующей кри­ вой, множественная регрессия является дальнейшим обобщением этих методов для многомерных случаев.

Мы не будем останавливаться на множественной регрессии очень подробно, так как теоретические и вычислительные ас­ пекты этой теории были изложены в предыдущих главах. Мы напомним только (см. гл. 5), что полиномиальную регрессию (от

одной независимой переменной) можно представить с помощью уравнения следующего вида:

Y= Po+PiX1+ p 2X ?+ . . .+ р тХ Г +е.

(7.1)

Эта модель утверждает, что наблюдение Y складывается из постоянного члена, степенного ряда некоторой независимой пе­ ременной и случайной компоненты. Нахождение коэффициентов Р в этом линейном уравнении по методу наименьших квадратов осуществляется путем решения системы нормальных уравнений, которую в матричной форме можно записать следующим об-

Разом: [EXJ • [£S] = [EY], (7.2)

где [2Y] — матрица, столбцы которой состоят из сумм квадратов и смешанных произведений переменной Y .с переменными Хь X2,J Х“ ; [SX] — матрица сумм квадратов и смешанных

произведений степеней переменной Xt и [Р] — столбец неизвест­ ных коэффициентов. Решение этого матричного уравнения:

[р] = [Е Х ]-‘ • [EYJ.

(7.3)

В гл. 5 мы находили элементы таких матриц, перемножая строки и столбцы исходных матриц.

Хотя в рассмотренном примере мы имели дело только с од­ ной независимой переменной (или с двумя, как в случае анализа поверхностей тренда, рассмотренном в гл. 6), эту же задачу мо­ жно трактовать и как многомерную, содержащую m независи­ мых переменных. Это станет очевидным, если мы запишем наше уравнение в следующем виде:

Y = PO+ P IX ,+ P 2X2+ . . . + P raXm+ e

(7.4)

и определим переменные как X i=X i, Х2= Х *, Хз=Х^

и т. д.

Тогда регрессионную модель, рассмотренную раньше, можно будет считать частным случаем многомерной модели, в которой независимые переменные определены некоторым специфическим образом. Соотношения между различными типами регрессион­ ного анализа представлены на фиг. 6.20.

Общий вид уравнения регрессии зависимой переменной отно­ сительно m независимых переменных представлен формулой (7.4). Система нормальных уравнений для нахождения решения по методу наименьших квадратов снова получается в результате попарного перемножения строк и столбцов матрицы уравнения. Для трех независимых переменных мы получим

Х0ХгХ2Х3

Y

Х0

Ьо

Xi

bi

х2

ь2

Х3

_Ьз _