книги / Статистический анализ данных в геологии. Кн. 1
.pdfпользовать нормальное приближение к биномиальному распре делению [40J, выражаемое формулой (4.74), и найти вероят ность появления заданного значения отклонения от среднего. С этой целью можно использовать таблицы стандартного нор мального распределения.
Z —Y п~ (2arcsin|/0 /я * — 2arcsin]/P). |
(4.74) |
Подставляя требуемые значения для двух последовательностей в формулу (4.74), получим
Z = У 12 (arcsin У 2/12 — 2arcsin)A),27),
или
Z = 3,46 (2 arcsin 0,41 — 2 arcsin 0,53) = — 0,97.
Сравнивая две случайные последовательности, мы можем ожи дать три совпадения, а наблюдаем два, что на одно стандартное отклонение отличается от ожидаемого числа совпадений. Наблю даемое число совпадений в этой позиции вполне может быть слу чайным.
В качестве примера применения этого корреляционного мето да рассмотрим задачу сопоставления множеств наблюдений в разрезах угольного бассейна центральной Англии. Хорошие об нажения пород здесь редки, а электрокаротаж не дает какойлибо информации, поэтому большая часть данных о стратигра фической последовательности получена из глубоких выработок, таких, как карьеры и шахты. Закодируем литологические раз новидности пород таким образом: 1 — песчаник; 2 — алевролит;. 3 — сланец, не содержащий фауны; 4 — подстилающая глина;. 5 —уголь; 6 — сланец, содержащий фауну; 7 — известняк. Пер вый разрез изучался в затопленной угольной шахте. Второй, ме нее мощный разрез обнажен в стене открытого угольного карье ра в 10 км от первого. Найдите положения наилучшего совпаде ния короткой и длинной последовательностей. Данные приведе ны в табл. 4.28.
Из предыдущего примера ясно, что метод изучения взаимо
связей не обязательно |
эквивалентен |
методу |
взаимной |
корреля |
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
та б л и ц а 4.28 |
||
Два |
закодированных стратиграфических разреза в центральной Англии |
|||||||||||||||
|
|
(Основание) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Разрез |
шахты |
2 |
4 |
5 |
6 |
3 |
4 |
5 |
3 |
1 |
|
4 |
5 |
3 |
4 |
5 |
|
|
3 |
4 |
5 |
4 |
5 |
3 |
2 |
4 |
5 |
|
3 |
4 |
5 |
3 |
1 |
|
|
4 |
5 |
4 |
5 |
6 |
3 |
4 |
5 |
6 |
|
3 |
4 |
5 |
2 |
1 |
|
|
3 |
4 |
5 |
3 |
5 |
3 |
2 |
4 |
5 |
|
3 |
5 |
2 |
|
|
|
|
(Основ:ание) |
|
|
|
|
|
|
|
|
|
|
(Верх) |
|
||
Разрез |
карьера |
4 |
5 |
3 |
4 |
5 |
4 |
5 |
3 |
2 |
|
1 |
2 |
4 |
5 |
3 |
Обо з н а ч е н и я: |
1— песчаник, 2— алевролит. 3— сланец, |
не содержащий фауны. |
||||||||||||||
4 — подстилающая |
глина, 5 — уголь, |
6— сланец, |
содержащий |
Фауну, |
7— известняк. |
|
272
ции. Имея дело с временными рядами, мы должны предпола гать, что наблюдения располагаются в точках вдоль некоторой прямой: это ограничение отсутствует в анализе взаимосвязей. Наши данные могут просто состоять из последовательности со стояний, перечисленных в том порядке, в котором они встреча ются. Как и в только что приведенных стратиграфических раз резах, расстояния между последовательными точками в этом случае несущественны.
Аналогичным образом нечисловые последовательности мож но сравнивать с самими собой; этот процесс называется автоас социацией. Автоассоциация полезна при исследовании перио дичностей в порядке следования состояний и очень широко ис пользовалась при исследовании циклотем [47J.
В этом случае сравниваются не две последовательности, а одна последовательность сама с собой. Укажем вероятность хотя бы одного совпадения в этом случае. Биномиальная веро ятность получения данного числа совпадений в случайной после довательности при сравнении ее самой с собой составит
(4.75)
Мы предполагаем, что последовательность представляет со бой случайное размещение т состояний или классов, причем каждое состояние встречается Хь. раз. Общее число наблюдений
равно |
т |
1>Хк=п> Эту вероятность надо прямо подставлять в. |
|
(4.72) |
k=i |
и использовать при вычислении х2-распределения и стан |
дартного отклонения. Критерий предназначен для проверки ну левой гипотезы, заключающейся в том, что число совпадений не отличается существенно от ожидаемого числа совпадений для случайной последовательности при сравнении ее с самой собой.
Для иллюстрации применения метода автоассоциаций мож но использовать данные из разреза шахты (см. табл. 4.27). Если в разрезе шахты будет содержаться много повторяющихся элементов, то это приведет к необыкновенно высоким значениям отношений, характеризующих совпадения, и к значительным от клонениям от ожидаемого среднего числа совпадений. Интер претация графиков, характеризующих взаимосвязи, проводится аналогично интерпретации коррелограмм. Однако коэффициент взаимосвязи вычисляется на основании номинальных данных, и в силу этого информация, содержащаяся в последовательности, значительно беднее, чем в эквивалентном временном ряду. Так как мы используем качественные данные, то не можем ожидать того же результата, который можно было бы получить при ана лизе настоящих временных рядов. Этот фактор необходимо учи
тывать при интерпретации результатов по взаимосвязям и авто ассоциациям.
18—201 |
273 |
ПОЛУВАРИОГРАММЫ
Термин геостатистика сейчас широко применяется к специ альным ветвям прикладной статистики, начало развития кото рой было положено Г. Матероном в Центре математической морфологии в Фонтенбло, Франция. Цель геостатистикн состоя ла в исследовании проблем, которые возникают тогда, когда обычная статистическая теория используется в оценке измене ний содержания руды в рудном теле. Однако так как геостати стика есть абстрактная теория статистического поведения, она применима ко многим обстоятельствам в различных областях геологии и других естественных наук.
Ключевое понятие геостатистики — понятие регионалнзованнон переменной, которая имеет свойства, промежуточные между свойствами полностью случайных величин и полностью детерми нированных переменных. Типичные регионализованные пере менные являются функциями, описывающими естественные яв ления и имеющими географическое распределение, такие, как высота над уровнем поверхности, изменения содержаний в руд ном теле или спонтанный электрический потенциал, измеренный в скважине методом каротажа. В отличие от случайных, регионализованные переменные непрерывны от точки к точке, но из менения их настолько сложны, что они не могут быть описаны какой-либо регулярной детерминированной функцией.
Даже несмотря на то что регионализированная переменная непрерывна в пространстве, обычно невозможно знать ее значе ние в любой точке. Вместо этого ее значения известны только благодаря пробам, которые берутся в определенных местах. Размер, вид, ориентация и пространственное размещение этих проб составляют базу регионализованной переменной. Эта пе ременная при изменении хотя бы одного из этих параметров бу дет иметь различные характеристики. Например, предположим, что мы хотим определить изменчивость сорта вкрапленных руд в молибденовом месторождении. Вероятно, результат анализа 5-сантиметрового керна, полученного при алмазном бурении, бу дет отличаться от результата измельчения проб из рудных отва лов. В обоих случаях мы могли бы взять в точности то же самое число проб, п они могли бы быть получены из идентичных мес
тоположений в руднике. Однако |
тот факт, |
что объемы проб в |
одном множестве измеряются в кубических |
сантиметрах, а в |
|
другом — в кубических метрах, |
неизбежно |
должен влиять на |
схему изменчивости сортности руды, которую мы картируем в
руднике. Главная задача |
геостатистикн — связать |
результаты, |
полученные по одной базе |
(например, образцы |
керна), с ре |
зультатами, полученными для другой базы (например, эксплуа тационные блоки).
Геостатистнка позволяет дать оценки формы регионализиро-
274
ванных переменных в одном, двух и трех измерениях. В следую щей главе мы более подробно рассмотрим процедуру оценки, называемую крайгингом. Сейчас мы коснемся лишь одной из важнейших статистических характеристик геостатистикн, а имен но понятия полудисперсии, которое используется для выраже ния скорости изменения регионализованных переменных вдоль заданного направления. Оценка полудисперсии содержит про цедуры, аналогичные процедурам анализа временных рядов, следовательно, приводит к необходимости использования геоста тистики.
Полудисперсии есть мера степени пространственной зависи мости между пробами взоль заданной базы. Для простоты мы предположим, что пробы являются точечными измерениями не которого свойства, такого, как глубина подповерхностного гори зонта. Для облегчения вычислений мы будем далее предпола гать, что база регулярная, т. е. пробы равномерно расположены в пространстве вдоль прямых линий. Если расстояние между пробами по прямой линии равно некоторой величине А, то полу-
дисперсия может быть вычислена для расстояний, кратных А
п—Н
ТА= - ^ £ № - * ш ,)2. |
(4-76} |
;=i
В этих обозначениях Xi — значение регионализованной перемен ной, взятой в точке г, Xi+h — другое значение, взятое через h интервалов. Мы поэтому нашли сумму квадратов разностей между значениями регионализованной переменной в паре точек, разделенных расстоянием Ah. Число точек равно п, так что чис ло сравнений между парами точек есть п—h.
Если мы вычислим полудисперсии для различных значений h. то мы можем нанести результаты на график в виде полувариограммы, являющейся аналогом коррелограммы. На рис. 4.41 представлена полувариограмма, соответствующая глубине сейс мически отражающего горизонта и построенная по измерениям вдоль сейсмического профиля, приведенного на рнс. 4.42. Заме тим, что когда расстояние между точками опробования равно кулю, то значение в каждой точке сравнивается с самим собой. Следовательно, все разности равны нулю, и полудисперсия для уо есть нуль. Если Ah — малое расстояние, точки при сравнении оказываются очень похожими, и полудисперсия будет мала. По мере увеличения расстояния Ah сравниваемые точки становятся слабее связанными друг с другом и расстояния между ними уве личиваются, что приводит к большим значениям ун. Предполо жим, что на некотором расстоянии сравниваемые точки нахо дятся так далеко, что они не связаны друг с другом, и их квад раты разностей будут равны по величине дисперсии относитель ного среднего значения. Полудисперсия более не растет и полу вариограмма переходит в плоскую область, называемую поро-
18* |
275 |
Рнс. 4.41. Полувариограмма абсолют ных отметок кровли меловой форма ции, измеренной вдоль морского сейс мического разреза в Магеллановом проливе, Чили [38].
Линия, изображенная точками, представтгяет порог, или дисперсию, возвышений и равна 8380 м\ Ранг, указанный стрел* кой. — расстояние, ниже которого разность между дисперсиями н порогом считается
пренебрежимо малой (3.5 км)
Рис. 4.42. Подпочвенные струк турные абсолютные отметки кровли меловой формации, оце ненные по отражению сейсми ческих волн вдоль 21-километ рового морского траверса в Ма геллановом проливе. Сейсмиче ские измерения взяты в 300-
метровом интервале [38]
гом. Расстояние, на котором полудисперсия приближается к дис персии, называется рангом, или размахом регионализованной пе ременной, оно определяет окрестность, в пределах которой все положения связаны друг с другом.
Для некоторой произвольной точки в пространстве мы мо жем представить себе окрестность как симметричный интервал (или площадь, или объем, в зависимости от размерности) во круг точки. Если регионализованная переменная стационарна или всюду имеет одно и то же среднее значение, то любое по ложение вне этого интервала совершенно независимо от цент ральной точки и не может давать информацию вокруг значения регионализированной переменной в этой точке. В пределах этой окрестности, однако, регионализированная переменная во всех наблюдаемых точках связана с регионализованной переменной в центральной точке и, следовательно, может быть использова на для оценки ее значения. Если мы используем множество из мерений, сделанных в точках внутри этой окрестности для оцен ки значения регионализованной переменной в центральной точ ке, то полувариограмма обеспечит собственные веса, которые должны быть приписаны каждому измерению.
Остановимся коротко на факте, который будет нам полезен позже. Полудисперсия равна не только среднему значению квад ратов разностей для пар точек, расположенных на расстоянии
276
Дй друг от друга, но и дисперсии этих разностей, т. е. полудислерсия может быть определена по формуле
т |
а |
= |
( |
4 |
-77) |
Заметим, что среднее значение регионализованной переменной Xi есть также среднее регионализованной переменной Xi+h, так как это — те же самые наблюдения, только взятые в другом по рядке, т. е.
( . f t
пп
Поэтому их разность должна быть равна нулю
S X f _ ъ х 1¥к = 0 i
пп
Комбинируя суммы, получаем
(IX i - 2 З Д In = [2 {Xi — Xt+h)] In = 0.
Подставляя в (4.77), мы видим, что числитель второго члена ра вен нулю, так что это уравнение совпадает с уравнением (4.76). Заметим, что это соотношение строго справедливо только тогда, ■когда регионалнзованная переменная стационарна. Если данные не стационарны, то среднее значение последовательности изме няется вместе с h, и (4.77) должно быть модифицировано.
Как и следовало ожидать, имеются математические соотно шения между полудисперсией и другими статистиками, такими, как автоковариацня и автокорреляция. Если регионализованная переменная стационарна, то полудисперсия для расстояния ДА равна разности между дисперсией н пространственной автоко вариацией для того же расстояния (рис. 4.43). Если регионали зованная переменная не только стационарна, но и стандартизо вана так, чтобы среднее равнялось нулю, а дисперсия единице, то полувариограмма будет зеркальным отражением автокорре ляционной функции (рис. 4.44).
К сожалению, часто регионализованные переменные не ста ционарны, скорее они отражают изменения их средних значений от точки к точке. Если мы попытаемся построить полувариограмму для такой переменной, то обнаружим, что она может не иметь описанных выше свойств. Однако если пересмотреть опре деление полуднсперсин, приведенное в формуле (4.77), то мы заметим, что оно состоит из двух частей, первая соответствует разностям переменной в паре точек, а вторая — среднему этих разностей. Если регионализованная переменная стационарна, то, как мы видели, вторая часть равна нулю, а если она неста ционарна, то это среднее будет иметь некоторое не равное нулю значение. Действительно, регионализованная переменная может быть рассмотрена как состоящая из двух частей, называемых остатком и дрифтом. Дрифт — это математическое ожидание ре гионализованной переменной в точке t, или с точки зрения вы-
277
-Лаг |
менной |
числений, взвешенное среднее всех точек внутри окрестности вокруг точки г. Дрифт будет иметь вид кривой, аппроксимиру ющей регионализованную переменную. Если дрифт вычесть из регионалпзованной переменной, то остатки Ri—Xi—X,- сами да дут регионализованную переменную, имеющую средние значе ния, равные нулю. Другими словами, остатки будут стационар ными и можно построить их полувариограмму.
Здесь мы неожиданно приходим к проблеме цикличности. Дрифт может быть оценен, если мы знаем размер окрестности и веса, приписанные точкам внутри этой окрестности. Однако веса могут быть вычислены только в том случае, если мы знаем полудисперсии, соответствующие расстояниям между точкой /, центром окрестности и различными другими точками Вычислен ный однажды дрифт вычитаем из значений, полученных при на блюдении. Полученную стационарную переменную в свою оче редь можно использовать для оценки размера окрестности в ви де полувариограммы.
Теперь ослабим строгость наших определений и перейдем к методу проб и ошибок. Сначала нужно признать, что нельзя определить окрестность в том смысле, в котором мы использова ли этот термин. Вместо этого окрестность определяется как
278
удобный, но все же произвольный интервал, в пределах которо го мы уверенно можем утверждать, что все позиции связаны друг с другом. Предположим, что в пределах этой произвольной окрестности дрпфт можно аппроксимировать простым выраже нием, например
Хо = 2Ь,Х;
(линейный дрпфт) или_же
Ха = 2(biA; + ЬгХ;2)
(квадратичный дрпфт). В эти формулы входят координаты всех заданных точек внутри произвольной окрестности, так что суще ствуют взаимосвязи между размером окрестности, дрифтом и полувариограммой остатков. Если окрестность велика, вычисле ния дрнфта будут основаны на большом числе точек, и дрифт можно будет представить очень гладкой кривой. В этом случае остатки будут характеризоваться большой изменчивостью, а полувариограмма окажется сложной по форме. Следовательно, специфика размера малой окрестности будет влиять на большую изменчивость оценки дрнфта, на уменьшение остатков и на про стоту вариограммы.
Определение коэффициентов b дрифта требует решения не которого числа совместных уравнений повышенной сложности,
описание которых откладывается до |
раздела, посвященного |
крайгингу. Единственные переменные |
в этих уравнениях — это |
полудисперспи, соответствующие различным расстояниям между точкой с номером г и другими точками в рассматриваемой окре стности. Однако они еще не дают полувариограммы, из которой следует получить необходимые полудисперсии. Можно допус тить, что полувариограмма имеет какой-либо естественный для
нее вид, и использовать его |
в качестве первого приближения. |
К счастью, легко предвидеть |
вид простой полувариограммы, |
п это позволяет использовать окрестность настолько малого раз мера, насколько это возможно.
Экспериментальные оценки дрифта вычитаются из соответст вующих наблюдений, в результате чего получается множество экспериментальных остатков. По этим остаткам можно вычис лить полувариограмму и затем сравнить ее с той полуварио граммой, которая была выбрана в качестве первого приближе ния, Если сделанные предположения были правильными, то обе они совпадут, и можно считать, что форма дрифта и полуварнограммы определены успешно. Однако более вероятно, что они отличаются, и следует проделать вычисления еще раз.
Процесс совместного построения удовлетворительных выра жений для полувариограммы и дрифта является важной состав ной частью «структурного» анализа. В некотором смысле это — искусство, требующее опыта, терпения и иногда удачи. Этот процесс не всегда приводит к приемлемым решениям, так как
2 7 9
они неоднозначны; много комбинаций дрифта, окрестностей и мо делей полувариограмм могут дать примерно одинаковые резуль таты. Он пригоден особенно в том случае, когда регионализованные переменные неустойчивы или же мы располагаем лишь короткой последовательностью. В таких обстоятельствах трудно сказать, когда мы достигнем эффекта от комбинации оценок.
Полувариограмма отражает пространственное поведение регионализованных переменных или их остатков. Некоторые иде ализированные формы полувариограмм даны на рис. 4.45.
На рис. 4.45, а приведена полувариограмма параболического типа, касающаяся оси X в начале координат. Она иллюстриру ет очень гладкое изменение регионализованной переменной. На рис. 4.45, б представлена полувариограмма, имеющая вид пря мой линии; она указывает на умеренное и непрерывное измене ние регионализованной переменной. Истинная случайная пере менная не будет непрерывной, и ее полувариограмма будет го ризонтальной линией, ордината которой равна дисперсии (рис. 4.45, в). В некоторых случаях полувариограмма не проходит че рез начало координат, а имеет при абсциссе, равной нулю, нену
левое значение. Этот случай соответствует «эффекту |
самород |
ков». Он изображен на рис. 4.45, г. В теории величины |
должна |
быть равна нулю. Эффект самородков возникает тогда, когда ре-
гионализованная переменная настолько |
ошибочно |
определена |
|
на |
коротком расстоянии, что полувариограмма выходит из ну |
||
ля |
на уровень эффекта самородков на |
расстоянии, |
меньшем, |
чем интервал опробования.
Моделирование полувариограмм
В принципе экспериментальная полувариограмма может быть прямо использована для получения оценок, которые мы рассмотрим в следующей главе. Однако полувариограмма изве стна только в дискретном наборе точек, расположенных на рас стояниях Д/г; на практике, однако, полувариограммы могут по-
Рис. 4.45. Идеализированные по лувариограммы:
а — параболическая форма, показываю
щая отличную непрерывность регионалнзованной переменной; б — линейная форма, показывающая умеренную не прерывность; в — горизонтальная фор
ма уровня <То2, соответствующая слу чайной переменной, не имеющей про странственной автокорреляции; г — эф
фект самородков, или явное отклонение полувариограммы от начала координат» показывающее, что регионализованная переменная сильно изменчива при рас стояниях, меньших чем интервал опро
бования
280
требоваться для любых расстояний независимо от того, являет ся ли оно кратным Д или нет. По этой причине дискретная экс периментальная полувариограмма должна быть представлена некоторой непрерывной функцией, которая может быть вычис лена для любого желаемого расстояния.
Подбор модельного уравнения к экспериментальной полувариограмме проводится обычно на глазок, методом проб и оши
бок. Кларк [9] |
описывает и дает примеры ручных вычислений, |
в то время как |
Олеа [38] приводит программу вычисления ли |
нейной полувариограммы, имеющей тот же угловой коэффи циент в начале координат, как и экспериментальная полува риограмма.
В идеале модель, выбранная для представления полуварио граммы, начинается в начале координат, гладко возрастает до некоторого верхнего предела, затем остается на одном по стоянном уровне. Сферическая модель, представленная на рис. 4.46, обладает этими свойствами. Она определена по формуле
(4.78)
для всех расстояний вплоть до области влияния полувариограм- ■мы а. За пределами этой границы ,р! = ао2. Сферическая модель обычно характеризуется как идеальная форма полувариограм мы. Иногда используется другая модель — экспоненциальная
— h
(4.79)
На рис. 4.47 сравниваются сферическая и экспоненциальная модели. Экспоненциальная кривая никогда не достигает своего предельного значения, а приближается к нему асимптотически. Значит, полудпсперсия экспоненциальной модели ниже, чем сфе рическая, для всех значений /г, меньших, чем размер области влияния. Линейная модель проще, чем сферическая или экспо ненциальная, так как она имеет только один параметр, наклон. Модель имеет вид
Yft = ah |
(4.80) |
и представляет собой прямую, проходящую через начало коор динат. Очевидно, эта модель не может иметь пика, так как она растет неограниченно. Иногда линейная модель произвольно мо дифицируется с помощью вставки внезапного излома в точке пи ка, как, например,
Чн = ah |
для h < a, |
4h = a02 |
(4.81) |
для |
Армстронг и Джебин [3] подвергают критике такие модели, так как использование крайгиига для получения оценок предпо лагает непрерывность и гладкое изменение полувариограммы. Однако для расстояний, значительно меньших границы, линей-
281