Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Статистика и анализ геологических данных

..pdf
Скачиваний:
21
Добавлен:
15.11.2022
Размер:
21.12 Mб
Скачать

Фиг. 5.29. Необработанный энергетический спектр мощностей озерных эоценовых отложений.

Данные взяты из табл. 5.17.

нову программы FOURER, принимается, что величина К равна длине данной последовательности, или N. В некотором смысле мы предполагаем,, что наши данные являются циклическими, т. е. что за последней точкой следует первая, как если бы в по­ следовательности соединились между собой начало и конец. Если мы вычислим значения, расположенные за пределами дан­ ной последовательности, то обнаружим, что предсказанные зна­ чения просто повторяются.

При графическом представлении получаемых результатов

принято наносить последовательные значения si на график при каждом значении номера гармоники п. Этот график называется энергетическим спектром. Энергетический спектр вышеуказан­ ных данных представлен на фиг. 5.29. Несмотря на то что в спектре обнаруживаются явные периодичности, последователь­

ные значения si обнаруживают сильную тенденцию к изменению. Это свойство характерно для необработанных энергетических спектров, и оно возникает в силу конечности длины временного ряда, из которого они получены. Более правильное представле­ ние об истинной периодической структуре временных рядов мо­ жно получить по сглаженному энергетическому спектру, кото­ рый является спектром, полученным простым сглаживанием с помощью какого-либо метода скользящего среднего. Хотя для этой цели можно использовать различные методы, рассмотрение их достоинств не входит сейчас в наши планы (подробное изложение этого вопроса содержится в книге Иенкинса и

Уотта [12]). Широко используется для этих целей фильтр Ганнинга

построенный по трем точкам. Фильтр Ганнинга был использован при модификации'Программы 5.6, после чего с ее помощью был получен сглаженный энергетический спектр, представленный на фиг. 5.30. Отметим, что энергетический спектр имеет пик при­ мерно в точке 11 лет. Второй видимый пик наблюдается при­ мерно на расстоянии половины длины волны от этого пика, т. е. примерно в точке 6 лет. Это гармоника с периодом, приблизи­

тельно равным 11 лет. Другие пики спектра

значительно ниже

и не являются значимыми.

Фурье — это ин­

Классические области применения метода

терпретация сейсмических данных и данных по дифракции рент­ геновских лучей. В первом примере геофизиков интересует опре­ деление периодичности сейсмических сигналов, так как они представляют «эхо» от глубинных горизонтов.

Анализ Фурье при изучении дифракции рентгеновских лучей позволяет выделять скрытые пространственные периодичности между отражающими плоскостями кристаллов, и поэтому та­ кой метод широко используется минералогами и кристаллогра­ фами и подробно освещен в литературе. Следующий довольно типичный и обширный круг задач, в которых метод Фурье до­ казал свою силу, меньше подходит к такой схеме. Массивы дан­ ных, зарегистрированные автоматическими записывающими уст-

Фиг. 5.30. Сглаженный спектр мощностей эоценовых слоев.

Ср. его с необработанным спектром на фиг. 5.29,

Фиг. 5.31. Магнитный профиль покрытых ледниковыми отложениями пород центральной Канады.

а — профиль,

при построении которого в

качестве

единиц на оси

X взяты километры,

а в качестве

единиц оси У — гаммы, т. е.

единицы

интенсивности

магнитного поля; о —

восстановленная геологическая структура

вдоль линии полета. Пунктирные блоки изо­

 

бражают силлы или погребенные пластовые базальтовые тела.

ройствами, слишком обширны для того, чтобы быть представлен­ ными здесь.

Над восточными районами центральной Канады при аэромаг­ нитной съемке было замерено изменение магнитной интенсив­ ности по заданному профилю. Результаты замеров представлены на фиг. 5.31. Хотя большая часть площади покрыта ледни­ ковыми отложениями, наземные наблюдения позволили пред­ положить, что такая изменчивость аэромагнитных данных могла возникнуть как следствие серии разрывных нарушений, разби­ вающих изучаемую территорию на ряд блоков, в которых вблизи от линии нарушения базальтовый слой приближается к поверх­ ности. То, что магнитный профиль содержит периодические ком­ поненты, наводит на мысль, что разломы, ограничивающие блоки, расположены в пространстве регулярно. Так как данные, записанные аэромагнитометром, довольно плотны, то к ним при­ меним анализ Фурье, и энергетический спектр, если он сущест­ вует, может оказаться периодическим. На фиг. 5.32 изображен сглаженный энергетический спектр, вычисленный по сигналам, представленным на фиг. 5.31. Наибольший пик спектра соответ­ ствует длине волны приблизительно 22 км. Второй, меньший пик, приходится на длину волны 18 км. Остальные пики могут быть

получены как комбинации гармоник, соответствующих этим двум. Аэромагнитный профиль содержит периодические компо­ ненты с длиной волны примерно 20 км. Это подтверждает наши предположения о тектонической структуре района под леднико­ выми отложениями.

Выполняя анализ Фурье, мы преобразовали данные из од­ ного типа в другой. Начинали мы с~наблюдений, представляю­ щих собой значения переменных Yi при заданных пространствен­ ных или временных переменных Хь Последовательность точек образует сигнал в форме волны, представленный на координат­ ной плоскости X, Y. В зависимости от того, является ли X прост­ ранственной или временной переменной, мы имеем дело с Про­ странственными или временными данными. Определив частотные компоненты в сигнале, мы преобразовали данные в области ча­ стот. На фиг. 5.33 изображена некоторая физическая аналогия этого явления, а именно разложение солнечного света в стеклян­ ной призме. Пучок белого света представляет собой сложную волну, изменяющуюся во времени и составленную из световых волн многих цветов (или различных длин). Призма в данном слу­ чае осуществляет анализ частот и разделяет пучок света на его составные части, которые образуют спектр. Каждая окрашенная полоса отделяется от соседней промежуточной зоной, ширина которой пропорциональна разности их длин волн или частот, а интенсивность каждой полосы пропорциональна вкладу данной длины волны в общую интенсивность исходного пучка. Исследо­ вание светового спектра позволяет получить информацию о строе­ нии источника света, его температуре, природе вещества, через

Фиг. 5.32. Сглаженный спектр аэромагнитных данных, представленных на фиг. 5.31.

Пик отмечается примерно при значении длины волны 22 км.

Фиг. 5.33. Призма является частотным анализатором, преобразующим белый свет (в пространственной или временной области) в его составные части разных цветов (область частот).

которое проходит свет, и т. д. Аналогичным образом, исследуя спектр последовательности данных, мы можем получить инфор­ мацию о природе и происхождении этих данных, которую совсем не просто получить другими методами.

Последовательности событий

Мы не рассмотрели еще один интересный тип временных ря­ дов, называемых последовательностями событий. Примерами геологических данных такого рода могут служить исторические сведения о землетрясениях в Калифорнии, запись о вулканиче­

ских

извержениях в Средиземном море

или случаях

оползней

в Титоие. Характеристики этих рядов следующие:

 

а)

события различаются моментами времени, в которые они

произошли;

 

 

б)

события по существу своему мгновенны;

 

в)

события настолько редки, что никакие два не происходят

в один и тот же временной интервал.

рассматривать

как по­

Последовательности событий можно

следовательность интервалов между их реализацией. Наши дан­ ные могут содержать также продолжительность интервалов между происходящими событиями или состоять из значений суммарных длин временных интервалов, характеризующих собы­ тия. Данные в одной форме могут быть просто преобразованы в данные другой формы.

Модели последовательностей событий можно использовать для анализа некоторых типов пространственных данных. Напри­ мер, нас. может интересовать частота обнаружения редких

ю i—

о

о

оо

о

о

о

о

10

20

30

40

50

60

70

80

 

 

Время ала расстоянае

 

 

 

Фиг. 5.34. Последовательности

событий,

 

которые

происходят

«мгновенно»

в

пространственном пли временном континууме.

 

 

Шкала времени или расстояния разделена на 10 отрезков, каждому из которых постав­ лено в соответствие число событий. Изображенная вверху линия есть прямая регрессии числа событий на отрезок по отношению к серединам отрезков.

минералов, спорадически встречающихся на пересечении шлифа, или же распространенность бентонитовых слоев в вертикальной последовательности разреза осадочных образований. Однако обоснование применимости методов исследования последователь­ ности событий к пространственным данным является очень тру­ доемким и базируется на предположении о постоянстве скорости образования пространственной последовательности. Это предпо­ ложение, вероятно, выполняется в первом примере, но во вто­ ром требуется установить дополнительное условие, заключаю­ щееся в том, что скорость осадконакопления постоянна в преде­ лах данной последовательности.

В большинстве исследований последовательностей событий рассчитывают на то, что удастся описать основные черты рас­ сматриваемого явления так, чтобы был вскрыт физический ме­ ханизм пространственного расположения событий. Сначала мы должны рассмотреть возможность проявления тренда в исход­ ных данных, что можно сделать двумя способами.

Последовательность можно разделить на некоторое число участков равной длины, так что каждый из них содержит не­ сколько наблюдений. Число событий в пределах каждого уча­ стка ставится в соответствие средней точке рассматриваемого участка. Выбирая в качестве значений зависимой переменной Yi значения координат центров участков, а числа событий в пре­ делах сегмента за значения аргумента Хь мы можем построить линию регрессии. Ее наклон, проверяемый с помощью критерия (5.25), рассматривается как индикатор тренда. Этот процесс проиллюстрирован на фиг. 5.34. К сожалению, этот критерий не

является очень эффективным, так как при подразделении после­ довательности на отрезки теряется некоторое число степеней свободы.

Имеются критерии, специально предназначенные для обнару­ жения тренда в скорости осуществления событий. Если ti — время или расстояние от начала ряда до i-ro события и п — число событий, то мы можем вычислить статистику S по формуле

S t .

 

S = - ^ - .

(5.71)

Эту статистику в свою очередь можно использовать в крите­ рии (5.72), где Т — общая длина последовательности, Z — стан­ дартизированная нормальная случайная величина, а значимость критерия может быть установлена по таблице нормального рас­ пределения, аналогичной табл. 3.8:

Z = ТIV 12п

(5.72)

Этот критерий очень чувствителен к изменению скорости по­ явления событий. Например, если появление событий можно описать формулой

Yt= ea+pt,

(5.73)

то нулевую гипотезу можно записать как равенство

(3 = 0. Если

в результате проверки мы устанавливаем, что модель экспонен­ циальная и что (3 отлично от нуля, то скорость появления собы­ тий Yt изменяется с изменением t. Именно реализацию этой воз­ можности мы и проверяем.

В любом исследовании последовательностей наблюдений це­ лесообразно графически представлять данные, как мы это де­ лали в регрессионном анализе. В случае последовательностей событий особенный интерес представляют графики суммарных чисел наблюдений в зависимости от времени. Тренд, если он имеется, обычно виден на этих графиках.

Если в скорости появления событий тренд не обнаружен, то можно сделать вывод, что последовательности событий можно рассматривать как стационарные. Следующее, что следует про­ верить,— это предположение о независимости последовательных событий. Это можно сделать с помощью вычисления автокорре­ ляционной функции для длин интервалов между событиями. Иными словами, надо рассматривать интервалы между собы­ тиями как переменную Хь принимающую значения в точках

с равномерным расположением в пространстве. Если интервалы не являются независимыми, то должна обнаружиться тенденция к тому, чтобы большие значения X (длинные интервалы между событиями) следовали за большими значениями. Аналогично должна быть и тенденция к тому, чтобы малые значения X (ко­ роткие интервалы) следовали за другими малыми значениями. Мы можем вычислить автокорреляцию для последовательных значений лага и проверить их значимость. Обычно только пер­ вые несколько значений лага представляют интерес. Если изло­ женные выше методы позволяют установить, что значения авто­ корреляционной функции несущественно отличаются от нуля, то мы можем заключить, что события происходили независимо во времени или пространстве.

Если мы установили, что последовательности не имеют ни тренда, ни автокорреляции, можно попытаться проверить гипо­ тезу о том, что события подчинены распределению Пуассона. Распределение Пуассона является дискретным распределением, в некотором роде аналогичным биномильному. Однако оно основано на следующих допущениях:

а) события происходят независимо; б) вероятность появления события пропорциональна длине

временного интервала, прошедшего от момента появления пре­ дыдущего события;

в) вероятность, что два события происходят в одно и то же время, исчезающе мала.

Среднее значение и стандартное отклонение распределения Пуассона равны между собой и зависят от скорости появления событий X, которая является его единственным параметром. Ти­ пичные распределения Пуассона представлены на фиг. 5.35. Это распределение используется при решении таких задач, как опре­ деление частоты поступления телефонных вызовов на коммута­ тор или задач, связанных с изучением надежности вычислитель­ ных систем. Кажется вполне оправданным их применение и к последовательностям геологических событий, описанных в на­ чале этого раздела. Если удастся установить, что наша после­ довательность подчиняется распределению Пуассона, то мы мо­ жем использовать характеристики распределения для получения вероятностных выводов о последовательности.

Мы не будем подробно рассматривать статистики, используе­ мые для проверки гипотезы о распределении Пуассона, однако приведем один простой критерий согласия для проверки того, что последовательность событий подчиняется такому распреде­ лению. Для того чтобы использовать этот критерий, мы должны преобразовать наши данные следующим образом:

(5.74)

Статистика K S — это просто абсолютное значение KS+ или KS~, т. е. той из них, которая больше. Критерий 1 основан на вычита­ нии теоретических значений распределения Пуассона из наблю­ даемых значений и на изучении их максимума. Критерий 2 бази­ руется на вычитании наблюдаемых значений из теоретических с последующим изучением максимума. Наконец, критерий 3 за­ ключается в выборе наибольшего значения из этих двух разно­ стей. В некотором смысле такой критерий является «двусторон­ ним», так как он приводит к отклонению гипотезы об эквива­ лентности, если наблюдаемые последовательности при сравнении с теоретическим распределением либо слишком высоко, дибо слишком низко значимы.

Применение статистики Колмогорова—Смирнова требует ис­ пользования специальных таблиц, таких, как, например, приве­ денные Миллером и Каном [16]. Однако мы можем вычислить критическое значение для 5%-ного уровня значимости (а = 0,05) по формуле

1 36

(5.76)

Критическое значение K S= —'-=•

V в

 

Нулевая гипотеза отклоняется при 5%-ном уровне значимо­

сти, если статистика, вычисляемая по формуле (5.75),

превосхо­

дит это значение.

 

Если применение этого критерия приводит к отклонению ги­ потезы о распределении Пуассона, то мы должны сделать вы­ вод, что данная последовательность не описывается никакой из моделей, обычно используемых в задачах данного типа. Опыт может навести на мысль об использовании других распределе­ ний, которые хорошо согласуются с нашими данными, однако возможна и такая ситуация, что построение адекватной теоре­ тической модели невозможно. В этом случае мы снова должны обратиться к эмпирической модели и построить распределение только на основании имеющейся последовательности событий.

Анализ

графиков зависимости переменных ti, Xi и

Yi может

в этом

случае сослужить хорошую службу. Значения

среднего

и дисперсии по Xi являются основой для предсказания будущих событий, а эмпирическое распределение можно построить исходя из ранжированных значений переменных Хь

Таким образом, анализ последовательностей событий вклю­ чает четыре этапа. Сначала мы проверяем предположение о на­ личии тренда: если он имеется, то для предсказания можно использовать метод регрессионного анализа. Если тренд отсутст­ вует, то мы переходим к исследованию автокорреляции. Автокоррелированные события можно предсказать на основании дан­ ных о непосредственно предшествующих событиях. Если авто­ корреляцию обнаружить не удается, проверим, не является ли