Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Статистический анализ данных в геологии. Кн. 1

.pdf
Скачиваний:
28
Добавлен:
12.11.2023
Размер:
14.63 Mб
Скачать

рального значения s?,2, которое превышает значение сы2 времен­ ного ряда, составленного из независимых случайных точек. Кри­ терий основан на вычислении отношения

8 = sam3X/2s\

(4.97)

где s2max — наибольший пик периодограммы и s2— дисперсия всего временного ряда. Критическое значение g для спектраль­ ной вероятности р дается формулой

 

In р — 1м т

 

g ^ l - e

т- ' ~ ,

(4.98)

где т = п/2, если временной ряд содержит четное число наблю­ дений, и т —(п—1)/2, если п нечетно. Если проверяемая стати­

стика g превышает критическое значение g, то можно предполо­ жить, что периодическая компонента существует. Если прове­ ряемая статистика не превосходит критическое значение, то на­ блюдаемый спектральный пик s2max может возникнуть случай­ ным образом.

Непрерывный спектр

Гармонический анализ и построение периодограммы или ли­ нейного спектра целесообразны в тех случаях, когда исследуе­ мый временной ряд действительно перодичен. В природе встре­ чается немного естественных явлений, обладающих истинной периодичностью, не считая явления, связанные с астрономиче­ скими циклами, такими, как месячные приливы и отливы или сезонные изменения. Большинство геологических временных ря­ дов не периодические, а случайные. Последовательность называ­ ется случайной, если она может быть охарактеризована только с помощью статистических характеристик, в противоположность детерминированной последовательности, в которой состояние мо­ жет быть точно предсказано по ее коэффициентам. Даже в тех случаях, когда временной ряд не содержит действительно перио­ дических компонент, методы спектрального анализа позволяют получить ценную информацию о том процессе, который породил данную последовательность. Большинство временных рядов можно считать непрерывными последовательностями, даже не­ смотря на то, что данные по ним собираются в дискретном мно­ жестве точек. Для таких последовательностей можно вычислить непрерывный спектр, или функцию спектральной плотности, при­ чем дисперсия временного ряда разделена пропорционально в множестве частотных полос. Непрерывный спектр имеет вид непрерывной кривой, выражающей зависимость дисперсии от частоты, и аналогичен непрерывной функции распределения ве­ роятностей с дисперсиями, пропорциональными площадям под спектральной кривой между граничными частотами. Общая пло­ щадь под спектром равна общей дисперсии временного ряда, для которого она вычислялась. Наоборот, линейный спектр пе-

292

рноднческого временного ряда показывает дисперсии, присущие определенным индивидуальным частотам.

Каждая конкретная последовательность наблюдений, кото­ рую мы хотим анализировать, может рассматриваться как слу­ чайная выборка из большого, возможно, бесконечного множества таких временных рядов, которые могут генерироваться изучае­ мыми процессами. Полное множество временных рядов называ­ ется ансамблем, и это есть как раз та совокупность, из которой наша конкретная выборка извлекается.

Временной ряд называется стационарным, если его свойства не изменяются со временем. Пространственный ряд с теми же самыми характеристиками называется однородным. Если вре­ менной ряд подразделить па малые сегменты и средние по всем этим сегментам одинаковы (и совпадают со средним всего вре­ менного ряда), то в этом случае говорят о стационарности пер­ вого порядка или о стационарности в среднем. Если в дополне­ ние к этому автоковариация изменяется только с изменением ла­ га, а не в зависимости от положения внутри временного ряда, то говорят, что ряд обладает свойством стационарности второго по­ рядка. Это свойство иногда называют слабой стационарностью, или стационарностью в более широком смысле. Если все мо­ менты высшего порядка зависят только от лага и не зависят от положения, то ряд называется сильно стационарным или обла­ дает стационарностью в строгом смысле.

Если временной ряд не только сильно стационарен, но п все его статистики инвариантны от ряда к ряду внутри ансамбля, то ансамбль называется эргоднческим. Многие статистические критерии теории временных рядов обладают свойством эргодич­ ности так же, как одномерные статистические критерии облада­ ют свойством однозначности дисперсии. Если мы имеем несколь­ ко временных рядов, являющихся реализациями одного и того же случайного процесса, то мы можем провести проверку их на эргодичность. Вообще же мы имеем только одни временной ряд, м в этом случае никакая проверка такого рода невозможна. Мы можем проверить стационарность по средним значениям и дис­ персии для единственного временного ряда, применяя регрессию или подразделяя ряды на сегменты и проверяя, одинаковы ли эти статистики для различных сегментов. Если да, то ряд явля­ ется собственно стационарным и можно предположить, что он обладает свойством эргодичности. Если ряд не является собст­ венно стационарным, то ансамбль, из которого он извлечен, не может быть эргоднческим.

Иногда временной ряд может быть сделан стационарным применением простой процедуры уравнивания, или вычитанием линейного тренда из наблюдений, т. е. с помощью метода наи­ меньших квадратов вычисляется линейная регрессия У* на /. Тогда новый временной ряд определяется как ряд отклонений:

• 293

1 з

1 j

13'

(4.99)

У

= у

у .

 

где К,— предсказанные значения,

определяемые

с помощью

уравнения регрессии. Если исходный ряд характеризовался ма­ лым изменением его среднего значения, то новый ряд будет иметь стационарное среднее, равное нулю.

Для стационарного случайного временного ряда, являющего­ ся непрерывным и представленного дискретным набором равно­ мерно распределенных в пространстве точек, непрерывная дис­ персия (или энергетический спектр) может быть'вычислена од­ ним из двух методов. Более новый и более широко используемый метод основан на вычислении многих значений линейного спект­ ра с помощью алгоритма быстрого преобразования Фурье. За­ тем эти спектральные значения усредняются вдоль частот для получения сглаженной оценки непрерывного спектра. Как сле­ дует из названия, быстрое преобразование Фурье очень эффек­ тивный метод, а именно, он приводит к желаемому результату за «log2« арифметических операций, в то время как другие ме­ тоды требуют выполнения п2 операций. Представим соотноше­

ние Фурье в виде

IL

 

2

 

(4. Ю0)

 

П

 

2

где г = У—1— мнимая

единица. Выполнение преобразований,

диктуемых алгоритмом быстрого преобразования Фурье, требу­ ет математических и вычислительных навыков, которые нахо­ дятся вне рамок излагаемого в этой книге. Поэтому мы не раз­ виваем эту тему, хотя в настоящее время эти методы наиболее широко используются в спектральном анализе. Отличное введе­ ние в теорию быстрого преобразования Фурье вместе с алгорит­ мом дано Рейиером [43], который также дает примеры приме­ нения быстрого преобразования Фарье в географии. Первая ос­ новополагающая статья, посвященная алгоритму быстрого пре­ образования Фурье, была опубликована Джентльменом н Сендом [20], она основана на математических методах, которые впервые были введены Кули и Тыоки [11]. Современные руко­

водства по анализу временных рядов

(Блюмфельд

[7], Бендат

и Пнрсол

[6]) трактуют этот предмет весьма широко. Несколь­

ко более

старый метод вычисления

непрерывного

спектра со­

стоит в нахождении преобразования Фурье автокорреляционной функции временного ряда. Развитый первоначально Бартлет­ том [5], этот метод дает те же результаты, что н более новый метод быстрого преобразования Фурье, он легче для понимания, хотя и не удобен для вычислений. Он еще широко используется, особенно тогда, когда автокорреляционная функция также пред­ ставляет интерес и когда временной ряд не очень длинный. Ен-

294

кине и Уоттс [29], например, обсуждают этот метод, а Йевьевпч [64] применяет его к решению гидрогеологических задач.

Преобразование Фурье автокорреляционной функции дает энергетический спектр; для временного ряда, заданного дискрет­ ным множеством выборочных характеристик. Енкпнс и Уоттс [29] дают преобразование в следующем виде:

г—I

s 2

■ =

5

г%е '2тzfl

(4.101)

 

 

3

 

 

 

- Д - 1 )

 

Здесь S/2 — дисперсия или энергия в частотной полосе с центром в точке /; /р— автокорреляция с лагом /; максимальный лаг в

автокоррелограмме есть L, i=~)—1.

Заметим, что это равенство очень напоминает комплексное преобразование Фурье, заданное уравнением (4.100). Однако равенство (4.101) может быть значительно упрощено. Хотя ав­ токорреляционная функция может быть вычислена как для от­ рицательных, так и для положительных лагов, она симметрична относительно лага нуль; т. е. г;= г_г. Поэтому вычисления необ­ ходимо проделать только для значений I от нуля до L—1 и затем результат удваивается. Далее, так как наши данные состоят из конечного множества вещественных чисел, которые равномерно расположены в пространстве, мы можем использовать упрощен­

ное представление через косинусы,

а не общую форму. Более

простой вид уравнения (4.101), пригодный для

вычислений, та-

ков:

^

 

 

S;2 — Af!/2 = 2 |

2

ri cos 2*//1.

(4.102)

Необходимо работать с частотами, а не с гармониками, так как специфические лаги автокорреляционной функции не преобра­ зуются в простые кратные друг другу в частотном спектре. Со­ отношение между лагом и частотой дается формулой

h =

_j_

(4.103)

2&L

где Д — расстояние между последовательными наблюдениями во временном ряде, и / представляет как /-й лаг, так и /-ю спект­ ральную полосу. Частота /-й полосы есть fj и измеряется в цик­ лах на единицу (единицы те же, что и единицы А, расстояния между данными точками). Если А измеряется в миллиметрах, то f j задается в циклах на миллиметр.

Используя уравнение (4.102), мы получаем так называемый необработанный спектр. Из-за стандартной ошибки в каждой нз спектральных полос его нельзя считать удовлетворительным. Это препятствие нельзя преодолеть обычным образом, удлиняя временной ряд (увеличивая п — общее число наблюдений). Из­ вестно, что при увеличении п при фиксированном лаге / в фор­

2 9 5

мулах произведений (х,—X) (Xj+lX ') увеличивается коли­ чество информации и автокорреляционная функция г/ при этом будет иметь меньшую стандартную ошибку. Однако это невер­ но для S{2. Екинс и Уоттс [29] показали, что информация, со­ держащаяся в каждой оценке спектра sf2, распространяется на полосу частот, ширина которой вокруг / равна +1/п. По мере увеличения п общая информация, содержащаяся в дисперсии спектра, распределяется на увеличивающееся число полосок уменьшающейся ширины. В результате увеличение п делает возможной оценку дисперсии в более узких полосках частот, да­ вая смещенную оценку истинного спектра. Однако оценка стан­ дартной ошибки этих более узких полос не улучшается.

Бартлетт [5] впервые разработал метод уменьшения стан­ дартной ошибки в спектральных оценках на основе алгоритма, называемого либо методом скользящего окна, либо фильтраци­ ей, либо сглаживанием, либо пространственным усреднением. Автокорреляционную функцию можно определить взвешенным методом лагового окна или фильтра, и взвешенная автокоррелограмма может быть преобразована в спектральную область.

Веса придают особое значение более коротким лагам, кото­ рые основаны на большем числе наблюдений, чем более длин­ ные лаги. С другой стороны необработанный спектр может быть вычислен и затем сглажен взвешиванием и усреднением вместе с прилегающими спектральными значениями. Множество весов называется спектральным окном или фильтром и является пре­ образованием Фурье лагового окна. Оба метода дают эквива­ лентные результаты, которые можно характеризовать как сма­ зывание или сглаживание дисперсий примыкающих частот.

Множество окон или фильтров рассматривалось различными авторами; схема окон, имеющая наилучшие свойства, представ­

ляет собой наивысшее достижение

в анализе временных рядов.

Одно из наиболее

широко

используемых окон — это фильтр

Тыокн — Ханнпнга,

который

в спектральной области

имеет вид

 

 

 

 

(4.104)

Преобразование Фурье фильтра

Тьюкп — Ханнинга

в области

лага есть

 

 

 

(4.105)

 

 

 

 

Эта формула определяет веса автокорреляционной функции, ко­ торая гладко убывает от значения W/o= l,0 при нулевом лаге до ТС7!,=0,0 при максимальном лаге L. Каждый коэффициент авто­ корреляции умножается на соответствующий ему вес до выпол­ нения преобразования Фурье. Уравнение (4.102) принимает вид

(4.106)

296

Можно предложить и другие окна, обычно либо в области лагов, либо в области частот, так как их применение бывает легче то в одной форме, то в другой. Широко используемое Парзеновское окно имеет вид

Г

, =

1

( 1 -

- L )

для лагов между нулем и L/2, и

 

(4.108)

для лагов от L/2 до L.

Wi = 2(1 — Ш У

 

 

 

спектральных харак­

Практическая стратегия исследования

теристик случайных временных рядов включает следующие шаги.

1. Если необходимо, избавить от тренда или уравнять дан­ ные, вычислив коэффициенты регрессии У; на / п затем найти

остатки: У/ = YJ — YJ.

2.Вычислить автокорреляцию исходного ряда (если он ста­ ционарен) или ряда остатков У' вплоть до максимума лага L, который не превосходит nj3. Некоторые авторы рекомендуют вы­ числять более узкие пределы для максимума лага, например п/5, п/6 или даже я/10.

3.Вычислить необработанную спектральную плотность sr, используя дискретное преобразование Фурье, определенное урав­ нением (4.102).

4.Сгладить необработанный спектр, используя окно Тьюки— Ханникга (уравнение 4.104) в качестве скользящего среднего для получения сглаженной оценки дисперсии спектра.

Очевидно, в спектральном анализе имеется много способов принять решение, которое окажет влияние на окончательный ре­ зультат. Они включают выбор п, длины анализируемой после­ довательности (если это находится во власти исследователя); максимального лага L; и окна, используемого для сглаживания. Связи между этими переменными и их влияние как на разре­ шение, так п на значимость оглаженного спектра обсуждены по­ дробно в книге Енкинса и Уоттса [29].

Выполняя анализ Фурье, мы преобразовали наши данные из одной области в другую. Мы начнем с наблюдений за формой зависимости значений У; от координат точек пространства или времени x f. Последовательность точек образует сигнал или вол­

новую форму, определенную в плоскости координат А’ и У. В этом случае говорят, что данные находятся во временной или пространственной области и зависят от переменной X, обозна­ чающей координаты точек во времени или расстояние. Опреде­ лив компоненты частот в сигнале, мы преобразовали данные в частотную область. Физическая аналогия может быть изображе­ на на рисунке, где представлен эффект отражения солнечных лучей от зеркальных призм (рис. 4.58). Сноп белого света мож­ но рассматривать как комплексную волновую форму, изменяю-

297

шуюея с течением времени н состоящую из света различных цветов (или длин волн). Призма действует как частотный ана­ лизатор и разделяет пучок на его составляющие части, в резуль­ т а т чего на дисплее получается радуга. Каждая окрашенная полиса отделяется от соседней промежуточной зоной, ширина которой пропорциональна разности их длин волн или частот, а интенсивность каждой полосы пропорциональна вкладу дан­ ной длины полны н общую интенсивность исходного пучка, Ис­ следование спектра источника снега может сказать нам многое о строении источника света, его температуре, природе вещества, сквозь которое проходит свет и так далее. Аналогично исследо­ вание частотного спектра данной последовательности может рас­ сказать нам о его природе и источнике, дать информацию, кото­ рую нельзя получить никаким другим способом.

ФИЛЬТРЫ

Фильтром называется математический оператор, который из­ меняет заданный временной ряд в другой временной ряд, имею­ щий требуемую форму. Такие операторы называются «фильтра­ ми», так как первоначально они представлялись электронными фильтрующими целями, состоящими из сети сопротивлений и емкостей, используемых для выборочного подавления или уси­ ления специфических частот в электронных сигналах. Теперь те же функции по преобразованию цифровых сигналов выполняют­ ся на компьютерах математическими фильтрами. Основы тео­ рии фильтрации были заложены Норбертом Винером в работах по статистической теории связи, и эта теория находит свое прак­ тическое применение при обработке сейсмических сигналов и

Риг. 4,58. Призма служит частотным анализатором, преобразующим белый свет (в пространственной или временной области) в его составные части раз­ ных цветов (область частот)

2 9 8

данных аэрофотосъемок. В силу этого большинство терминов теории фильтрации произошло не из классической статистики, а из инженерной электроники и физики.

Методы теории фильтрации получили наиболее широкое при­ менение при исследовании отраженных сейсмических данных. Исследование сейсмических свойств отраженных сигналов осно­ вано на создании входного сигнала (сейсмическая энергия про­ изводится взрывом динамита или вибратором), который затем фильтруется в результате поглощения энергии сигнала по мере его путешествия сквозь земную толщу. Высокие частоты погло­ щаются более сильно, так что природа сейсмических колебаний изменяется по мере их передвижения. Добавим, что волны низ­ ких частот перемещаются через горные породы более быстро, так как начальный острый всплеск становится смазанным и ослабленным. Выходной сигнал, который обнаруживается набо­ ром поверхностных улавливателей, состоит из отражений сиг­ налов, возвратившихся из более глубоких горизонтов. К сожа­ лению, после их путешествия отраженные волны сильно дефор­ мированы и их трудно интерпретировать.

Задача геофизика — устранить настолько, насколько это воз­ можно, вредные эффекты физической фильтрации, которым сейсмический сигнал был подвержен. Это делается путем обра­ ботки сейсмических записей цифровыми фильтрами, которые устраняют нежелательные частоты, обостряют отражения и по­ давляют шум в записи до тех пор, пока требуемый, но ослаб­ ленный сигнал не будет выделен.

В силу того что многие возмущения сейсмических сигналов частотно согласованы, геофизиков особенно интересуют фильт­ ры, которые предпочтительно генерируют или устраняют специ­ фические частоты. Сейсмическая фильтрация часто проводится в этой области частот с помощью преобразования Фурье сейсми­ ческих сигналов и устранения нежелательных частей спектра и последующего преобразования отфильтрованного спектра об­ ратно в действительную область. Однако в точности тот же про­ цесс может быть реализован преобразованием фильтра области Фурье в реальные данные и последующей сверткой его преобра­ зования с сейсмическими записями сигналов. Так как эти фильт­ ры предназначены для прохождения определенных частот и по­ давления других частот, то они называются высокочастотными, низкочастотными или полосными фильтрами.

Теоретически можно построить совершенные фильтры, кото­ рые будут пропускать сигналы специфических частот п не про­ пускать другие частоты, но такие фильтры обычно трудно реа­ лизовать, Как правило, эти теоретически совершенные фильтры требуют бесконечного числа членов. Если они усекаются до при­ емлемых размеров, то фильтры сами начинают оказывать влия­ ние на выходной сигнал. Подобрать фильтры таким образом мо­

2 9 9

жет только высококвалифицированный работник, так как фильтр должен быть достаточно коротким и экономически выгодным и должен давать хорошую аппроксимацию требуемого на выходе сигнала с .минимальным числом нежелательных побочных эф­ фектов. Подробное изложение теории фильтров специфических частот содержится во многих специальных книгах. Мы же обра­ тимся к концептуально более простым типам фильтров и к во­ просам широкого использования анализа временных рядов во многих областях.

Временной ряд, который должен быть подвергнут фильтра­ ции, называется входящим, а преобразованный временной ряд, выходящий из фильтра, называется выходящим. Оператор фильт­ рации сворачивает входящий ряд с фильтром, в результате по­ лучается выходящий ряд:

[C] = [B]*[f].

(4.109)

Если на выходе мы хотим получить определенную форму, ска­ жем то фильтр может быть выбран таким образом, что действительный выходящий ряд [С] был настолько близок к требуемому выходящему ряду, насколько это возможно. Чтобы это сделать, вычислим элементы фильтра, который минимизи­ рует сумму квадратов разностей между [С] и [D\. Соответству­ ющий математический метод очень напоминает алгоритм вычис­ ления коэффициентов линейной регрессии. Робинсон и Трейтель [44] дают очень подробное и исключительно ясное изложение этого метода, называемого схемой наименьшего квадратичного фильтра.

Рассмотрим простой пример. Предположим, что входящий вектор В имеет два элемента [b0. bi], Тогда фильтр также со­ держит два элемента f/0. /J . Так как выход из фильтра являет­ ся сверткой входа и фильтра, то он состоит из трех элементов.

[С] = [В ]Х [/],

 

—с о

( /о

/ 1

I

[Cj =

' fo b »

Аf

'

h .

_/0bi

/А _

 

[C] —[fobо fob-i + fibo /,&,].

(4.110)

Если мы хотим, чтобы выход из фильтра равнялся некоторому заданному [Z>], то можно написать следующую систему совме­ стных уравнений

/сФо +

0 =

do,

 

f o b i +

f i b i

d i,

(4.111)

0 + f \ b \

= d2

 

или в матричной форме

з о а

Ь0

0

d0

 

Ь1

Го

dy

(4.112)

*0 }

0

L /1

 

1

V

 

Будем обозначать матрицу в левой части через [р].

Матричное уравнение переопределено, т. е, имеется три урав­ нения с двумя неизвестными. Однако если обе части уравнения умножить на одну и ту же величину, то уравнение остается не­

изменным. Так, умножив

обе части

на транспонированную к

|ф] матрицу, получим

 

 

 

 

 

Ш Р П Я = т '[Щ

 

 

пли

 

 

 

 

 

А 6, о ■ А

о -

7о'

bo by

О '

d0

О Ь0 ьи bi ь0

.h .

О bo

V

d\ *

. 0 6 , .

 

 

 

V d J

что можно записать в виде

A * + V

b o b y

u

b o d o

6 ,6 ,

V + b y \

A .

. b o d y

+

+

b y d y

b y d t _

(4.113)

Геофизики называют матрицу в левой части автокорреляци­ онной матрицей входа. Правая часть тогда есть кросскорреляцни между входом и выходом. Действительно, элементы этих матриц не являются коэффициентом корреляции, а являются неисправленными суммами квадратов и кросспроизведений. Од­ нако знаменатели любого корреляционого члена одинаковы и потому отсутствуют; решение этого уравнения будет одним и тем же независимо от того, используются ли коэффициенты кор­ реляции или квадраты и кросспроизведения. Решение находится обращением матрицы, стоящей в левой части, и последующим умножением на вектор правой части. Если матрицу в левой ча­ сти обозначить через [Я\, а вектор правой части через [А], то получим [/] = [Я .Н Г Р ­

ОДНО из общих применений теории фильтрации состоит в ис­ следовании встречаемости специальной волновой формы или ее цифрового представления в некотором временном ряде. Анали­ тик может попытаться превратить эту волновую форму в нечто более явное — острый пик или излом в выходном сигнале.

Пусть входящая волна В есть

[21]

и требуемый

выходной

сигнал имеет вид [D] = [300J. Они представлены на

рис. 4.59.

Подставляя эти значения в (4.113), получаем

 

'2

O'

7o‘

■3'

 

1

2

=

0

 

. 0

1.

J i .

.

0.

 

зо

Соседние файлы в папке книги