Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
58
Добавлен:
15.03.2019
Размер:
20.29 Mб
Скачать

экстремумов и формулы статистики критерия Стьюдента разные для случая однородной и неоднородной дисперсии; б) на критиче- ские значения статистик критерия Фишера влияют и асимметрия, и автокорреляция, а на статистики критерия Стьюдента – только ав- токорреляция.

К методам оценки качества данных также относится и проце- дура восстановления пропусков наблюдений и приведения непро- должительных рядов к многолетнему периоду в связи с тем, что для эффективного моделирования во времени необходимы непрерыв- ные ряды, продолжительные и примерно одинаковой длины, что- бы можно было сопоставлять результаты по пространству, и такое сопоставление было однородным. Это восстановление основано на построении регрессионных уравнений с одним или несколькими предполагаемыми аналогами, которые имеют как более продолжи- тельный период наблюдений, так и данные наблюдений в те годы, которые были пропущены на рассматриваемой метеостанции [19, 23, 27].

Уравнение множественной линейной регрессии, по которому осуществляется восстановление, имеет следующий вид:

Y b0 b1Y1 b2Y2 b3Y3 ,

(9.28)

где

Y

значения

климатической

характеристики в приводимом

 

пун-

кте;

Yj – значения

климатической характеристики в пунктах-анало- гах; l – число пунктов-аналогов; b0 – свободный член; bj – коэффи- циенты

уравнения регрессии при j = 1, 2, ..., l.

Хотя число предполагаемых аналогов в рассматриваемом реги- оне и может быть достаточно большим, например несколько десят- ков метеостанций, но в уравнение (9.28) одновременно включается не более трех, то есть рассматривается общий перебор всех анало- гов от 1 до 3 в уравнениях, что достаточно много. Так, если число предполагаемых аналогов 20, то общее количество уравнений рас- считывается по аналогичной формуле, как и (9.8), но для числа со- четаний 1, 2 и 3 из 20, что даст (20·19·18)/(1·2·3) = 1140 уравнений. Ограничение, равное трем аналогам, связано с тем, что при большем их числе, с одной стороны, существенно падает вклад каждого сла- гаемого в уравнении (9.28), а с другой стороны – идет формальный рост коэффициента множественной корреляции только из-за числа слагаемых, что в целом приводит к неустойчивости уравнения.

При расчете по (9.28) должны выполняться следующие

условия:

где n – число совместных лет наблюдений в приводимом пункте и пунктах-аналогах; R – коэффициент парной или множественной корреляции между климатическими характеристиками в рассма- триваемой метеостанции и в пунктах-аналогах; b – коэффициент уравнения регрессии; σb – средняя квадратическая погрешность ко-

эффициента регрессии; Rкр – критическое значение коэффициента

парной или множественной корреляции (обычно задается ≥ 0,7). Если хотя бы один из коэффициентов уравнения регрессии не

удовлетворяет условию (9.29), то это уравнение не используется для приведения к многолетнему периоду. Последовательность приведе- ния к многолетнему периоду такова:

–все уравнения, удовлетворяющие условиям эффективности, располагаются в порядке убывания коэффициентов корреляции;

–восстанавливаются погодичные значения климатической ха- рактеристики приводимого пункта за период совместных наблю- дений в пунктах-аналогах по уравнению с наибольшим значением коэффициента корреляции;

–далее используются уравнения регрессии, коэффициенты кор- реляции которых меньше предыдущего, но больше всех остальных;

–поэтапное восстановление погодичных значений продолжа- ется до тех пор, пока не будут использованы все уравнения регрес- сии, отвечающие условиям эффективности.

Восстановленные данные, полученные по уравнению (9.28) на основе метода наименьших квадратов (МНК), имеют система- тически заниженную дисперсию [12, 26]. Исключение системати- ческой смещенности дисперсии восстановленных данных осущест-

вляется путем введения поправки в значения, полученные по урав-

 

 

Y

Y Y

R

(9.30)

нению регрессии, котораяip

позволяетip cp

рассчитать

несмещенные

где Yip – значения, рассчитанные по уравнению регрессии (9.28); Ycp

значения (Y'

ip

) по формулеY ,

 

 

 

 

cp

 

 

 

– среднее значение приводимого ряда за совместный с пунктом- аналогом период.

После восстановления пропусков и увеличения продолжитель- ности временных рядов климатических характеристик их снова следует проверить на однородность, чтобы исключить отдельные некачественные восстановленные данные. Прежде всего следует ис- ключить неоднородные экстремумы, как восстановленные, так и на- блюденные, которые, с одной стороны, могут существенно исказить модель всего временного ряда, а с другой стороны – их исключение

313

как отдельного события не должно повлиять на параметры модели ряда. В результате будет сформирована база откорректированных данных, которую можно использовать для дальнейшего статистиче- ского моделирования.

Таким образом, подготовка информации для статистического моделирования состоит из следующей последовательности:

–оценки однородности эмпирических распределений на резко отклоняющиеся экстремумы;

–проверки однородности во времени вначале по критерию Фишера для дисперсий, затем по критерию Стьюдента для средних только для тех климатических характеристик, однородность кото- рых могла быть нарушена во времени;

–восстановления пропусков наблюдений и приведение рядов к многолетнему и практически одинаковому периоду;

–оценки однородности и качества восстановленных данных, исключение неоднородных экстремумов;

–формирования откорректированной базы данных климати- ческих характеристик для дальнейшего статистического моделиро- вания.

9.4. Методы декомпозиции и выделения однородных составляющих

Проблема декомпозиции хорошо известна в современном есте- ствознании. Наиболее актуальной она стала в радиофизике, где получили развитие многие известные статистические методы и па- радигмы декомпозиции, например понятие демодуляции сигнала, парадигма «сигнал – шум». К наиболее известным категориям ме- тодов декомпозиции относятся:

–спектрально-корреляционный анализ, предназначенный для разложения сложной функции, являющейся суммой гармонических составляющих (спектры Фурье), или вейвлет-анализ, как его разви- тие для привязки спектров различных сигналов ко времени

(измене- ние спектра во времени) [10, 15, 24];

–методы сглаживания, или различных видов осреднения, фильтрации, связанные с «гашением» высокочастотной составля- ющей и, таким образом, выявлением оставшейся низкочастотной компоненты [15, 24, 31];

–различные виды функций от времени, например тренд, гармо- ника плюс тренд, случайная составляющая плюс тренд и т. д. [15, 32].

Практически все методы предполагают или требуют априорно- го задания модели сложного процесса. Затем в заданной модели оце- ниваются коэффициенты, как правило, по эмпирическим данным, и на основе анализа уравнения и его остатков дается заключение о достоверности выбранного типа модели для аппроксимации рас- сматриваемого процесса. Так, при обычном осреднении предполага- ется, что композиция состоит из двух процессов и процесс меньшего масштаба имеет постоянные периоды и амплитуды. Спектральный анализ пригоден только для моделей, имеющих гармонический вид функции циклов при постоянстве периодов и амплитуд во времени или, даже в лучшем случае, – при известной функции их изменения во времени. Многие методы требуют априорного задания таких ве- личин, как период и амплитуда фильтруемого процесса и т. д.

Условия, для которых разработан каждый метод, определяют границы его применимости. Иногда эти границы не сформулирова- ны в явном виде, и их выявление является самостоятельной и трудо- емкой задачей. Как правило, при исследовании структуры климати- ческих процессов априорная информация об их свойствах или ми- нимальна, или отсутствует. Кроме того, совершенно не обязательно, чтобы закономерности исследуемого

процесса находились

в

пре-

делах области применимости

выбранного

метода.

В

подавляющем

большинстве

случаев

необходимо определить именно вид модели,

и его невозможно

задать априори. Поэтому наиболее эффективны-

ми можно считать

те методы,

которые

имеют

максимально

широкие

границы

применимости и наименьшие требования к виду модели, свойствах периодов и амплитуд процесса. Такие методы называют гибкими, или робастными (от английского слова robust, что озна- чает «крепкий», «сильный», «твердый») [14].

Если временной ряд является суммой процессов или составля- ющих разных временных масштабов и для каждой составляющей периоды и амплитуды циклов не постоянны во времени, а вид функ- ции не гармонический, то ни один из известных методов декомпо- зиции не подходит для их аппроксимации. Конечно, можно аппрок- симировать данные наблюдений суммой гармоник с постоянными периодами и амплитудами для каждой гармоники и достаточно хо- рошо подогнать модель к процессу, но это будет лишь формальная

«подгонка». За пределами временного ряда, то есть для условий экс- траполяции или прогнозов во времени, как правило,

такие «навязан- ные» природе модели дают плохие результаты.

составляющих разного временного масштаба, ни тем более свой- ства периодов и амплитуд циклов для каждой из этих составляю- щих. Установление закономерностей во времени и является той основной задачей, которую необходимо решить. Относительно же свойств климатических процессов, по крайней мере, очевидно, что вид функции циклов неизвестен и скорее всего не является гармо- ническим. Также неизвестны периоды и амплитуды циклов каждой однородной составляющей, которые вряд ли являются постоянны- ми во времени, так как постоянство этих характеристик не наблю- дается даже в космических факторах. Поэтому следует выбрать те методы, которые «не навязывают» природному процессу свой вид модели, не искажают его, а наоборот, позволяют на основе выявлен- ных закономерностей природного процесса получить адекватную

иправильную модель.

Ктаким методам декомпозиции относятся метод «срезки» и ме- тод сглаживания амплитуд циклов [17, 18, 21]. Они не требуют априорного задания вида функции, закономерностей периодов и ам- плитуд во времени, а основаны только на двух взаимодополняющих показателях: предельной наибольшей погрешности процесса и число квазиоднородных процессов.

Предельная погрешность процесса позволяет исследовать ам- плитуды колебаний, которые заведомо превышают погрешность про- цесса. Если эти амплитуды колебаний меньше предельной погреш- ности, то они не представляют интереса для исследования, так как обусловлены погрешностью или процессами малых временных мас- штабов. Поэтому можно считать, что заданная предельная погреш- ность является нижним граничным условием. Верхним же гранич- ным условием является число однородных процессов на рассматри- ваемом отрезке времени. В соответствии с (9.2) и (9.5) на интервале времени инструментальных наблюдений в 100–150 лет имеют место

процессы межгодового и десятилетнего масштабов, и часть

процесса столетнего масштаба. Процессы масштабов больше столетнего пред- ставлены в виде практически постоянной величины. Поэтому на дан- ном интервале общее число процессов разных масштабов равно 3. Если же рассматривать реконструированный ряд ежегодной темпе- ратуры воздуха за последний период в 1000–1200 лет, то таких про- цессов будет 4 и т.д. С другой стороны, чем продолжительнее рекон- струированный ряд наблюдений, тем больше его дискретность, или начальный период осреднения, который будет равен уже не 1 год, а 10 лет или 100 лет. В этом случае наименьшим является процесс не

межгодовой изменчивости, а десятилетней или столетней.

Алгоритм метода «срезки» состоит из следующих основных шагов. Прежде всего задается начальное предварительное значе- ние или амплитуда погрешности процесса (Aε) и число однородных процессов в композиции (m), далее определяются все экстремумы

рассматриваемого временного ряда, включающие минимумы: (9.31)

и максимумы:

Ymin 1 , Ymin 2 , … , Ymin j , … , Ymin k

 

 

(9.32)

 

Ymax 1 , Ymax 2 , … , Ymax j , … , Ymax k .

 

(остальные исключа-

Затем выбираются только те экстремумы

ются из дальнейшего рассмотрения), разность между

последователь-

ными

максимумами

и минимумами

которых

превышает заданную амплитуду погрешности процесса (Aε), и эти

экстремумы получают

название

экстремумов циклов

процесса

наименьшего масштаба:

 

 

 

 

 

 

 

Ymax j Ymin j

A ,

(9.33)

 

 

 

то есть на основании (9.33) принимается,

что флуктуации

гаранти-

рованно

обусловлены колебанием

процесса, а не погрешностью. В точках установленных минимумов принимается, что процесс наименьшего масштаба отсутствует,

поэтому эти точки последова-

тельно соединяются, и полученная

линия (кусочно-линейная или

 

(9.34)

другого вида) будет характеризовать

Yi

f t,Ym in j1

остальную часть композиции

за исключением процесса

где Y'i – значения процесса, полученные интерполяцией минимумов наименьшего масштаба:

циклов (Y'min j1) по времени (,t).

Затем определяются разности между наблюденными значени- ями общего композиционного процесса и значениями процесса, полученными на основе интерполяции минимумов, которые в «чи- стом» виде характеризуют процесс наименьшего масштаба:

Y1i Yi Yi .

(9.35)

После этого в выделенном, или «срезанном», таким образом процессе наименьшего масштаба (Y1i) определяются информатив-

ные характеристики циклов (периоды, амплитуды и т. д.), а остав- шийся после «срезки» процесс Y'i рассматривается как новый ком-

позиционный процесс без составляющей наименьшего масштаба. Процедура подобного последовательного отделения процессов раз- ных масштабов повторяется до тех пор, пока не останется, по край- ней мере, один цикл или часть его (тренд), характеризующая

наибольшего масштаба. Далее число выделенных однородных про- цессов сравнивается с заданным и если их число больше, то

предель-

ная погрешность процесса (Aε) увеличивается (например,

на 5 %),

а если меньше, то уменьшается (также на 5 %), и процесс

«срезки»

повторяется снова. Осуществляется такое число

повторений (итера- ций), пока число выявленных однородных процессов не будет равно заданному m.

Таким образом, метод «срезки» позволяет последовательно от- делять от композиции процессы разных масштабов, начиная с наи- меньшего. При этом основным критерием для идентификации каж- дого следующего по масштабу процесса служит превышение ампли- туды его колебаний над амплитудой погрешности процесса.

На рис. 9.4 показаны результаты разделения композиционного процесса (Yj), состоящего из трех составляющих разного масштаба

(Y1j, Y2j, Y3j) на эти три части, притом на верхнем графике пунктир-

ными линиями иллюстрированы еще и кусочно-линейные циклов процессов масштабов «срезка».

применения метода «срезки» для разделения композиционного процесса Yj на однородные

составляющие трех временных масштабов: Y1j, Y2j, Y3j

Алгоритм метода сглажи- вания амплитуд циклов анало- гичен алгоритму метода «срез- ки», но в этом методе вместо соединения точек минимумов значимых циклов соединяются точки середин ветвей подъема и спада циклов, то есть проис- ходит сглаживание амплитуд пульсаций (циклов). Результат применения метода показан на

рис. 9.5,

где

представлен

исходный

ряд

среднегодовой

на три

 

причем

температурысоставляющие,два его последо- третья составсглаживанияяющая представ- вательных . В дан- ляет собой тренд роста. Метод ном случае с помощью метода

сглаживания амплитуд циклов

не предназначен для разделения исходный процесс был

Рис. 9.4. Графическая иллюстрация

318

Рис. 9.5. Иллюстрация метода сглаживания амплитуд циклов для выявления процессов разных временных масштабов

сложного процесса на составляющие, как метод «срезки», но с его помощью можно эффективнее выделить процесс наибольшего мас- штаба. Причина в том, что по сравнению с методом «срезки» здесь применяется процедура сглаживания, а не соединение прямыми ли- ниями минимумов, тем более которых осталось мало, и они установ- лены с большими погрешностями. Поэтому методически правильно метод «срезки» применять для выявления процессов всех масшта- бов до наибольшего, а процесс наибольшего

масштаба выделять ме- тодом сглаживания амплитуд циклов.

9.5. Оценка эффективности методов декомпозиции

Оценку эффективности разных методов сглаживания и деком- позиции нагляднее всего показать на следующем примере. Предста- вим композицию в виде суммы трех разномасштабных гармониче- ских процессов и в первом приближении зададим амплитуды (Aj) и

периоды (Tj) каждого из трех процессов постоянными, что будет

соответствовать следующей математической записи:

 

(9.36)

Y Y1 Y2

sin 2 i3 200 – 2

3, 0,

40 –

Y3 b sin 2 i1 8 –

2 cos 2 i2

 

где T1 = 8; T2 = 40;

T3 = 200; A1 = A2 = A3 = 2; b0 – коэффициент.

 

319

Для декомпозиции были применены методы обычного осредне- ния, скользящего осреднения и автокорреляционный анализ. В ре- зультате получено, что осреднение дает правильную информацию о процессе, если точно задан период осреднения, соответствующий периоду цикла. Автокорреляционная функция является гармониче- ской, и соответствующая ей спектральная плотность имеет три ярко

выраженные максимума на периодах 8, 40 и 200. Поэтому для подоб- ной простой модели наиболее распространенные методы фильтра- ции могут привести к правильным выводам о свойствах процесса. Если же модель (9.36) немного усложнить, задав переменными периоды и амплитуды двух первых процессов

наименьшего и сред-

него масштабов, то ее1

общий

2 i

 

 

представлен

 

вид будет1

 

Y

1

0,5cos

2 j

sin

 

 

 

2 i1

 

 

 

 

 

 

 

 

 

 

4

 

 

 

2

 

 

 

 

 

выражением:

 

 

 

 

8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4sin

 

 

 

 

 

 

 

 

 

 

2 j2

 

2 i2

 

 

 

 

2 i

 

 

 

 

1 0, 25sin

4

cos

 

 

 

 

 

 

 

 

 

(9.37)

 

 

 

 

2

 

 

 

200

2

 

 

 

 

40 20sin

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где периоды и амплитуды процесса наименьшего масштаба (Y1) из-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

меняются по следующим законам:

sin

 

3

 

 

 

 

T1 j1 8 4sin 2 i1 4 ;

2 i

 

 

 

; (9.38)

j1 1, 2, . . . , m1; i1

1 T1 j1

 

 

 

 

 

 

3,

 

 

 

 

 

 

 

 

 

 

A1 j1

1, 0 0,5cos 2 j1

4 ;

j1 1, 2, . .. , m1,

 

(9.39)

а периоды и амплитуды процесса среднего масштаба (Y2) изменяют- ся следующим образом:

T2 j 2

40 20sin 2 i2

4 ; j

2

1, 2,

. . . , m ; i

2

1 T

2 j 2

;

(9.40)

 

 

 

 

2

 

 

 

A2 j1 1, 0 0, 25cos 2 j2

4 ;

j2 1, 2, . . . , m2 .

 

 

(9.41)

Применение тех же выбранных методов фильтрации в случае композиционной модели (9.37) с переменными во времени параме- трами циклов уже не позволило получить заданные характеристики циклов каждой однородной составляющей. Так, с помощью осред- нения в большинстве случаев невозможно было правильно устано- вить даже количество однородных составляющих. С помощью спек- тральной плотности можно было идентифицировать три размытых

320

пика, которые соответствуют трем заданным однородным процес- сам. Однако спектральный анализ не позволяет определить законы, по которым изменяются характеристики циклов каждой однородной составляющей, что также имеет существенное значение при пост- роении общей модели всего композиционного процесса.

Рис. 9.6. Декомпозиция сложного детерминированного процесса методом «срезки»

исравнение полученных (пунктир) и заданных (сплошная линия) периодов (Т)

иамплитуд (А) циклов процессов наименьшего и среднего масштабов

Вто же время, как следует из рис. 9.6, метод «срезки» вполне успешно разделяет композицию на три составляющие, и после этого в каждой составляющей вполне надежно можно установить

321

Соседние файлы в папке Климатология лабы