Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
9-10Лекция 9-10 Сглаживание, ошибка интерполяци...doc
Скачиваний:
4
Добавлен:
22.09.2019
Размер:
274.43 Кб
Скачать

13 Сглаживание временных рядов метеорологических наблюдений

Если имеется система равноотстоящих узлов с результатами измерений f(t), то ее можно аппроксимировать с помощью многочлена. Тогда некоторый участок наблюдений может быть представлен в виде

(5.1)

где β – коэффициенты разложения. Если положить t=0,

f(0)=β0. (5.2)

При анализе результатов наблюдений часто имеет смысл не находить коэффициенты многочлена, а выполнять процедуру, называемую скользящим сглаживанием, или процессом фильтрации. В качестве точечной оценки каждого наблюдения Yi принимается величина , вычисленная с помощью нескольких точек, ближайших к Yi .Равенство (5.1) лежит в основе получения целого формул, которые мы будем называть регрессионными фильтрами.

В этом случае имеющиеся значения метеоэлемента в i-й момент времени заменяются некоторой линейной комбинацией, включающей значения метеоэлементов в ближайшие моменты времени до и после i-го срока, принятого за 0-й. Общий вид регрессионных фильтров следующий

, (5.3)

где коэффициенты, fr - метеорологический элемент в точке, отстоящей на r сроков от 0-го срока, j- номер элемента ряда, m- степень. Для различного набора m, r получаются различные наборы коэффициентов

, причем = .

График зависимости от j называется окном сглаживания. Форма окна определяется степенью многочлена m и числом точек 2r+1. Величина 2r+1 называется шириной окна (шириной фильтра). Фильтры степеней многочленов 2p и 2p+1 одинаковы.

При m=0 и 1

, (5.4)

. (5.5)

При m=2 и 3

, (5.6)

. (5.7)

Как следует из приведенных формул, на форму окна сглаживания влияет его ширина и степень m (рис. 5.1).

Коэффициенты при m=1 одинаковы для всех элементов в пределах окна.

Могут использоваться и другие виды сглаживающих фильтров.

Процедура скользящего сглаживания существенно изменяет статистическую структуру ряда наблюдений. Дисперсия σ2с сглаженных величин равна и меньше дисперсии σ2 исходных наблюдений. Для рассмотренных формул

. (5.8)

Рис. 5.1. Зависимость формы окна сглаживания от степени многочлена (а) и ширины фильтра (б)

Можно выделить два свойства регрессионных фильтров.

1. При любых m и r верно тождество

. (5.9)

2. Если Yt периодическая функция с периодом k (Yt=Yt+k), то верно тождество

, (5.10)

т.е. средние значения, вычисленные по периоду сглаженного и несглаженного рядов, равны между собой.

Практическое использование сглаживающих формул

Эффективность применения рассмотренного класса формул сглаживания во многом зависит от правильного выбора чисел m и r. При определенных условиях оценка β0 = f(0) будет смещена.

Эти рассуждения необходимо иметь в виду при построении фильтра, т. е. при выборе m и r.

Что способствует уменьшению смещенности оценок? Во-первых, уменьшение интервала, на котором производится аппроксимация, т. е. уменьшение ширины фильтра; во-вторых, увеличение степени многочлена, поскольку чем выше степень, тем больший класс функций можно аппроксимировать данным многочленом. Однако как уменьшение числа 2r+1, так и увеличение m приводят к увеличению дисперсии оценки . Мы пришли к противоречивому требованию, для преодоления которого приходится применять различные эмпирические процедуры, варьируя величины m и r. Подбор параметров фильтра сводится к нахождению наименьшего из возможных m и наибольшего из возможных 2r +1, которые обеспечивают как несмещенность оценки , так и достаточно малую дисперсию .

Для большинства физических задач достаточно степени многочлена не выше 3, т. е. ряды наблюдений обычно такие, что при m =1 или m = 3 практически всегда удается найти число 2r +1, обеспечивающее на любом из интервалов ширины 2r+1 основного интервала [0, N] несмещенность оценки . Причем это число 2r+1 достаточно велико, так что оценке соответствует малое значение дисперсии.

Ввиду возможной смещенности для окончательного выбора параметров фильтра проводится неоднократное пробное сглаживание исходного ряда с различными m и r. При этом каждый раз вычисляется оценка

(5.11)

дисперсии наблюдений, характеризующая точность фильтрации и позволяющая управлять процессом сглаживания.

С закрепленным m первый раз сглаживание проводится для достаточно больших 2r+1. Как известно, при т ≤ 5 увеличение числа 2r+1 больше 25—27 несущественно уменьшает дисперсию . Поэтому первое сглаживание может осуществляться при 2r+1 = 27. Затем следует уменьшать ширину фильтра на 2—3 единицы, подсчитывая при каждом сглаживании величину .

Подбор параметров фильтра с последовательным уменьшением ширины 2r+1 называется процессом стягивания окна. Уменьшение ширины фильтра следует продолжать до тех пор, пока при двух-трех последовательных просчетах величины и будут изменяться в незначительных пределах (здесь , , ).

Статистические критерии сравнения оценок , полученных при различных m и r для данного ряда наблюдений, предложить трудно. Визуальная оценка характера сглаживания ряда одновременно с выдачей на экран величин и позволяет быстро подобрать параметры фильтра.

Если в процессе стягивания окна число 2r+1 уменьшилось до 5—7, а ожидаемой стабилизации дисперсии не наступило, следует увеличить на единицу степень многочлена m и заново повторить процесс подбора фильтра, стягивая окно до оптимальных размеров.

Приближенная оценка дисперсии точечных оценок определяется с помощью формулы

, (5.12)

где зависит от подобранных в результате стягивания окна значений m и r. Величина вычисляется одновременно в процессе стягивания окна сглаживания при подборе параметров фильтра, поскольку она является приближенной оценкой точности .

Часто в распоряжении экспериментатора имеется серия рядов наблюдений, близких в каком-либо физическом смысле. Например, ряды наблюдений метеоэлемента для различных, но близко расположенных точек земной поверхности. В этом случае имеет смысл подобрать параметры фильтра только для одного из рядов, а для остальных использовать ту же формулу.

Наряду с оценками (5.11) и (5.12) рассматриваются и другие параметры, характеризующие точность сглаживания. Например, с помощью дисперсии (5.12) можно построить доверительные интервалы, накрывающие сглаженное значение с заданной вероятностью.

В заключение этого параграфа отметим следующее.

Регрессионные фильтры не являются единственно возможными формулами сглаживания. Существует большое число схем для обработки конкретных рядов наблюдений.

Более того, поскольку, ряд оценок может быть подвергнут фильтрации с помощью новой либо уже примененной схемы, количество возможных фильтров, имеющихся в распоряжении экспериментатора, бесконечно. Однако их необоснованное и неосторожное использование может исказить, реальную информацию, содержащуюся в ряду наблюдений, и приверти к неверным выводам. Особенно наглядно процесс искажения данных сглаживанием иллюстрируется при представлении наблюдений в виде суммы гармонических колебаний, что будет подробно рассмотрено в главе 6.

По-видимому, можно показать, что любую схему сглаживания можно приблизить с любой степенью точности с помощью последовательности регрессионных фильтров так же, как функции можно аппроксимировать алгебраическими многочленами. В этом одно из важных значений рассмотренного класса фильтров.

5.2. Интерполяция и экстраполяция полей метеорологических элементов. Ошибка линейной интерполяции

1. Рассмотрим основные понятия и представления, связанные с вопросами интерполяции.

Пусть имеется функция f(х) одной независимой переменной х. Тогда под интерполяцией такой функции понимается определение ее значения f(x0) в некоторой точке х0, если известно хотя бы одно ее значение при некотором xi<x0 и хотя бы одно значение при некотором xj0. Под экстраполяцией понимается определение значения f(x0) по известным значениям (одному или многим) только слева от х0, т. е. при х<х0, или только справа, т. е. при х>х0. Таким образом, обе процедуры состоят в определении неизвестного значения функции на основании некоторой совокупности ее известных значений. Если ищется значение функции внутри отрезка, соединяющего все точки, в которых она известна, то говорят об интерполяции, а если вне такого отрезка — то об экстраполяции.

В дальнейшем будем учитывать, что для задач интерполяции и экстраполяции по конечному числу данных, различие между интерполяцией и экстраполяцией носит лишь количественный, а не качественный характер. Поэтому несущественно, как именно проводится разграничение между интерполяцией и экстраполяцией. Важно лишь, что в обоих случаях задача состоит в определении значения функции в некоторой точке по известным ее значениям в других точках. Имея это в виду, мы в дальнейшем будем иногда применять термин «интерполяция» и в тех случаях, когда речь может идти как об интерполяции, так и об экстраполяции.