Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
i-719273.pdf
Скачиваний:
269
Добавлен:
26.03.2016
Размер:
5.68 Mб
Скачать

 

4.6. Сглаживание временных рядов

 

Допустим, что наблюдаемый временной ряд (рис. 4.6) можно предста-

вить в виде:

 

 

 

 

 

 

 

 

 

y(k) x(k) V (k),k , , ...

(4.97)

где y(k)

– наблюдаемое (измеряемое) значение временного ряда на k-ом ша-

ге; x(k)

– регулярная составляющая или полезная составляющая наблюдае-

мого временного ряда на k-ом шаге; V (k) – аддитивная помеха на k-ом шаге

наблюдения с нулевым математическим ожиданием mv и конечной дис-

персией .

 

 

 

 

 

 

 

v

 

 

 

 

 

 

 

y(k)

 

 

 

 

( + )

 

 

 

 

 

 

y€( N m)

 

 

 

 

 

y(k) x(k)

 

 

 

 

T0

 

T0

 

 

 

 

 

 

 

 

 

 

mT0

 

 

0

1

2

3

N

Тп-интервал

k

 

 

T-интервал наблюдения

 

упреждения

 

 

 

 

 

 

 

Рис. 4.6. Наблюдаемый временной ряд

 

Регулярная составляющая x(k) представляет собой модель, например: константу или полином нулевого порядка

x(k) a , k , , ...,

(4.98)

линейную модель или полином первого порядка

 

x(k) a a k,

k , , ,...,

(4.99)

квадратичную модель или полином второго порядка

 

x(k) a a k

a k

, k , , ,...,

(4.100)

 

 

 

 

 

полиномиальные модели общего вида

 

 

x(k) f (a,k),

k , , ,....

(4.101)

Здесь α – вектор неизвестных коэффициентов; f ( ) – наперед заданная

функция.

Задача сглаживания временного ряда состоит в выделении регулярной

203

составляющей x(k) . Если эта задача решена, то можно осуществить прогноз наблюдаемого процесса на mT тактов вперед и получить точечную оценку(N m) для N-го момента наблюдения. Модель x(k) называют также де-

терминированной основой процесса.

Наличие помехи V (k) не позволяет точно оценить неизвестные коэф-

фициенты α.

Если у исследователя имеются данные наблюдаемого временного ряда и наблюдение больше не ведется, то результаты реализации временного ряда необходимо представить на графике.

Графическое представление данных существенно облегчает выбор структуры (вида) модели. Если это ряд возрастающих данных, то следует выбрать модель (4.99) или (4.100). Если видны периодические составляющие, то в модель общего вида (4.101) необходимо включить тригонометрические составляющие.

Графическое представление данных необходимо дополнить некоторыми формальными процедурами. Так временной ряд разностей первого порядка

y(k) y(k) y(k ),k , ,...,N ,

(4.102)

колеблющийся на графике около нуля, предопределяет модель первого порядка (4.99). Если около нуля колеблются разности второго порядка

 

(4.103)

y(k) y(k) y(k ),k , ,...,N ,

то следует выбрать модель (4.100).

Для обработки результатов наблюдений и оценки неизвестных коэффициентов модели можно воспользоваться известным методом наименьших квадратов (МНК) либо его модификациями.

Если результаты наблюдений временного ряда поступают в темпе технологического процесса, то процедура обработки данных должна учитывать:

-объем накапливаемых данных может быть достаточно большим и следовательно, объем необходимой памяти для хранения всех данных будет увеличиваться;

-снижение доверия к прошлым результатам;

-нестационарность случайного процесса на длительном интервале наблюдения;

-особенности комплекса технических средств сбора наблюдений. Более всего подходят для этих целей рекуррентные процедуры, рас-

смотренные в подразделе 2.8.

Метод скользящего среднего. Пусть наблюдаемый временной ряд описывается моделью (4.97), детерминированную основу которого можно представить полиномом нулевого порядка (4.98) с изменением уровня a в слу-

чайные моменты времени (рис. 4.7).

204

y

 

 

 

 

 

 

 

y(k)

a0

T0

T0

 

 

 

 

 

0

k1

k2

N

k

Рис. 4.7. Реализация временного ряда для случайного изменения

 

детерминированной основы

a0

 

 

 

 

 

Очевидно, что простое применение МНК для всех накопленных N данных не учитывает случайное изменение детерминированной основы, поскольку все данные входят с равным весом. Анализируя график процесса (см. рис. 4.7) следовало бы больше доверять последним наблюдениям, а прошлые, например, на интервале , k , следовало бы забыть.

Общий вид скользящего среднего

 

 

 

 

 

y(k) y(k )

y(k) y k N

, k N

 

, N

 

,...,

(4.104)

 

 

 

N

 

 

 

 

 

 

 

 

 

 

где y(k) , y(k )

– среднее значение временного ряда на k-ом и (k ) -ом

шаге наблюдения;

y(k) , y k N – наблюденные (измеренные)

значения

временного ряда на k-ом и k N шаге наблюдения;

N

– число удержи-

ваемых в памяти данных для усреднения (ширина окна скольжения). Например N . Тогда с приходом 11-го измерения (k ) первое

измерение y( ) будет забыто. Все измерения войдут с равным весом/ N . Для обработки и хранения данных необходим вектор, размерности N

и процедура перезаписи данных в ЦВМ по принципу стека с приходом каждого нового наблюдения.

Скорость реакции оценок модели на изменение детерминированной основы зависит от величины N . Она увеличивается с уменьшением N , но

при этом увеличивается и влияние ошибок V (k) на точность вычисленных оценок модели. Для рассматриваемого случая дисперсия оценки равна

 

 

 

 

 

D

0

 

v

.

(4.105)

 

 

 

N

 

 

 

 

 

Таким образом, точность оценки (4.105) и скорость реакции процедуры

205

(4.104) на изменения детерминированной основы противоречивы в своей основе.

Метод экспоненциального сглаживания. Процедура записывается в ви-

де

S(k) ( )S(k ) y(k),

k , ,...,

(4.106)

где S(k) , S(k ) – сглаженное значение временного ряда на k-ом и

(k ) -

ом шаге наблюдения; y(k) – наблюденное (измеренное) значение временного ряда на k-ом шаге наблюдения; α – постоянная сглаживания.

Втеории фильтрации уравнение (4.106) соответствует цифровому фильтру низких частот.

Впроцедуре (4.106) для вычислений, в отличие от (4.104), необходимо хранить только сглаженное значение S(k ) .

Если в формулу (4.106) подставить значение S(k ) и т.д., то придем к выражению

k

 

S(k) ( )i y(k i) ( )k y( ) .

(4.107)

i

Отсюда следует, что величина S(k) есть линейная комбинация всех на-

блюдавшихся значений временного ряда, вес которых убывает с «возрастом» в геометрической прогрессии.

Если для исходного временного ряда

y( ), y( ), y( ),...,y(N)

применить процедуру сглаживания (4.106), то получим сглаженный временной ряд

S( ),S( ),S( ),...,S(N) .

Если для сглаженного временного ряда S(k) вновь применить процедуру сглаживания

S(k)( ) ( )S(k )( ) S(k) ,

(4.108)

то получим новый сглаженный временной ряд

 

S( )( ) , S( )( ) ,...,S(N )( ) .

 

Здесь верхний индекс (2) характеризует процедуру двойного экспонен-

циального сглаживания.

 

В общем случае процедура n-го порядка сглаживания имеет вид

 

S(k)(n) ( )S(k )(n) S(k)(n ) .

(4.109)

Для прогнозирования по моделям (4.98 4.100) необходимо на каждом шаге наблюдения вычислять оценки модели. Рассмотрим эти процедуры.

Полином нулевого порядка (4.98). Процедура вычислений имеет вид

 

= 0( − 1)

 

 

0 = + (1 − )

− ,

(4.110)

 

= 1,2, …

 

 

 

206

 

 

где

– прогнозируемое значение временного ряда на k-ый шаг наблюде-

ния;

y(k) – наблюденное значение на k-ом шаге наблюдения; 0

– оценка

коэффициента модели (2.88) на k-ом шаге наблюдения;

- невяз-

ка или ошибка прогноза на k-ом шаге наблюдений.

 

 

 

Процесс коррекции оценки иллюстрирует рис. 4.8.

 

 

 

 

y(k)

 

 

 

 

 

 

 

 

 

 

 

y(k)

0( )

 

 

 

 

0( − 1)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y(k 1)

( )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k 1

k

k 1

k

 

 

 

Рис. 4.8. Процесс подстройки оценки на k -ом шаге наблюдения

Из формулы (4.110) и рис. 4.8 видно, что величина коррекции оценки0 − 1 определяется величиной невязки и коэффициентом ( ) . Таким

образом, на каждом шаге наблюдения осуществляется адаптация коэффициента модели под текущее возможное изменение детерминированной основы. Из (4.110) следует, что если , то реакции на изменение нет, поскольку процедура не доверяет новым значениям y(k) . Если , то реакция мгно-

венная. Правда и сглаживания не происходит.

Для начала работы процедуры (4.110) необходимо задать начальные условия 0 0 . Самое простое, это начальное значение можно положить равным первому измеренному значению y(k)

0 y( ) .

(4.111)

Согласно (4.110) и (4.107) процедура сглаживания – это линейная операция всех наблюденных значений временного ряда. Следовательно, свойства полученных оценок модели определяются свойствами помехи, при условии структурной адекватности модели процессу. Если к тому же наблюдаемый процесс стационарен, то можно рассчитать дисперсию ошибки прогноза для условия cov V (k),V (k )

 

 

 

 

 

 

D

0

D

 

v

.

(4.112)

 

 

 

 

 

 

 

 

 

 

 

Если наблюдаемые значения помехи коррелированны

207

 

 

R

 

( ) e ,

 

 

 

 

 

vv

 

 

v

 

 

 

то [17]

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D

 

 

v

( )e

 

.

(4.113)

 

 

( )e

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Отсюда следует, что коррелированность измерений помехи увеличивает дисперсию ошибки прогноза.

Если помеха V имеет нормальный закон распределения, то можно построить доверительный интервал для прогнозируемого значения временного ряда. Для этого следует воспользоваться результатами подраздела 2.3.

Прогнозируемое значение на m -шагов вперед равно текущей оценке

(k m) (k) .

(4.114)

При выборе постоянной сглаживания можно воспользоваться выраже-

нием

 

 

 

 

 

.

(4.115)

N

Данное значение обеспечивает эквивалентность ошибки предсказа-

ния для скользящего среднего и экспоненциального

сглаживания. Если

N , то приближенно . . .

 

Полином первого порядка (4.99). Процедура вычислений имеет вид

 

= 0 − 1 + 1 − 1

 

= + (1 − )2 ∙ − ( )

 

0

 

(4.116)

= − 1 − 2 ∙ − ( ) ,

 

1

1

 

= 1,2, …

Все обозначения аналогичны, что и для процедуры (4.110). Процесс коррекции показан на рис. 4.9.

Начальные значения процедуры, если нет никаких априорных сведений

об оценках, можно положить равными

 

 

0

0

0

= (0)

(4.117)

 

 

= 0 .

1

 

 

 

Прогнозируемое значение временного ряда на m-шагов вперед равно

(k m) 0 (k) 1 (k) m .

(4.118)

208

y(k)

 

( + 1)

 

 

y(k)

 

y€(k 1)

 

y(k-1)

y€(k)

( )

k-1

k

k+1

k

Рис. 4.9. Процесс подстройки оценок линейной модели на k-ом шаге наблюдения

Дисперсия ошибки прогноза некоррелированных наблюдений ошибки равна [17]

D (k m)

 

( ) ( ) ( )m m .

 

 

 

( )

v

 

 

(4.119)

Как видно из рис. 4.9 после очередной коррекции оценки модели изменились скачком.

Полином второго порядка (4.100). Процедура вычислений имеет вид

 

 

= − 1 + − 1 +

1

( − 1)

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

1

2

2

 

 

 

 

 

 

 

 

= + (1 − )2

 

− ( )

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

− ( ) . (4.120)

 

 

=

− 1

+

− 1

− 1.5 2(2 − ) ∙

1

 

1

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= − 1 − 3

− ( ) ,

 

 

 

 

 

2

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= 1,2, …

 

 

 

 

 

 

 

 

 

Все обозначения аналогичны обозначениям процедуры (4.110).

Процесс коррекции оценок показан на рис. 4.10.

 

 

 

 

 

 

 

 

y(k)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

( )

 

 

 

 

 

1)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y(k)

 

 

y((k +1)

 

 

 

 

 

 

 

y(k-1)

y€(k)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k-1

k

k+1

k

Рис. 4.10. Процесс подстройки оценок квадратичной модели на k-ом шаге наблюдения

209

Начальные значения процедуры при неизвестных сведениях об оценках можно положить равными

0 0

= (0)

 

1

0

= 0 .

(4.121)

2

0

= 0

 

Прогнозируемое значение временного ряда на m-шагов вперед на k-ом шаге равно

(k m)

 

(k) (k)m

 

 

 

(k)m .

(4.122)

 

 

 

 

0

1

 

2

 

 

Дисперсия ошибки прогноза для некоррелированных наблюдений

ошибки равна [17]

 

 

 

 

 

 

 

D ( + ) m .

(4.123)

 

 

 

 

 

 

v

 

Некоторые практические рекомендации. При выборе степени полинома не следует ее завышать, ибо простые модели нулевого и первого порядка подстраиваются на каждом шаге к изменениям модели. Модели высших порядков могут давать большие погрешности предсказания при изменении свойств процесса.

Выбор нулевых начальных условий (4.117) и (4.121) потребует некоторого времени для подстройки параметров модели, зависимого от постоянной сглаживания (рис. 4.11).

Если объем наблюдений N не велик, то имеющиеся данные можно многократно пропускать в зависимости от выбранной модели через процедуры (4.110), (4.116), (4.120) соответственно. Это позволяет значительно сократить время переходного процесса подстройки оценок модели.

a1(k)

1( )

 

 

1

(k )

2

 

1 (k)

 

 

 

 

 

 

 

 

 

(k)

 

 

1

11( )

 

 

 

1

2

 

 

 

 

 

 

 

k

Рис. 4.11. Характер переходного процесса подстройки оценки α1(k) в зависимости от α

Выбор α одна из самых серьезных проблем экспоненциального сглажи-

210

вания и зависит от свойств помехи V (k) , свойств наблюдаемого процесса,

интервала наблюдения.

Если в процессе сглаживания наблюдается устойчивая тенденция роста невязки − ( ) , то вводят адаптацию постоянной сглаживания в функции невязки.

Пример. 4.3. Имеется линейно нарастающий временной ряд

y(k) x(k) V (k),

k , , ,..., ,

где детерминированная основа

x(k) . k .

Ошибка измерений представляет собой нормально распределенный

случайный процесс с параметрами

mv , v . , Rvv ( ) .

По результатам моделирования в системе Mathcad оценить эффективность методов сглаживания:

1) стандартных средств Mathcad;

2) метода экспоненциального сглаживания для . и 2 0.1

для модели нулевого и первого порядка.

За критерий эффективности взять оценку дисперсии невязки

 

 

N

^

 

 

 

 

 

 

S

 

y(k) y(k) .

(4.124)

 

 

N k

 

 

 

 

Результаты исследований приведены на рис. 4.12.

N 100

0

 

0.7

v rnorm N

i

0 N 1

 

 

 

 

 

 

xi

1 0.1 i

 

 

 

 

yi xi vi

ji 1 i

z

supsm oothj( y)

 

 

 

 

 

 

N 1

 

 

 

 

 

 

s2zy N1 zi yi 2

 

 

s2zy 0.429

 

i 0

 

 

 

 

 

 

alfa1 0.4

alfa2

0.1

a00 y0

a010 y0

i 0 N 1

 

 

 

 

 

 

zero y n

a0

0

y

 

 

 

 

 

 

0

 

 

 

 

for

i 1 n 1

 

_y0i a0i 1

a0i yi 1 _y0i yi _y0

Рис. 4.12. Реализация примера 4.3

211

 

 

 

 

 

15

 

 

 

 

 

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

zero(alfa1 y N)i

 

 

 

 

 

 

 

 

 

 

 

 

 

5

 

 

 

 

 

 

 

 

 

 

 

 

0 0

20

40

60

80

100

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

zero(alfa2 y N)

i

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0 0

20

40

60

80

100

 

 

 

 

 

 

 

 

 

 

i

 

 

s21

1

N 1

zero(alfa1 y N)

i

y

2

s21 0.627

 

 

 

N

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i 0

 

 

 

 

 

 

 

 

 

 

s22

1

N 1

zero(alfa2 y N)

i

y

2

s22 1.35

 

 

 

N

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис.4.12. Продолжение

 

 

212

one y n

a0

0

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a10 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

for

i 1 n 1

 

 

 

 

 

 

 

 

 

 

 

 

 

_y1i a0i 1 a1i 1

 

 

 

 

 

 

 

 

 

 

 

 

a0

i

y 1 2 _y1

i

y

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

a1

i

a1

i 1

2 _y1

i

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

_y1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

15

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

one(alfa1 y N)i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

0

 

 

 

 

20

 

40

 

 

60

80

100

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

15

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

one(alfa2 y N)i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

0

 

 

 

 

20

 

40

 

 

60

80

100

 

 

N 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

s23

1

one(alfa1 y N)

i

y

2

 

 

 

 

 

s23 0.765

 

 

 

N

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s24

1

N 1

one(alfa2 y N)

i

y

2

 

 

 

 

 

s24 0.568

 

 

 

N

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 4.12. Продолжение

 

 

 

 

213

k 0 N 1

yk

zk

zero(alfa1 y N)k

one(alfa1 y N)k

yk

zero(alfa2 y N)k

one(alfa2 y N)k

15

 

 

 

 

 

10

 

 

 

 

 

5

 

 

 

 

 

0

0

20

40

60

80

 

 

 

k

 

 

15

 

 

 

 

 

10

 

 

 

 

 

5

 

 

 

 

 

0

0

20

40

60

80

 

 

 

k

 

 

 

 

Рис. 4.12. Окончание

 

 

Анализируя полученные результаты моделирования, можно сделать вывод, что наилучший результат выдает процедура МНК-сглаживания. Она требует всего массива наблюденных данных и не ориентирована на последовательную обработку данных по мере их поступления.

Эффективность рекуррентных процедур сильно зависит от выбранных параметров N и .

214

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]