Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Сейдж Э.П. Идентификация систем управления

.pdf
Скачиваний:
71
Добавлен:
23.10.2023
Размер:
7.91 Mб
Скачать

7.2J НЕПРЕРЫ ВНЫ Е СИСТЕМЫ 211

где

a ( t ) =

2 e - о-1'.

Уравнение наблюдаемого сигнала

z (t) =

(!) 4- у (1).

Предположим, что форма а (t) известна, но неизвестно на­ чальное значение и масштаб отсчета времени. Математи­ чески это можно записать так:

д (1) e tg (t)

=

xt (1) Xg (t) -f- ws (1),

ti.

( t) =

— Ц74 ( < ) ,

где неизвестны начальные условия для ж3(1) и #4(1). До­

пустим, что {iXo

=

О,

 

г 3 1 4 4

 

 

 

 

 

 

 

 

 

 

 

 

___

!

13 11

 

 

 

 

 

Р (0) = ~2

1 1 3 1

 

 

 

 

 

 

- 1 1 1 3 -

 

а f ,

=

1 и 4*w

=

I. Уравнения для оценок запишутся как

хх (t)

=

(<) +

Ри (1) [z (1) — хх(1)],

 

х%(<) =

2хх (t) — х3 (t) х\ (t) — Зхг (t) +

5sin t 4-

Xg (t) =

xt (t) Xg (t) +

P31(t) [z (t) — xx(1)],

=P ll ( 0 [z ( 0 — Xi(t)\

P = - PHHTP 4-

- P 4- P-9fT[x’ 4

4 -1,

dx

 

dx

'

*

где

 

 

 

 

' 1~

Г

X g

 

 

0

2xi —ХзЖ®— 3X5

0 , f lx, 11=

X XX g

 

 

- 0-

 

0

 

 

На рис. 7.2.1 изображены оценкиx(l).

Отметим,

что оцен­

ки xx(t) и x2(t) «отслеживаются» гораздо лучше, чем х3 (t) = «= а (<) и х4(<) == Ь.

в*

212

ИНВАРИАНТНОЕ ПОГРУЖЕНИЕ

[ГЛ. 7

Пример 7.2.2. В качестве еще одного примера исполь­ зования инвариантного погружения для решения задач идентификации рассмотрим задачу определения ошибок

Рис. 7.2.1. Оценки траектории и параметров для примера 7.2.1 (-------- истинное значение,--------оценка^.

смещения при линейном последовательном оценивании (Сейди; [117] , Сейдж и Лин [124]). Модель входного сипнала имеет вид

х ( 0 = F ( 0 х ( 0 + G (() w ( f) .

(1 )

7.2)

НЕПРЕРЫ ВНЫ Е

СИСТЕМЫ

213

Уравнение

наблюдения имеет

вид

 

 

z(Q = H(0x(0 + v(*).

(2)

Задача последовательного оценивания, когда желательно оценить х (t), основываясь на последовательности наблю­ дений Z (/) = (т), 0 т ^ t) решена многими автора­ ми (Сейдж и Мелса [127]). Обычно предполагается, что средние значения входного шума w (t) и ошибки измере­ ний v (£) известны. Если это не так, то могут возникнуть серьезные ошибки вплоть до расходимости фильтра. Рас­ смотрим применение метода максимального правдоподо­ бия для построения адаптивных алгоритмов последователь­ ного оценивания для входного шума и ошибки измерений с неизвестными средними. Известно, что максимизация функции правдоподобия эквивалентна решению детерми­ нированной оптимальной задачи. Это приводит к ДТКЗ, которая решается методом инвариантного погружения, в результате строится последовательная оценка средних значений имеющихся помех. Пусть х (0), w (t) и v (t) — некоррелированные гауссовские процессы, для которых

pw

А Щ{w (*)},

cov {w (t),

w (т)} = *FW(0б(t т),

 

Pv

A $ {v(*)},

cov{v(£),

v(t)} = Wv (t)b(t — т),

(3)

# {x (0 )}A p Xo,

var {x (0)} = VXo. ■

 

Нетрудно показать, что в этом случае максимизация функ­ ции правдоподобия p[Z (^ )| pw, pv] для уравнений (1), (2) сводится к минимизации функции штрафа

I f '

/ = T j ! и (0 P-v — H ( 0 x ( f ) f l V i (J)* , .

(4)

о

где оценка х (t) с минимальной дисперсией определится как

х == Fx

G]iiw + К (z — pv — Нх),

 

(5)

- k = -vHTv ; 1,

 

-(б)

V =

FV +

VFT + GT4rwG— VHT‘Fv1HV,

(7)

x (0) =

fix,,

' T '

~

•'' *<8)

V ( 0 ) - V ^

- (9)

214 ИНВАРИАНТНОЕ 'ПОГРУЖЕНИЕ [ГЛ. 7

Предполагается, что средние значения

помех неиз­

менны, т. е.

0,

( 10)

=

Av =

о.

(11)

Таким образом, оценка смещения по методу максималь­ ного правдоподобия сводится к задаче теории оптималь­ ного управления. Необходимо минимизировать функцию штрафа (4) при ограничениях (5), (8), (10) и (И).

Для решения задачи, которая поставлена в предыду­ щем разделе, применимы обычные методы теории оптималь­

ного управления. Это приводит

к ДТКЗ (5), (10),

(И)

с сопряженной системой

уравнений

 

i -

HT4r;l (x fiv-- H i) -

(FT - HTKT) X,

(12)

(A -

- GT),,

 

 

(13)

V -

v ;1(z — juv -

Hi) + к та,.

(14)

Условия на концах имеют вид

 

x ( 0) = fix„,

X{tf) = 0,

со (0) = 0,

(A(tf) = 0,

v (0) = 0,

V (tf ) = 0.

Если решить эту ДТКЗ для t е

[0, tf], то будут получены

сглаженные оценки {tw и pv на конечном интервале.

Теперь можно использовать

метод инвариантного по­

гружения для получения последовательных оценок мак­

симального правдоподобия

и jtw.

Это приводит к сле­

дующим уравнениям:

 

 

 

 

Pw -

(Pi,HT +

Ргз) Vv (z —

— Hi),

(15)

Pv =

(Pj3HT +

P33)

( z - { i y - Hx),

(16)

X =*= Fx + Gjhw + (K +

P11HT,F;1+ Pl8V ? ) (z — fiv — Hx),

 

(17)

P u — (F — KH) Pu + Pu (F - KH)T + G P l + P 12Gt -

- KP£, - PWKT -

(PnHT + P13) ЧГ? (HPU + P *), (18)

7.2]

 

НЕПРЕРЫ ВНЫ Е

СИСТЕМЫ

 

215

Рп =

(F — КН) Р12+

GP22-

КР£ -

 

 

 

 

 

 

- (РиНт + Р „) ЧГ'1(НРц +

Р*),

(19)

f»13== (F - КН) Р13+

GP23-

КР33-

 

 

 

 

 

-

(Рцнт + Р13) Ту1(НР13+

Рм),

(20)

р42=

_

(р£н* +

Р23) ф ;1(НР14+ р£),

 

( 21)

Р2з =

-

( № +

Р23)

«Г? (НР12+ Р33),

 

(22)

Рзз =

-

(РиН'1+

Р33) V ? (НР13+ Р33).

 

(23)

Так как это оценки максимального правдоподобия, бес­ смысленно пробовать определить оптимальные начальные условия, отличные от х (0), которое должно быть устано­ влено в соответствии с априорным средним р, (0). Для других переменных можно использовать «приемлемые» начальные условия. Можно также выбирать начальные ус­ ловия, решая ДТКЗ для коротких промежутков времени.

Следует отметить, что решение уравнения (17) не яв­ ляется калмановской оценкой х (t) из (5), хотя при доста­ точно больших t решения (17) сходятся к x(t). В действи­ тельности даже не нужно решать(5), для того чтобы опре­ делить оценки максимального правдоподобия |iw и р¥. Необходимо, однако, решить уравнения (G) и (7), являю­ щиеся составной частью алгоритмов метода максималь­ ного правдоподобия. В вычислительном плане такой под­ ход имеет существенное достоинство. Можно показать, что

в (17) К значительно превосходит (РПНт + р 13) ф ;1 и , следовательно, ошибка в определении последнего члена

не скажется существенно на оценке х. В то же время ошиб­

ка вычисления (PUIIT -{- Р13) Фу1 скорее всего превосхо­ дит ошибку вычисления К или V, так как уравнение Риккати для определения Р может быть значительно более высокого порядка, чем уравнение Риккати для V.

Задача адаптивной фильтрации при неизвестном сме­ щении (неизвестны входной шум и ошибка измерений) также может быть решена путем присоединения к модели

(1)

уравнений jiv =

0 и ц, = 0.

При

этом стремятся

по­

лучить оценки х, pw и Pv, обладающие

минимальной дис­

персией. Так как

не имеется априорных данных о pw

и

jiv, невозможно

определить

начальные условия

в

216 ИНВАРИАНТНОЮ ПОГРУЖЕНИЕ 1.ГЛ. 7

получающихся алгоритмах оценивания. Получаемые алго­

ритмы

оценивания достаточно

громоздки, а именно:

 

х

=

Fx + GjLtw +

(PUH 1+

Р13) ‘Pv1(z — Hx —ytv), (24)

Pw =

(P2iHT 4- P23) V ? (z — Hx — fly),

(25)

f l y

=

(P31HT 4- P33) v ?

( Z

-

H i -

Mv),

(26)

где

 

_

_

_

 

_

_

 

 

 

S = FS 4- EFT -

SI114Fv'HE +- »FW,

 

 

 

Рп

Piv

Pis

 

 

F G 0

 

ьы —

Рг

Рет

О

р т

 

L

рт

is

1 23

Р23 , F = 0

0

0

(27)

0

0

0

 

1

 

 

 

H = [H 0 I], v w

Vw 00

o o o .

 

o o o

Несмотря на то, что эти алгоритмы могут показаться про­ стыми, здесь возникает серьезная проблема точности вы­

числений из-за того, что уравнение для Ри не связано

сдругими матричными уравнениями Риккати. Фридлянд

[40]доказал, что существует замена переменных, которая связывает уравнение (7) для V с уравнениями более высо­

кого порядка (27). Получаемые алгоритмы напоминают (15) — (23). Используемый здесь подход, который вклю­ чает метод максимального правдоподобия, теорию опти­ мального управления и инвариантное погружение, имеет преимущество, связанное с точностью вычислений, так как исходное уравнение Риккати для дисперсии ошибки входит как ограничение задачи оптимального управле­ ния. К тому же этот подход применим и к нелинейным си­ стемам.

7.3. ДИСКРЕТНЫЕ СИСТЕМЫ

Метод инвариантного погружения можно также использовать для разработки алгоритмов последовательного оце­ нивания при идентификации дискретных систем. Изложе­ ние в этом разделе будет в основном близко следовать строению предыдущего раздела, поэтому пояснения будут более лаконичными.

7.3]

ДИСКРЕТНЫ Е

СИСТЕМЫ

217

 

Рассмотрим снова общую ДТКЗ, но в дискретном вре­

мени*)

 

 

(7.3.1)

 

х(к + 1) =

«[х(к),%(к),к],

 

Ч *+ 1 ) =

т|[х(А),ЧА),А]

(7.3.2)

с условиями на концах

 

 

 

 

Ч*о) = Ах(/с0) + Ь,

l ( k t) = 0.

(7.3.3)

Заменим условие на конце Х(АД = 0 более общим ус­ ловием \{kf) = с. Пусть kf и с — переменные величи­ ны. Значение х на том же конце траектории определит­ ся как

х (kf) = г [с, к{].

(7.3.4)

Допустим, что ДТКЗ решается для одного интервала квантования так, что kf переходит в kf + 1, а с в с + Дс. Новое финальное значение х имеет вид

 

 

х (к/ +

1) =

х (kf) -j- Ах = г (с +

 

Ac, kf +

1).

(7.3.5)

Но х (kf) = г (с, kf)

так, что имеем

 

 

 

 

 

 

 

г (с, kf) +

Ах — г (с -f Ac, kf +

1).

 

(7.3.6)

Можно записать г (с

+

Ac, kf

Д-1)

в

следующем

виде:

г (с +

Ac, kf +

1) =

 

 

 

бг (с, kf),

 

х 64 (с, kf)

 

 

 

бг (с, к.)

 

^

 

=

Г (С’ kt) +

"бс~

АС +

~ Щ-

 

Т

 

бсбк.

ТАс.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(7.3.7)

Здесь бг/бс — первая частная разность

 

 

 

 

 

Г бг (с, kf) 1

^

г. (с +

Ac, kf) ri

(с, kf)

 

(7.3.8)

 

 

L

6с

Jy —

 

А

 

 

 

 

И

 

бг (с, kf)

_

Г. (с, kf + 1) — Tj (с, kf)

 

 

 

 

 

(7.3.9)

 

 

~ ~ Щ

 

 

 

Т

 

 

 

 

 

 

 

 

 

 

 

 

 

 

*)

В

целях

упрощения

обозначений

интервал

квантования

Т будет пропускаться, если он встречается вместе с натуральным числом — номером дискретного момента времени кТ или + 1 )Т.

9 Э. П. Сейдж, Дж. Л. Мелса

218

ИНВАРИАНТНОЕ ПОГРУЖ ЕНИЕ

[ГЛ . 7

Следует отметить, что уравнение (7.3.7) является точным, хотя весьма напоминает разложение Тейлора. Если под­ ставить (7.3.7) в (7.3.6), получим

6г (с, kj)

62г (с, kf) ^

А с +

Sr (с, к.)

Ах

бс

бсбк.

- ^ / 7 ’. (7.3.10)

[■

 

 

Из уравнений (7.3.1) и (7.3.2) можно определить Ах и Ас:

Дх = х (kf -f

1) — х (kj) =-- а [г (с, kj), с, kf] — г (с, kt)

(7.3.11)

и

 

 

 

 

 

Ас — к (kj -f

1) — к (kf) =

rj [г (с, к{), с, it/] — с.

 

(7.3.12)

Так что уравнение (7.3.10) преобразуется к виду

 

 

* [г (с, kf), с, к,] — г (с, kf) =

 

 

 

' бг (с, kj)

б2Г (С, kf)

(Л [г (с, kf), c,kt\— с} +

бг (с. */)

т,

бс

бсбkf

 

6А/

^ •

 

 

 

 

(7.3.13)

Если бы из этого уравнения в частных разностях удалось найти г (с, kf), то ДТКЗ была бы полностью решена. Од­ нако, как и в непрерывном случае, найти общее аналити­ ческое решение уравнения (7.3.13) не удается и обычно обращаются к приближенным методам. Прежде чем про­ должить эту цепочку рассуждений, полезно обсудить взаи­ мосвязь между дискретным и непрерывным вариантами инвариантного погружения, т. е. уравнениями (7.2.13) и (7.3.13).

Одна из дискретных форм записи уравнений (7.2.1) и (7.2.2) имеет вид

х + 1) = Т\ (к), к (к), к] + х (к),

к (к + 1) = Гр [х (к), к (к), к) + к (к).

Так что а и tj в уравнениях (7.3.1), (7.3.2) очевидным об­ разом определяются как

* [х(/с), к (к), к] = Т\[х(к),к(к),к] + х(к), (7.3.14)

ц (к), к (к), к] = Гр [х (к), к (к), к] + к (к). (7.3.15)

Здесь Т предполагается малой величиной, так что произ­ водную можно заменить первой разностью. Подстановка

7.3] ДИСКРЕТНЫ Е СИСТЕМЫ 219

(7.3.14) и (7.3.15) в

(7.3.13) дает

 

 

Ту (г, с, kf) =

 

 

 

 

 

бг (с, kf)

б2г (с, kf)

М C’ kf) rr

(7.3.16)

-[■

бс

бсбк.

Т§ (г, с, kf) +

6hf 1 '

Если теперь разделить это уравнение на Г и устремить Т

к нулю, полагая kf T =

tf,

то из (7.3.16) получим

дт(с, tf)

Р (г, с, tf) +

дт(с, tf)

(7.3.17)

Y (г. с, tf)

дс

dt

Уравнение (7.3.17) не содержит вторых производных и в этом смысле дискретное уравнение является более общим, так как, используя дискретную аппроксимацию уравне­ ния (7.3.17), было бы невозможно получить уравнение (7.3.16) в конечных разностях. Можно показать, что вто­ рая частная разность становится существенной, когда интервал квантования нельзя считать малым (Сейдж [116]).

Вернемся теперь к основному вопросу об отыскании решения ДТКЗ. Так как в общем виде решить (7.3.13)

не

удается,

 

предположим,

что г (с,

kf)

линейна по с:

 

 

 

г (с, kf) =

х (kf) — Р (kf) с.

 

(7.3.18)

Используя

(7.3.18), вычислим разности,

которые

входят

в уравнение

(7.3.13):

 

 

 

 

 

 

 

±

^ l = - V

( k f),

 

 

(7.3.19)

 

 

 

= _

[Р(Л/ + 1) -

Р(*,)1 IT

(7.3.20)

и

 

 

 

 

 

 

 

 

=

[X (kf -f 1) — X (kf) — Р (kf + 1) с + Р (kf) с] .

 

 

 

 

 

 

 

 

(7.3.21)

Подставив эти выражения в (7.3.13), ползшим

 

а (кД— Р (kt) с, с, к <1=

 

 

 

 

 

= — V(kf

'Мт] [x№f) - Р (kf)c, с, к}] 4- x(kf -\-1).

(7.3.22)

9*

220 ИНВАРИАНТНОЕ ПОГРУЖ ЕНИЕ [ГЛ . 7

Разлагая « и р в ряд Тейлора в окрестности х {kf), 0 и kf

и пренебрегая членами высокого порядка,

можно перепи­

сать уравнение (7.3.22) в виде

 

 

* [х (к)), 0, kf]

да (kf) Р (kf) с, с, kf] I

 

до

|с=0 с — — Р (kf -j- 1

X |il [х (kf), 0, kf]

дт\(kf) — Р (kf) с, с, kf]

^с}-)-x(fc,+ 1).

Эс

 

 

 

 

(7.3.23)

Это соотношение должно выполняться для всех достаточ­ но малых с, поэтому, приравнивая коэффициенты при первой и нулевой степени с, получим

X (kf +

1) =

* [X (kf), 0, kf]

+ Р (kf -f 1) Т] [х (kf), 0, kf], (7.3.24)

' (*/ +

!){-

дц (kf) — Р (kf) с, с, kf ]

J

-

дс

 

 

 

 

да (kf) — Р (kf) с, с, kf]

 

 

 

 

дс

. (7.3.25)

 

 

 

 

|с=0

Теперь необходимо подставить выражение для ж и ц. Рас­ смотрим дискретную ДТКЗ (3.2.30) — (3.2.32), (3.2.34),

которая, если пренебречь членами второго порядка мало­ сти по с, приводится к виду

х (к, + 1) = ф [х (kt), kf]

 

- - 4-

 

 

- Г [х (к,), kf] Vw (kf) ГТ [x (kf), kf] - --

-

T , (7.3.26)

 

 

 

Эх (kf)

 

 

 

Эх (кЛ

 

 

 

 

+

ЭЬт [х (kf + l),kf +

i]

\){z(kf + i )

Эх (kf + 1)

Y?(kf +

 

 

 

 

 

 

 

— h |x (kf

1), kf +

1]}, (7.3.27)

 

h(k0) =

VXo [x(fc0)

M-Xol)

 

(7.3.28)

 

% (kf) = c = 0.

 

 

(7.3.29)

Заметим, что эти выражения не сводятся к (7.3.1) и (7.3.2), так как в правой части уравнения (7.3.27) появилась за­ висимость от х (kf -f 1). Подставляя х (к{ + 1) из (7.3.26),

Соседние файлы в папке книги из ГПНТБ