
книги из ГПНТБ / Сейдж Э.П. Идентификация систем управления
.pdf7.2J НЕПРЕРЫ ВНЫ Е СИСТЕМЫ 211
где
a ( t ) = |
2 e - о-1'. |
Уравнение наблюдаемого сигнала |
|
z (t) = |
(!) 4- у (1). |
Предположим, что форма а (t) известна, но неизвестно на чальное значение и масштаб отсчета времени. Математи чески это можно записать так:
д (1) e tg (t) |
= |
xt (1) Xg (t) -f- ws (1), |
ti. |
( t) = |
— Ц74 ( < ) , |
где неизвестны начальные условия для ж3(1) и #4(1). До
пустим, что {iXo |
= |
О, |
|
г 3 1 4 4 |
|
||
|
|
|
|
|
|
|
|
|
|
|
|
___ |
! |
13 11 |
|
|
|
|
|
Р (0) = ~2 |
1 1 3 1 |
• |
|
|
|
|
|
|
|
- 1 1 1 3 - |
|
а f , |
= |
1 и 4*w |
= |
I. Уравнения для оценок запишутся как |
|||
хх (t) |
= |
(<) + |
Ри (1) [z (1) — хх(1)], |
|
|||
х%(<) = |
— 2хх (t) — х3 (t) х\ (t) — Зхг (t) + |
5sin t 4- |
|||||
Xg (t) = |
— xt (t) Xg (t) + |
P31(t) [z (t) — xx(1)], |
=P ll ( 0 [z ( 0 — Xi(t)\
P = - PHHTP 4- |
- P 4- P-9fT[x’ 4 |
4 -1, |
||
dx |
|
dx |
' |
* |
где |
|
|
|
|
' 1~ |
Г |
X g |
|
|
0 |
— 2xi —ХзЖ®— 3X5 |
|||
0 , f lx, 11= |
— X XX g |
|
|
|
- 0- |
|
0 |
|
|
На рис. 7.2.1 изображены оценкиx(l). |
Отметим, |
что оцен |
ки xx(t) и x2(t) «отслеживаются» гораздо лучше, чем х3 (t) = «= а (<) и х4(<) == Ь.
в*
212 |
ИНВАРИАНТНОЕ ПОГРУЖЕНИЕ |
[ГЛ. 7 |
Пример 7.2.2. В качестве еще одного примера исполь зования инвариантного погружения для решения задач идентификации рассмотрим задачу определения ошибок
Рис. 7.2.1. Оценки траектории и параметров для примера 7.2.1 (-------- истинное значение,--------оценка^.
смещения при линейном последовательном оценивании (Сейди; [117] , Сейдж и Лин [124]). Модель входного сипнала имеет вид
х ( 0 = F ( 0 х ( 0 + G (() w ( f) . |
(1 ) |
7.2) |
НЕПРЕРЫ ВНЫ Е |
СИСТЕМЫ |
213 |
Уравнение |
наблюдения имеет |
вид |
|
|
z(Q = H(0x(0 + v(*). |
(2) |
Задача последовательного оценивания, когда желательно оценить х (t), основываясь на последовательности наблю дений Z (/) = {г (т), 0 т ^ t) решена многими автора ми (Сейдж и Мелса [127]). Обычно предполагается, что средние значения входного шума w (t) и ошибки измере ний v (£) известны. Если это не так, то могут возникнуть серьезные ошибки вплоть до расходимости фильтра. Рас смотрим применение метода максимального правдоподо бия для построения адаптивных алгоритмов последователь ного оценивания для входного шума и ошибки измерений с неизвестными средними. Известно, что максимизация функции правдоподобия эквивалентна решению детерми нированной оптимальной задачи. Это приводит к ДТКЗ, которая решается методом инвариантного погружения, в результате строится последовательная оценка средних значений имеющихся помех. Пусть х (0), w (t) и v (t) — некоррелированные гауссовские процессы, для которых
pw |
А Щ{w (*)}, |
cov {w (t), |
w (т)} = *FW(0б(t — т), |
|
Pv |
A $ {v(*)}, |
cov{v(£), |
v(t)} = Wv (t)b(t — т), |
(3) |
# {x (0 )}A p Xo, |
var {x (0)} = VXo. ■ |
|
Нетрудно показать, что в этом случае максимизация функ ции правдоподобия p[Z (^ )| pw, pv] для уравнений (1), (2) сводится к минимизации функции штрафа
I f '
/ = T j ! и (0 — P-v — H ( 0 x ( f ) f l V i (J)* , . |
(4) |
о
где оценка х (t) с минимальной дисперсией определится как
х == Fx |
G]iiw + К (z — pv — Нх), |
|
(5) |
|
- k = -vHTv ; 1, |
|
-(б) |
||
V = |
FV + |
VFT + GT4rwG— VHT‘Fv1HV, |
(7) |
|
x (0) = |
fix,, |
' T ' |
~ |
•'' *<8) |
V ( 0 ) - V ^ |
- (9) |
214 ИНВАРИАНТНОЕ 'ПОГРУЖЕНИЕ [ГЛ. 7
Предполагается, что средние значения |
помех неиз |
|
менны, т. е. |
0, |
( 10) |
= |
||
Av = |
о. |
(11) |
Таким образом, оценка смещения по методу максималь ного правдоподобия сводится к задаче теории оптималь ного управления. Необходимо минимизировать функцию штрафа (4) при ограничениях (5), (8), (10) и (И).
Для решения задачи, которая поставлена в предыду щем разделе, применимы обычные методы теории оптималь
ного управления. Это приводит |
к ДТКЗ (5), (10), |
(И) |
||
с сопряженной системой |
уравнений |
|
||
i - |
HT4r;l (x — fiv-- H i) - |
(FT - HTKT) X, |
(12) |
|
(A - |
- GT),, |
|
|
(13) |
V - |
v ;1(z — juv - |
Hi) + к та,. |
(14) |
Условия на концах имеют вид |
|
x ( 0) = fix„, |
X{tf) = 0, |
со (0) = 0, |
(A(tf) = 0, |
v (0) = 0, |
V (tf ) = 0. |
Если решить эту ДТКЗ для t е |
[0, tf], то будут получены |
сглаженные оценки {tw и pv на конечном интервале. |
|
Теперь можно использовать |
метод инвариантного по |
гружения для получения последовательных оценок мак
симального правдоподобия |
и jtw. |
Это приводит к сле |
|||
дующим уравнениям: |
|
|
|
|
|
Pw - |
(Pi,HT + |
Ргз) Vv (z — |
— Hi), |
(15) |
|
Pv = |
(Pj3HT + |
P33) |
( z - { i y - Hx), |
(16) |
X =*= Fx + Gjhw + (K + |
P11HT,F;1+ Pl8V ? ) (z — fiv — Hx), |
|
(17) |
P u — (F — KH) Pu + Pu (F - KH)T + G P l + P 12Gt - |
|
- KP£, - PWKT - |
(PnHT + P13) ЧГ? (HPU + P *), (18) |
7.2] |
|
НЕПРЕРЫ ВНЫ Е |
СИСТЕМЫ |
|
215 |
||
Рп = |
(F — КН) Р12+ |
GP22- |
КР£ - |
|
|
||
|
|
|
|
- (РиНт + Р „) ЧГ'1(НРц + |
Р*), |
(19) |
|
f»13== (F - КН) Р13+ |
GP23- |
КР33- |
|
|
|||
|
|
|
- |
(Рцнт + Р13) Ту1(НР13+ |
Рм), |
(20) |
|
р42= |
_ |
(р£н* + |
Р23) ф ;1(НР14+ р£), |
|
( 21) |
||
Р2з = |
- |
( № + |
Р23) |
«Г? (НР12+ Р33), |
|
(22) |
|
Рзз = |
- |
(РиН'1+ |
Р33) V ? (НР13+ Р33). |
|
(23) |
Так как это оценки максимального правдоподобия, бес смысленно пробовать определить оптимальные начальные условия, отличные от х (0), которое должно быть устано влено в соответствии с априорным средним р, (0). Для других переменных можно использовать «приемлемые» начальные условия. Можно также выбирать начальные ус ловия, решая ДТКЗ для коротких промежутков времени.
Следует отметить, что решение уравнения (17) не яв ляется калмановской оценкой х (t) из (5), хотя при доста точно больших t решения (17) сходятся к x(t). В действи тельности даже не нужно решать(5), для того чтобы опре делить оценки максимального правдоподобия |iw и р¥. Необходимо, однако, решить уравнения (G) и (7), являю щиеся составной частью алгоритмов метода максималь ного правдоподобия. В вычислительном плане такой под ход имеет существенное достоинство. Можно показать, что
в (17) К значительно превосходит (РПНт + р 13) ф ;1 и , следовательно, ошибка в определении последнего члена
не скажется существенно на оценке х. В то же время ошиб
ка вычисления (PUIIT -{- Р13) Фу1 скорее всего превосхо дит ошибку вычисления К или V, так как уравнение Риккати для определения Р может быть значительно более высокого порядка, чем уравнение Риккати для V.
Задача адаптивной фильтрации при неизвестном сме щении (неизвестны входной шум и ошибка измерений) также может быть решена путем присоединения к модели
(1) |
уравнений jiv = |
0 и ц, = 0. |
При |
этом стремятся |
по |
лучить оценки х, pw и Pv, обладающие |
минимальной дис |
||||
персией. Так как |
не имеется априорных данных о pw |
||||
и |
jiv, невозможно |
определить |
начальные условия |
в |

216 ИНВАРИАНТНОЮ ПОГРУЖЕНИЕ 1.ГЛ. 7
получающихся алгоритмах оценивания. Получаемые алго
ритмы |
оценивания достаточно |
громоздки, а именно: |
|
|||||
х |
= |
Fx + GjLtw + |
(PUH 1+ |
Р13) ‘Pv1(z — Hx —ytv), (24) |
||||
Pw = |
(P2iHT 4- P23) V ? (z — Hx — fly), |
(25) |
||||||
f l y |
= |
(P31HT 4- P33) v ? |
( Z |
- |
H i - |
Mv), |
(26) |
|
где |
|
_ |
_ |
_ |
|
_ |
_ |
|
|
|
S = FS 4- EFT - |
SI114Fv'HE +- »FW, |
|
||||
|
|
Рп |
Piv |
Pis |
|
|
F G 0 |
|
ьы — |
Рг |
Рет |
О |
р т |
|
L |
рт |
|
is |
1 23 |
Р23 , F = 0 |
0 |
0 |
(27) |
0 |
0 |
0 |
|
1 |
|
|
|
H = [H 0 I], v w |
Vw 00 |
o o o . |
|
|
o o o |
Несмотря на то, что эти алгоритмы могут показаться про стыми, здесь возникает серьезная проблема точности вы
числений из-за того, что уравнение для Ри не связано
сдругими матричными уравнениями Риккати. Фридлянд
[40]доказал, что существует замена переменных, которая связывает уравнение (7) для V с уравнениями более высо
кого порядка (27). Получаемые алгоритмы напоминают (15) — (23). Используемый здесь подход, который вклю чает метод максимального правдоподобия, теорию опти мального управления и инвариантное погружение, имеет преимущество, связанное с точностью вычислений, так как исходное уравнение Риккати для дисперсии ошибки входит как ограничение задачи оптимального управле ния. К тому же этот подход применим и к нелинейным си стемам.
7.3. ДИСКРЕТНЫЕ СИСТЕМЫ
Метод инвариантного погружения можно также использовать для разработки алгоритмов последовательного оце нивания при идентификации дискретных систем. Изложе ние в этом разделе будет в основном близко следовать строению предыдущего раздела, поэтому пояснения будут более лаконичными.
7.3] |
ДИСКРЕТНЫ Е |
СИСТЕМЫ |
217 |
|
|
Рассмотрим снова общую ДТКЗ, но в дискретном вре |
|||
мени*) |
|
|
(7.3.1) |
|
|
х(к + 1) = |
«[х(к),%(к),к], |
||
|
Ч *+ 1 ) = |
т|[х(А),ЧА),А] |
(7.3.2) |
|
с условиями на концах |
|
|
|
|
|
Ч*о) = Ах(/с0) + Ь, |
l ( k t) = 0. |
(7.3.3) |
Заменим условие на конце Х(АД = 0 более общим ус ловием \{kf) = с. Пусть kf и с — переменные величи ны. Значение х на том же конце траектории определит ся как
х (kf) = г [с, к{]. |
(7.3.4) |
Допустим, что ДТКЗ решается для одного интервала квантования так, что kf переходит в kf + 1, а с в с + Дс. Новое финальное значение х имеет вид
|
|
х (к/ + |
1) = |
х (kf) -j- Ах = г (с + |
|
Ac, kf + |
1). |
(7.3.5) |
||||
Но х (kf) = г (с, kf) |
так, что имеем |
|
|
|
|
|
||||||
|
|
г (с, kf) + |
Ах — г (с -f Ac, kf + |
1). |
|
(7.3.6) |
||||||
Можно записать г (с |
+ |
Ac, kf |
Д-1) |
в |
следующем |
виде: |
||||||
г (с + |
Ac, kf + |
1) = |
|
|
|
бг (с, kf), |
|
х 64 (с, kf) |
||||
|
|
|
бг (с, к.) |
|
^ |
|||||||
|
= |
Г (С’ kt) + |
"бс~ |
АС + |
~ Щ- |
|
•Т |
|
бсбк. |
ТАс. |
||
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
(7.3.7) |
Здесь бг/бс — первая частная разность |
|
|
|
|||||||||
|
|
Г бг (с, kf) 1 |
^ |
г. (с + |
Ac, kf) — ri |
(с, kf) |
|
(7.3.8) |
||||
|
|
L |
6с |
Jy — |
|
А |
|
|
|
|
||
И |
|
бг (с, kf) |
_ |
Г. (с, kf + 1) — Tj (с, kf) |
|
|
||||||
|
|
|
(7.3.9) |
|||||||||
|
|
~ ~ Щ |
|
|
|
Т |
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|||
*) |
В |
целях |
упрощения |
обозначений |
интервал |
квантования |
Т будет пропускаться, если он встречается вместе с натуральным числом — номером дискретного момента времени кТ или (к + 1 )Т.
9 Э. П. Сейдж, Дж. Л. Мелса
218 |
ИНВАРИАНТНОЕ ПОГРУЖ ЕНИЕ |
[ГЛ . 7 |
Следует отметить, что уравнение (7.3.7) является точным, хотя весьма напоминает разложение Тейлора. Если под ставить (7.3.7) в (7.3.6), получим
6г (с, kj) |
62г (с, kf) ^ |
А с + |
Sr (с, к.) |
|
Ах |
бс |
бсбк. |
- ^ / 7 ’. (7.3.10) |
|
[■ |
|
|
Из уравнений (7.3.1) и (7.3.2) можно определить Ах и Ас:
Дх = х (kf -f |
1) — х (kj) =-- а [г (с, kj), с, kf] — г (с, kt) |
(7.3.11) |
|||
и |
|
|
|
|
|
Ас — к (kj -f |
1) — к (kf) = |
rj [г (с, к{), с, it/] — с. |
|
(7.3.12) |
|
Так что уравнение (7.3.10) преобразуется к виду |
|
|
|||
* [г (с, kf), с, к,] — г (с, kf) = |
|
|
|
||
' бг (с, kj) |
б2Г (С, kf) |
(Л [г (с, kf), c,kt\— с} + |
бг (с. */) |
т, |
|
бс |
бсбkf |
|
6А/ |
^ • |
|
|
|
|
|
(7.3.13) |
Если бы из этого уравнения в частных разностях удалось найти г (с, kf), то ДТКЗ была бы полностью решена. Од нако, как и в непрерывном случае, найти общее аналити ческое решение уравнения (7.3.13) не удается и обычно обращаются к приближенным методам. Прежде чем про должить эту цепочку рассуждений, полезно обсудить взаи мосвязь между дискретным и непрерывным вариантами инвариантного погружения, т. е. уравнениями (7.2.13) и (7.3.13).
Одна из дискретных форм записи уравнений (7.2.1) и (7.2.2) имеет вид
х (к + 1) = Т\ [х (к), к (к), к] + х (к),
к (к + 1) = Гр [х (к), к (к), к) + к (к).
Так что а и tj в уравнениях (7.3.1), (7.3.2) очевидным об разом определяются как
* [х(/с), к (к), к] = Т\[х(к),к(к),к] + х(к), (7.3.14)
ц [х (к), к (к), к] = Гр [х (к), к (к), к] + к (к). (7.3.15)
Здесь Т предполагается малой величиной, так что произ водную можно заменить первой разностью. Подстановка
7.3] ДИСКРЕТНЫ Е СИСТЕМЫ 219
(7.3.14) и (7.3.15) в |
(7.3.13) дает |
|
|
||
Ту (г, с, kf) = |
|
|
|
|
|
|
бг (с, kf) |
б2г (с, kf) |
М C’ kf) rr |
(7.3.16) |
|
-[■ |
бс |
бсбк. |
Т§ (г, с, kf) + |
6hf 1 ' |
Если теперь разделить это уравнение на Г и устремить Т
к нулю, полагая kf T = |
tf, |
то из (7.3.16) получим |
||
дт(с, tf) |
Р (г, с, tf) + |
дт(с, tf) |
(7.3.17) |
|
Y (г. с, tf) |
дс |
dt |
Уравнение (7.3.17) не содержит вторых производных и в этом смысле дискретное уравнение является более общим, так как, используя дискретную аппроксимацию уравне ния (7.3.17), было бы невозможно получить уравнение (7.3.16) в конечных разностях. Можно показать, что вто рая частная разность становится существенной, когда интервал квантования нельзя считать малым (Сейдж [116]).
Вернемся теперь к основному вопросу об отыскании решения ДТКЗ. Так как в общем виде решить (7.3.13)
не |
удается, |
|
предположим, |
что г (с, |
kf) |
линейна по с: |
||
|
|
|
г (с, kf) = |
х (kf) — Р (kf) с. |
|
(7.3.18) |
||
Используя |
(7.3.18), вычислим разности, |
которые |
входят |
|||||
в уравнение |
(7.3.13): |
|
|
|
|
|
||
|
|
± |
^ l = - V |
( k f), |
|
|
(7.3.19) |
|
|
|
|
= _ |
[Р(Л/ + 1) - |
Р(*,)1 IT |
(7.3.20) |
||
и |
|
|
|
|
|
|
|
|
— |
= |
[X (kf -f 1) — X (kf) — Р (kf + 1) с + Р (kf) с] /Т. |
||||||
|
|
|
|
|
|
|
|
(7.3.21) |
Подставив эти выражения в (7.3.13), ползшим |
|
|||||||
а [х (кД— Р (kt) с, с, к <1= |
|
|
|
|
|
|||
= — V(kf |
'Мт] [x№f) - Р (kf)c, с, к}] 4- x(kf -\-1). |
(7.3.22) |
9*
220 ИНВАРИАНТНОЕ ПОГРУЖ ЕНИЕ [ГЛ . 7
Разлагая « и р в ряд Тейлора в окрестности х {kf), 0 и kf
и пренебрегая членами высокого порядка, |
можно перепи |
||
сать уравнение (7.3.22) в виде |
|
|
|
* [х (к)), 0, kf] |
да [х (kf) — Р (kf) с, с, kf] I |
|
|
до |
|с=0 с — — Р (kf -j- 1)х |
||
X |il [х (kf), 0, kf] |
дт\[х (kf) — Р (kf) с, с, kf] |
^с}-)-x(fc,+ 1). |
|
Эс |
|
||
|
|
|
(7.3.23) |
Это соотношение должно выполняться для всех достаточ но малых с, поэтому, приравнивая коэффициенты при первой и нулевой степени с, получим
X (kf + |
1) = |
* [X (kf), 0, kf] |
+ Р (kf -f 1) Т] [х (kf), 0, kf], (7.3.24) |
||
' (*/ + |
!){- |
дц [х (kf) — Р (kf) с, с, kf ] |
J |
- |
|
дс |
|
||||
|
|
|
да [х (kf) — Р (kf) с, с, kf] |
||
|
|
|
|
дс |
. (7.3.25) |
|
|
|
|
|с=0 |
Теперь необходимо подставить выражение для ж и ц. Рас смотрим дискретную ДТКЗ (3.2.30) — (3.2.32), (3.2.34),
которая, если пренебречь членами второго порядка мало сти по с, приводится к виду
х (к, + 1) = ф [х (kt), kf] — |
|
- - 4- |
|
|
|
- Г [х (к,), kf] Vw (kf) ГТ [x (kf), kf] - -- |
- |
T , (7.3.26) |
|||
|
|
|
Эх (kf) |
|
|
|
Эх (кЛ |
|
|
|
|
+ |
ЭЬт [х (kf + l),kf + |
i] |
\){z(kf + i ) |
||
Эх (kf + 1) |
Y?(kf + |
||||
|
|
|
|
|
|
|
|
— h |x (kf |
1), kf + |
1]}, (7.3.27) |
|
|
h(k0) = |
VXo [x(fc0) |
M-Xol) |
|
(7.3.28) |
|
% (kf) = c = 0. |
|
|
(7.3.29) |
Заметим, что эти выражения не сводятся к (7.3.1) и (7.3.2), так как в правой части уравнения (7.3.27) появилась за висимость от х (kf -f 1). Подставляя х (к{ + 1) из (7.3.26),