Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Медич Д. Статистически оптимальные линейные оценки и управление

.pdf
Скачиваний:
70
Добавлен:
25.10.2023
Размер:
13.81 Mб
Скачать

Постановка

задачи

 

 

 

 

 

 

По

известным

измерениям

{z(x), U^ix^Lt)

найти

оценку

состояния

 

 

вида

(8-3),

минимизирую­

щую среднеквадратическую

ошибку

(8-2).

 

 

 

Ясно, что задача

заключается

в определении

весовой

матрицы A(t\, х),

/о<:т<с;г.

 

 

 

 

 

Решение поставленной задачи оценки дается теоре­

мой 8-1. Эта теорема

доказана

 

Калманом

и

Бьюси

[Л. 8-1] с использованием понятия

 

ортогональных

проек­

ций в гильбертовом

пространстве.

 

Здесь

она

доказыва­

ется с использованием классических вариационных ме­ тодов.

Теорема дает необходимое и достаточное условие оптимальности оценки в виде матричного интегрального уравнения, называемого уравнением Винера — Хопфа.

Вследствие этого задача оценки сводится к задаче ре­ шения интегрального уравнения частного вида.

Теорема

8-1.

Для

того

чтобы

оценка

x(t\\t)

была

оптимальной,

 

необходимо

и

достаточно,

чтобы

весовая

матрица

A (О,

х)

удовлетворяла

уравнению

Винера

Хопфа

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

(т) z'

 

 

 

 

E

[x (Q

z'

(*)] -

{ Л ( М x)E[z

(s)] dx =

0

(8-4)

для всех

 

cr<c: t.

to

 

 

 

 

 

 

 

i o < ;

 

 

 

 

 

 

 

 

Д о к а з а т е л ь с т в о .

Согласно

определению

ошибки

оценки и уравнению (8-3)

имеем:

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

* (МО =

• * & ) - *

( М О = • * ( ' . ) -

f л * ^ >

-о 2(1)

 

где A*(t, т)произвольная весовая матрица. Отсюда следует, что корреляционная матрица ошибки имеет вид:

£ [ х ( М 0 * ' Ш = Я <

. * & ) -

т(т)<*т X

X ! • * & ) - \A*(tt,

IL

h\=Е[х'Ш-

o)z(?)ds

 

- Ç £ [ * ( О г ' ( ° ) М * ' ( ' . . 9)(Ь-

330

 

-jV(*„ x)E[z(x)x'(t1)]dx

+

 

to

 

t

t

 

Среднеквадратическая ошибка

представляет собой

след этой матрицы. Так как третье слагаемое в правой части уравнения (8-5) получено транспонированием вто­ рого слагаемого, след их суммы равен удвоенному следу второго слагаемого. Это означает, что среднеквадратическую ошибку можно представить в виде

^ ( M 0 ] = S p J £ [ * & ) * ' ( O l -

 

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

-

2

\E\x(t1)z'(i)}A*'(tl,

 

 

0

) d 3

+

 

 

 

+

{ A* (fl t

x) dx Ç E[[Z

(x) Z'

(a)] Л*' (fn

3 )

Л

.

(8-6)

 

 

to

 

h

 

 

 

 

 

 

 

J

 

 

 

Уравнение (8-6) представляет среднеквадратическую

ошибку в виде функционала от A (t, х).

 

 

 

 

 

Теперь предположим, что существует весовая матри­

ца

A(tit

х), для

которой

выражение

(8-6)

минимально.

Образуем другую весовую матрицу вида

 

 

 

 

 

 

 

Л* (г,, x)=A(t1,

x) +

eAt(tlt

 

x),

 

 

(8-7)

где

As(t^

x) произвольная

весовая

матрица,

а s — ска­

лярный параметр. Член eAt(tlt

 

х)

называется

вариацией

матрицы

A(tu

х).

 

 

 

 

 

 

 

 

 

 

 

Если уравнение (8-7)

подставить

в уравнение

(8-6),

то

среднеквадратическая

ошибка

становится

функцией

от

е при постоянном Ae(t,

х).

Далее,

если

A(t,

х)

—ве­

совая матрица,

минимизирующая

среднеквадратическую

ошибку,

то эта

ошибка

должна

быть

стационарной при

8 = 0. Иными

словами,

частная

производная от средне-

квадратической ошибки по е должна обращаться в нуль

при

е = 0. Такой подход приводит к необходимому

усло­

вию

оптимальности, накладываемому на A (ftи т).

Полу­

чив это условие, покажем, что оно также является до­

статочным.

331

Необходимость.

Подставляя

уравнение

(8-7) в урав­

нение (8-6), получаем:

 

 

 

 

 

 

 

 

J

[хЦШ = S P

| E [ X

ft)*'(Ol

-

 

- 2 f £ [ * f t ) z ' ( ' ) l H f t ,

3 ) + еЛе (^„

?)}'di +

to

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

t

 

 

 

+ f

ft, т ) + е Л , ( * „

x)]dxj £ [z(x)z'(^)]X

 

 

X H f t ,

з) +

еЛе (г„ 3 )]'d3 J.

(8-8)

Отсюда

следует,

что

 

 

 

 

 

 

 

j£-=

Sp j

- 2 j

£

[x ft) г' (3 )] Л'. ft,

з) X

 

Х

Л +

[ [ Л

ft,

T ) +

B ^ f t ,

х)] Х

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Xdx f £ [ z ( T ) , ' 0 ) ] ^ 6 f t ,

3 ) Л +

 

 

 

' t

 

 

 

 

 

 

 

 

+ | Л ft,

x)tfx j £ [ z ( x ) Z ' 0 ) ] H f t . 3 ) +

4 f t ,

а)]'Л

Так как последнее слагаемое в правой части этого выражения получено транспонированием второго слагае­ мого, след их суммы равен удвоенному следу второго слагаемого. Следовательно,

^ - = 2 S p | f H f t , -O + e^.ft, x)]dxX

t0

t

X f COM'. ('..*)л-

- Ç £ [ x f t ) z ' ( ^ ) ] / l ' , f t , a )^J .

332

Полагая (дУ/де)| е = 0

= 0,

получаем

 

 

 

 

 

 

r

t

 

 

 

t

 

 

 

 

 

 

 

 

 

 

Sp

f A (f,,

т) dx

f E [z (x) z'

A \

{tt,

a) dz

-

 

 

 

 

 

К

 

 

 

 

 

 

 

)

 

 

 

 

Изменяя порядок интегрирования

в первом

слагаемом

в левой части и умножая обе части

уравнения

на — 1 ,

получаем:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Sp

f І£[л(Ог'(3 )]-

(г„

т)£[г(т)2'(3)]ЛІХ

 

 

 

 

 

 

 

 

 

 

= 0.

 

 

 

(8-9)

Уравнение

(8-9)

должно

выполняться

для любой

весо­

вой матрицы Ae(tlt

 

т). Следовательно, оно выполняется

тогда и только тогда, когда матрица

A (ti, т)

удовлетво­

ряет

соотношению

 

 

 

 

 

 

 

 

 

 

 

 

E[x(tt)z'(?)]

 

\A(t,,

т)Е'(т)\ач

=

0

 

для всех

 

 

 

 

 

h

 

 

 

 

 

 

 

 

ta<=3-it.

 

 

 

 

 

 

 

 

 

 

 

Достаточность.

Раскрывая

скобки

в

уравнении

(8-8),

получаем:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

J [x (t, 11)] =

Sp [ E [X (*,) x'

(t,)} ~2\E\x

(Q

z'

(*)]

X

 

 

 

 

 

{

 

(

 

 

 

i.

 

 

 

 

 

XA'{U,

a)ds — 2s

\E[x(t,)z'{?)]A\(t„

 

a)rf*

+

 

 

 

 

 

 

 

 

h

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

t

 

 

 

 

 

 

 

 

 

+

J A (*„

x)4x

f £

[2 (x) г' (З)] Л'

a) Л

+

 

 

 

t

 

 

 

 

t

 

 

 

Л ' (tl f a) do

 

 

 

+

e J Л , (*lf

T) dx f £ [2

(т) г' (3)]

+

 

 

+ в | л ( / „

T)dx^E[z(x)z'^)]A',(tlt

 

°)ds

+

 

 

 

to

 

 

 

t

U

 

 

 

 

 

 

 

 

+

. * J

A , V 1

,

x)rfxj

£ [z (x) Z ' ( » ) M ' . ( * „ 9 )<feJ.

(8-10)

333

Если сравнить сумму первого, второго и четвертого слагаемых в этом выражении с правой частью уравне­

ния

(8-6), то можно

убедиться, что

эта

сумма

равна

среднеквадратической

ошибке

для

весовой матрицы

A(t,

т), т. е. минимальной среднеквадратической

ошиб­

ке. Обозначим ее

J°[x(ti\t)].

 

 

 

 

Так как пятое

слагаемое

получено

транспонирова­

нием шестого слагаемого, след их суммы равен удвоен­ ному следу последнего. Поэтому уравнение (8-10) мож­ но представить в виде

Согласно уравнению (8-1)

 

Е [z (т) z' (а) ] = H (т) Е [х (т) х'{а)]Н'{а)

+

+ Н{х)Е [х (т.) ѵ'(а)] + Е[ѵ (т) х' (а) ] Н' (а) + R (т) Ô (т—а).

Первые три слагаемых в правой части этого соотно­

шения неотрицательны, а последнее слагаемое

R(x)è(x—

—а) положительно, поскольку матрица R(x)

положи­

тельно определена для всех x^U. Поэтому подстановка

этого соотношения в последнее слагаемое в правой части

уравнения (8-11)

делает это

слагаемое положительным.

Теперь ясно, что если

 

 

E[x(t,)z'V)]-

t

T)E[z{z)z'(,)\dz

= 0

[ Л ( ^ ,

 

h

 

 

для всех to^o^t,

то второе

слагаемое

в правой части

уравнения (8-11)

обращается

в нуль и

 

J[x{tAt)}>P[x{U\t)}.

Это означает, что среднеквадратическая ошибка не уменьшается при возмущении A(t, т), если эта матрица удовлетворяет уравнению Винера — Хопфа. Теорема до­ казана.

334

Для удобства уравнение Винера — Хопфа

часто

запи­

сывают в виде

 

 

 

E[x{t1\t)z,{a)]

= 0

(8-12)

для всех ^ о ^ Д ^ І

 

 

 

Это равенство легко получить. Уравнение

(8-4)

мож­

но представить в виде

 

 

 

a так как

X{tl\f) =

^A(J1,

т ) 2 ( т ) Л ,

и x{tl I t) — x(tù — x(tl\t),

то

отсюда сразу следует

уравнение (8-12).

 

 

Не представляет затруднения также доказательство следствия теоремы 8-1.

Следствие 8-1.

Д о к а з а т е л ь с т в о . Вначале заметим, что

E[x{tt\t)x'

 

г

t

 

 

{tAt)\=E\x{tAt)

'A(tt,

i)z(%)dz

 

 

 

L'o

 

 

 

 

 

 

t

 

 

z)dz

 

 

=

^Е[х^\Е)г'(т)]А'(^

 

 

Но

в силу

уравнения (8-12)

E[x(ti\t)z'(т)]

= 0 для

всех ^ о ^ т ^ ^ , что и доказывает

следствие.

 

В

следствии

утверждается,

что оптимальная

оценка

не коррелирована с соответствующей ошибкой оценки. Так как оба вектора являются гауссовскими, это озна­

чает, что они независимы.

 

 

 

Решение уравнения

Винера — Хопфа,

как и

решение

всякого

интегрального

уравнения,

представляет собой

довольно сложную задачу. Если {х(іі),

ti^U)

и {z(x),

U^x^t)

стационарные процессы,

уравнение

можно

335

решить в общем виде, используя метод спектральной факторизации, предложенный Винером. Этот метод из­ лагается, например, в работах Ли [Л. 8-3], Ньютона и др. [Л. 8-4]. Однако обычно требуется рассмотреть не­ которые частные случаи решения нестационарного урав­

нения

Винера — Хопфа, что и будет сделано в

§ 8-2

и 8-3.

 

 

Легко найти качественные аргументы в пользу

урав­

нения

Винера — Хопфа. Во-первых, здесь утверждается,

что оптимальная оценка должна быть линейной и иметь

вид

(8-3) непрерывного

аналога уравнения (5-9). Далее

по

аналогии с третьим

свойством

оптимальных оценок

на

стр. 185 получаем, что ошибка

оценки

не зависит от

множества известных

измерений

{z(o),

to^o^it}.

Это

означает, что процессы {x(ti\t),

ti^to}

и

{z(a),

to^o^t}

некоррелированы и,

следовательно,

 

для

ö < ! t.

 

Поэтому следствие 8-1 представляет собой просто

непрерывный аналог уравнения (5-10).

В заключение параграфа приведем следующую лем­ му, которая будет использована в § 8-2 и 8-3. В лемме

утверждается,

что

корреляционная

матрица

разности

двух оптимальных оценок равна нулевой матрице.

 

Лемма 8-1. Пусть

 

x(tt\t)

и -**(г,|

t)

оптимальные

оценки

состояния x{tx).

Тогда

 

 

 

 

 

E

{[X (f, \t)-x*

(t,

11)) [S (M Z) - x*

С I 01 '} =

0-

(8-14)

Д о к а з а т е л ь с т в о . Пусть

x{tt

\t) =

x(tA —x

(t, \t)

и x*(t1\t)

= x(t1)

— x*(t^t).

Согласно

следствию

8-1

 

 

Е[х(^\^х'(Ц^}

 

=

0;

 

 

(8-15)

 

 

£ И М

0 >

(M

0 1 = 0 .

 

 

(8-16)

336

Вычитая почленно из уравнения (8-15) уравнение (8-16), получаем:

 

 

£ { * ( М О І * ( М О - 2 * ( ' , і О ] ' } = = 0 -

 

 

 

(8-17)

Точно

таким

же

 

 

образом

получим

 

соотношения

E [x* (t, I t) x'

(t, 101 0

и

E [x* (t,

I t)x*'

(t, \ f)\=

0,

так

что

 

E {x* (tt \t)(x{tt\

 

t) -x*

{t, \ t)}'}

= 0.

 

 

(8-18)

Вычитая

почленно

из уравнения (8-18) уравнение

(8-17),

имеем:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Е {[**(*, 10-

x

 

| 0]

(f, \t)-x*

(t,

1 01} =

0.

 

Ho x*

{t1

\ f)—x(tt\t)

 

=

x (t, 11) ~ Jc*(f, 10.

откуда

сразу

следует утверждение

леммы.

 

 

 

 

 

 

 

 

8-2. ОПТИМАЛЬНАЯ ФИЛЬТРАЦИЯ

 

 

 

 

 

 

 

 

Решим

уравнение

Винера — Хопфа

при

t\ = t,

т,

е.

для задачи

оптимальной

фильтрации,

где

(x(t),

t^U}

гауссовский марковский процесс, описываемый уравне­ нием (7-1). Здесь предполагается в отличие от постанов­

ки задачи § 7-1 и

задачи

оптимальной фильтрации

в § 7-3, что процессы

 

 

 

{w(t),

t^Q

и

{v(t),

коррелированы, и их взаимная матричная корреляцион­ ная функция имеет вид

E[w(:t)v'(x)]=S(t)ö(t-x)

для всех t, x^to,

где S(t)—непрерывная

матрица

раз­

мера

рХт.

 

 

 

 

Уравнение Винера — Хопфа

для, оптимальной

филь­

трации

в случае,

когда S(t)=0,

было

решено Калманом

и Бьюси (Л. 8-1]. Решение в настоящей главе отличается от их решения только несущественными деталями.

Алгоритм оптимальной фильтрации, излагаемый ни­ же, обычно называют фильтром Калмана — Бьюси.

Фильтр

 

 

 

 

Рассмотрим уравнение

Винера —Хопфа

на

интер­

вале tQ^a<t, где ti = t:

t

 

 

 

 

 

 

 

E [x (0 z'(p)]-JA

{t,

z) E[z(z) z' (o)] dx =

0.

(8-19)

22—85

 

 

 

337

 

Важно заметить, что здесь рассматривается

изме­

нение а только на

полуинтервале

вида

[to, t).

Случай

a=t

будет рассматриваться

отдельно по

причинам, яс­

ным из дальнейшего.

 

 

 

 

(8-19) по t,

 

Дифференцируя

левую

часть уравнения

получаем два слагаемых:

 

 

 

 

 

 

 

^fE[x(t)z'

(a)] = E[x{t)z'

(а)] = Е {[F (t) X {t)

+

+

G (t) w (01 z' Щ =F(t)E

[x (f) z' (,)] + G(t)E

[w (t) z' (,)];

 

 

t

 

 

 

 

 

 

(8-20)

 

 

T)£[z(x)z'(3 )]rfx =

 

 

 

 

~^А(І,

 

 

 

t

 

 

 

 

 

 

 

 

= = |ІеЬ _ 1я [2 (х)г'(с»)] Л + Л(/, t)E[z(t)z'(a)]t

 

(8-21)

t.

 

 

 

 

 

 

 

 

где

г 0 < а < г .

 

 

 

 

 

 

 

 

Рассмотрим последнее

слагаемое в уравнении (8-20).

Из (7-2) имеем:

 

 

 

 

 

 

 

так что

z' (а) =х'{а)Н'{а)

+ ѵ' (о),

 

 

(8-22)

 

 

 

 

 

 

 

 

 

Е [w

 

{t)z'{e)]=E{w(t)x'{o)}H'(a)+E{w{t)v'{o)l

Поскольку

a<t,

то E[w(t)v'(а)]

= 0. Поэтому

 

 

E[w{t)z'{a)\=E{w{t)x'{o)\H'{o).

 

 

 

(8-23)

Решение уравнения (7-1)

можно представить

в виде

 

X (а) =

Ф (a, Q X (/„) + [ Ф (а,

x) G (x) w (х) Л ,

(8-24)

 

 

 

 

І

 

 

 

 

 

где

Ф'(а, т)—переходная

матрица

состояния.

 

Используя этот результат,

получаем:

 

 

 

 

Е [w {t) X' (о)} = E[W (0 x' (t0)} Ф' (a,

Q

+

 

 

 

а

 

 

 

 

 

 

 

 

+ jEV)ш'(х)1G'С")ф'(°« т ) d % -

 

Первое слагаемое в правой части этого соотношения

обращается в нуль,

так как x(t0)

не зависит от

{w(t),

338

t^t0}. Во втором слагаемом Е [w (t) w'(х)] = Q (t) à (t—т.). Однако поскольку t находится вне интервала интегри­ рования, это слагаемое также обращается в нуль. Сле­ довательно,

для

 

tQ^a<t.

E[w{t)x'(ü)]

= 0

 

 

 

 

 

(8-25)

 

 

 

 

 

 

 

 

(8-23), по­

 

Подставляя этот результат в уравнение

лучаем:

 

Я ( ш ( 0 г , ( о ) 1 = 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

для

t0^a<t.

Следовательно,

последнее слагаемое

в вы­

ражении (8-20) равно нулю, и

 

 

 

 

 

 

 

 

 

 

-^Е[х

(0 г'

(,)] = F(t)E

[x (t) z'

(з)]

 

 

(8-26)

для

t0<^a<t.

 

 

 

 

 

 

 

 

 

 

 

Рассмотрим второе слагаемое в правой части урав­

нения

(8-21). Используя уравнение (7-2),

получаем:

 

 

Е [z (0 z' (,)] = £ {[Я (0 x(t)

+

o (01 z' Щ

 

=

 

 

 

 

= Я (0 Я (0 г' (?)] - f Е [и (0 z'

(з)].

 

(8-27)

 

Из

уравнения (8-22) следует, что

 

 

 

 

 

 

Е [V (0 z' (з)] =

Е[ѵ (0 x' (-,)] Я ' (о) +

£ [у (0 о' (01.

(8-28)

 

Так

как з < < / ,

то Е [ѵ (t) ѵ' (з)] =

0.

 

 

 

 

 

 

Используя уравнение (8-24), получаем:

 

 

 

 

 

 

Е [V (t) X' (з)] =

£ [о (0 X ' (f.)] Ф' (a,

f0) - f

 

 

 

 

 

а

 

 

 

 

 

 

 

 

 

 

 

 

+

f £ [у (0 te»' (x)] G' (т) Ф' (з,

т) d

t .

 

 

 

 

 

 

h

 

 

 

 

 

 

 

 

 

 

Первое слагаемое в правой части этого соотношения

обращается

в нуль, поскольку

x(U)

не зависит

от

{v(t),

i^to).

Хотя

E[u(t)w'(x)]

= S(t)ô(t—т.),

второе

 

слагаемое

также

обращается в нуль, так как t

находится вне ин­

тервала интегрирования. Следовательно,

 

 

 

 

 

 

 

 

E\[v(t)xf(a)]

= 0

 

 

 

 

 

 

для

to^a<t.

В результате уравнение

(8-28)

приводится

к виду

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

£ И 0 2 ' ( а ) ] = 0

 

 

 

 

 

 

22*

 

 

 

 

 

 

 

 

 

 

 

339

Соседние файлы в папке книги из ГПНТБ