Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Медич Д. Статистически оптимальные линейные оценки и управление

.pdf
Скачиваний:
63
Добавлен:
25.10.2023
Размер:
13.81 Mб
Скачать

Следовательно, существует отличное от нуля состоя­ ние x(t(j), которое нельзя определить, зная z(t), h^t^tu что противоречит предположению о наблюдаемости си­ стемы. Теорема доказана.

В общем случае условие (2-41) трудно применить на практике из-за большого объема требуемых вычислений. Однако для стационарных систем известно следующее легко применимое следствие, которое приводится здесь

без доказательства.

 

 

 

 

 

 

 

 

Следствие 2-1. Стационарная

 

непрерывная

линейная

система

x = Fx,

z(t)=Hx(t),

 

где

t~^t0,

полностью

наблю­

даема

тогда

и

только

тогда,

когда

 

матрица

размера

пХтп

 

 

 

IIЯ' F'H'...

 

( F ' ) " - W | !

(2-47)

имеет ранг

п.

 

 

 

 

 

 

 

 

 

 

 

 

 

Пример

2-5.

Для системы из примера 2-

 

где

 

 

 

 

 

F

0

1

;

я

=

1

0

 

 

 

 

 

 

=

0

0

1

 

 

 

 

 

 

 

0

 

 

 

 

 

имеем:

 

 

 

 

1

0

 

 

 

 

0

0

 

 

 

 

Я '

;

F'H' =

 

 

 

 

=

1

1

0

 

Тогда

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ранг H Я '

F'H И = ранг

 

 

 

= 2

 

и поэтому система полностью наблюдаема.

С другой стороны, если измеряется только ошибка по скорости

изменения

угла

рыскания, так что Я = ||0

то

 

 

 

 

 

Я '

0

,

F'H' =

0

 

 

 

 

 

1

0

 

 

 

 

 

ранг у H'

F'H'

у =

0 О

=

1.

 

 

 

ранг

О

 

 

 

 

 

 

1

 

 

 

В этом случае

система

ненаблюдаема.

 

 

 

 

Дискретные линейные

системы

 

 

 

 

Действуя аналогичным

образом, исследуем

вопрос

о наблюдаемости дискретной линейной системы

 

x(k+l)=Q>(k+l,

k)x(k)+W(k+\,

 

 

k)u(k);

(2-48)

 

 

z(k+l)=H(k+l)x(k+\),

 

 

 

(2-49)

где k = 0,

1 . . . Вектор x(0)

неизвестен,

последователь-

60

ность

{и(0),

«(1), ... }

задана, а

все

остальные

обозначе­

ния были описаны в § 2-3.

 

 

 

 

 

 

 

 

 

Дискретная

линейная

система

(2-48),

(2-49)

назы­

вается

наблюдаемой,

 

если

х(0)

 

можно

определить

из

множества

наблюдений

{z(\),...,

z(N)}

при конечном

N.

Если

это

справедливо

для

любого

 

начального

 

времени

(k = 0

соответствует

ta),

то система

называется

пол­

ностью

наблюдаемой.

 

 

 

 

 

 

 

 

 

 

 

Следующий результат аналогичен теореме 2-1.

 

Теорема 2-2. Дискретная

система

(2-48),

(2-49)

яв­

ляется

полностью наблюдаемой

тогда

и

только

тогда,

когда

симметрическая

матрица

размера

 

пХп

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

Md{0,

Л0 =

2Ф '(». 0 ) Я ' (t)

H (і) Ф(і,

0)

(2-50)

положительно

определена

для

 

некоторого

N>0,

где

Ф(і, 0 ) = Ф ( і ,

і— 1 )Ф(і— 1,

і—2)...Ф(1,

 

0);

 

i=\,...,N.

Д о к а з а т е л ь с т в о .

Как и

для

непрерывного

слу­

чая, достаточно рассмотреть

систему

 

 

 

 

 

 

 

 

 

 

х ( £ + 1 = Ф ( £ + 1 ,

k)x(k);

 

 

 

(2-51)

 

 

 

 

z{k+\)^H(k+\)x{k+\);

 

 

 

 

 

 

(2-52)

k = 0,

1,..., так как u(k)

предполагается

известным

для

всех k.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Достаточность.

Рассмотрим

последовательность

из­

мерений

{z(\),...,z{N)}.

 

 

Из уравнений (2-51) и

(2-52)

имеем:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

г ( 1 ) = Я ( 1 ) х ( 1 ) = Я ( 1 ) Ф ( 1 ,

0)х(0);

 

 

 

 

2 ( 2 ) = # ( 2 ) х ( 2 ) = # ( 2 ) Ф ( 2 ,

1)Ф(1,

О)лт(О);

 

z(N)

— H(N)x(N)

 

=>tf(N)Ф(Л/,

N—\)x{N—1)

:

 

 

 

 

= Я ( Л ^ ) Ф ( І Ѵ ,

N— 1) . . . Ф ( 1 ,

О)лг(О).

 

 

 

Обозначим

 

 

 

 

z ( l )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

z(N)

 

 

 

 

 

 

 

 

 

Ф{і,

0 ) = Ф ( і ,

I — 1)Ф(і — 1,

і—2)

. . . Ф ( 1 , 0)

 

для i=l,...,N.

Ясно,

что

zN

— /яіѴ-мерный вектор.

 

61

îl олагая

 

 

 

 

Н(1)Ф(\,

0)

 

 

 

 

 

 

 

 

 

 

(2-53)

 

 

 

 

H

(/V) ф

(N, 0)

 

 

получаем:

 

zN

=

HNx(0),

 

(2-54)

 

 

 

 

где

HN— матрица

размера

mNXn.

на H'N, получаем:

 

Умножая уравнение

(2-54) слева

 

 

H'NHNx(0)

= H'NzN.

 

(2-55)

 

В силу определения HN

(2-53)

ясно, что

 

 

tf'A=E*'C'.

і=і

 

0)Н'(І)И(І)Ф(І,

0).

 

 

 

 

 

 

 

 

 

 

Обозначим

эту

симметрическую

матрицу

размера

пХп

через Md(0, N).

(2-55) следует, что

 

 

Теперь из уравнения

 

 

 

x(0) =

 

Arl(0,N)H'Nz,

(2-56)

откуда видно,

что

система

является

полностью

наблю­

даемой, если матрица Md(0, N) положительно опреде­

лена для некоторого

N>0.

 

 

 

Необходимость.

Теперь предположим, что система яв­

ляется

наблюдаемой,

но для некоторого х(0)ФО выпол­

няется

равенство x'(0)Md(0,

N)x(0) = 0. Тогда из уравне­

ния (2-55) еледует

соотношение

 

 

 

 

 

 

х'(0)Н'„г„ =

0,

 

которое в

силу уравнения

(2-54)

приводит

к

 

 

 

 

z

W

= 0.

 

(2-57)

Отсюда

следует,

что

z(i)=0

для всех

і'=1,...,Л^ и,

как и в непрерывном случае, мы приходим к заключе­ нию, что существует отличное от нуля начальное состоя­ ние х(0), которое нельзя определить из {г(1), .. .,z(N)}. Однако это противоречит предположению о наблюдае­ мости. Теорема доказана.

62

Для стационарной системы справедливо следующее

следствие.

 

Стационарная

дискретная

линейная

Следствие

2-2.

система

x(k + 1) = Ф * ( £ ) ;

z{k+

1) = Hx(k

+ 1), k = 0,

1,...,

является

полностью

наблюдаемой

тогда

и только

тогда,

когда матрица

размера

пХтп

 

 

 

 

 

имеет ранг п.

\\Н'Ф'Н'...

(Ф')п-іН'\\

 

 

 

 

 

 

 

 

 

 

 

Это

следствие можно

доказать,

в основном

повторяя

этапы доказательства теоремы 2-2. Подробное доказа­ тельство предоставляется читателю в качестве упраж­ нения.

В доказательстве двух предыдущих теоірем о наблю­ даемости показано, что если управления u(t) и u{k) из­ вестны, то требуется рассматривать только соответст­ вующие однородные или собственные уравнения системы. Предположение о том, что вектор управления известен, является разумным с физической точки зрения, посколь­ ку в общем случае его можно задать.

Связь между понятиями наблюдаемости и оценки те­ перь достаточно очевидна. Действительно, при доказа­ тельстве достаточности в теоремах 2-1 и 2-2 были полу­

чены алгоритмы для определения x(t0)

и х(0)

по

извест­

ным

измерениям ;[см. уравнения

(2-46)

и (2-56)]. Эти ре­

зультаты вместе с выражениями

 

 

 

 

 

 

х(Е) = Ф (t, t0) X (t0)

t

 

 

С (т) и (т) dz

 

 

- f j"

Ф {t, x)

 

и

 

U

 

 

 

 

 

* ( * + 1 ) = Ф ( Л + 1 , k)x(k)+W(k-r-\,

k)u(k),

 

 

 

где

& = 0, 1,..., позволяют

точно

определить

поведение

вектора состояния во времени.

В

этом смысле

задача

оценки здесь решена при идеальных условиях, т. е. без возмущений и без ошибок измерения.

Если вновь

ввести возмущения и ошибки измерения,

то получится,

конечно, более сложная задача. Однако

если задача оценки не может быть решена при идеаль­ ных обстоятельствах, едва ли имеет смысл ее решать в присутствии возмущений и ошибок измерения. По этой причине предполагается, что системы, рассматриваемые в дальнейшем при исследовании задач оценки, являются ролностью наблюдаемыми,

63

2-6. УПРАВЛЯЕМОСТЬ В НЕПРЕРЫВНЫХ И ДИСКРЕТНЫХ ЛИНЕЙНЫХ С И С Т Е М А Х [Л. 2-7—2-15]

Непрерывные линейные системы

Рассмотрим непрерывную линейную систему

x^F(t)x

+ C(t)u(t)

(2-58)

для

t^-to,

где начальное состояние

x(to) известно,

но

управление

u(t) пока не определено.

Здесь

исследуется

задача изменения

состояния

системы

(2-58)

от х (t0)

до

некоторого

требуемого

конечного состояния

x(ti)

—х1,

где

ti ограничено.

После

введения

новых

 

координат

y(t)=x(t)—X*

задачу

можно сформулировать

как зада­

чу перехода от некоторого x(to) в начало координат за

конечное

время.

 

 

 

 

 

 

 

 

 

 

 

Введем следующее

определение.

 

 

 

 

 

Непрерывная

линейная

система

(2-58)

 

называется

управляемой

в

момент

t0,

если

 

существует

 

кусочно-не­

прерывная

функция

управления

 

и(і),

зависящая

от x(t0)

и определенная

на

некотором

конечном

интервале

вре­

мени

U^t^U,

для

которой x(ti)=0.

Если

это справед­

ливо для всех x(t0)

и для

всех

to, то система

называется

полностью

 

управляемой.

 

 

 

 

 

 

 

 

Необходимое

и

достаточное

условие

управляемости

дает следующая

теорема.

 

 

 

 

 

 

 

 

Теорема 2-3. Непрерывная

 

линейная

система

(2-58)

является

полностью

управляемой

тогда

и

только

тогда,

когда

симметрическая

матрица

 

размера

пХп

 

 

 

 

Wc

{ta, Q=

'( Ф (С t) С (t) С (t) Ф' (ta, t) dt

(2-59)

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

положительно

определена

для

 

некоторого

ti>t0.

 

До к а з а т е л ь с т в о

;Достаточность. Из уравнения (2-39) для t—t-, имеем:

X (*,) = Ф , g X (О + j Ф & , х) С (х) и (х) dz. (2-60)

to

Пусть

и (х) = - С (х) Ф' х) (*„ g X (Q

(2-61)

64

для tü^t^ti.

Тогда, подставляя

в уравнение

(2-60)

уравнение (2-61), получаем:

 

 

Г'і

 

{x)<b'{t0,x)dx К

 

 

^Ф(і„х)С(х)С

Ѵо> '»)•*('.)•

(2-6 2 )

jo

 

 

 

 

В силу уравнения

(2-22)

 

 

 

Ф{и,

Т ) = Ф ( * 1 , ^о)Ф(А), т )

 

для всех t0. Следовательно, интеграл в уравнении (2-62)

принимает

вид

 

 

 

 

 

 

 

 

 

 

 

Ф

Q

\ Ф (t0,

т) с

(т) с

(х) Ф' (/„, т) л

= Ф

(f„ g

w,

 

{t0:t,),

откуда следует

соотношение

 

 

 

 

 

 

 

X

(t,) =

Ф(*„ f0) л (g -

Ф (г„ g irc

(/0, t,) w~]

(t0,

tt)

X

(t0),

приводящее к x(t\)

= 0.

 

 

 

 

 

 

 

 

 

 

Следовательно, система является полностью управ­

ляемой, если матрица Wc(to, ti) положительно

определе­

на для

некоторого конечного ti>ta.

 

 

 

 

 

 

 

Необходимость.

Предположим

теперь,

что

система

управляема, но для некоторого х(іо)¥=0

справедливо со­

отношение

 

x'{U)Wc{U,

U)x{U)=Q.

 

 

 

(2-63)

 

Обозначим

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и*(і)=—С'(і)Ф'(і0,

 

t)x(to)

 

 

 

(2-64)

для to^t^ti.

Тогда

 

 

 

 

 

 

 

 

 

 

u*'(t)u*(t)=x'(t0)<b(t0,

 

*)С(/)С'(/)Ф'(/ 0 ,

 

t)x{t0).

 

Интегрируя

последнее

равенство

в пределах

от

U до

ti и используя определение Wc(to,

ti)

и уравнение

(2-63),

получим:

 

 

t,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

§и*'

(t)u*(t)dt

=

 

 

 

 

 

 

 

 

 

 

to

 

 

 

 

 

 

 

 

 

 

 

= х'

(Q

f Ф (f..

0 С (t) С (0

Ф' (*0 ,0

dt

\х (t0)

=

 

 

 

 

= X ( ' , ) W r c ( ^ O J C ( / . ) = 0 .

 

 

 

(2-65)

5-85

Но матрицы C(t) и Ф0, т) в уравнении (2-64) яв­ ляются непрерывными функциями времени и, следовттельно, управление u*(t) также непрерывно. Поэтому из уравнения (2-65) следует, что « * ( / ) = 0 для всех / на ин­

тервале to^t^ti.

Поскольку система полностью управляема, должно существовать управление u(t), для которого x(ti) =0. В этом случае уравнение (2-60) примет вид:

 

Ф • Q * Со) = - ]

Ф С .

С (х) « (г) dz,

 

или, что то же самое,

h

 

 

 

 

 

 

 

 

 

 

 

 

*('„) = -

J Ф('о.*)С (т) « (т)

tfx.

(2-66)

Теперь из уравнений

(2-66) и (2-64)

получим:

 

 

X ' (g л (t0) = -

X ' (g f Ф

т) с (х)u

(х) л =

 

 

 

 

 

to

 

 

 

 

 

*i

 

 

tl

 

 

 

 

=

~ J X' (ta)

Ф (f 0 , x) С (x) « (x) dz=

' Ы*' (x) u (x) dx .

 

Это означает, что x'(t0)x(tQ)

=0, так как и*(^)=0 для

to^t^ti.

Отсюда

следует, что д:(/0 )=0,

а это противо­

речит исходному

предположению

х(и)фи.

Теорема до­

казана.

 

 

 

 

 

 

 

 

Для

стационарной непрерывной линейной системы из­

вестно следствие, которое приводится здесь без доказа­

тельства.

 

 

 

 

 

 

Следствие 2-3. Стационарная

непрерывная

 

линейная

система x = Fx + Cu\

t^O

является

полностью

управляе­

мой тогда и только

тогда,

когда матрица размера

пХпг

имеет ранг

п.

IIС

FC...Fn-iC\\

 

 

 

 

 

 

 

Пример

2-6. В примере 2-2 уравнения системы были

 

записаны

с помощью двух разных наборов переменных состояния. Матрицы системы имели вид

0

1

0

0

F = 0

f,

ft

; c =

0

о /,

h

 

с

66

в первой формулировке и

 

 

 

0

1

0

0

0

0

1 • с =

0

0

ь

а

с

во второй.

Для первой формулировки получим матрицу управляемости

 

О

0

f,c

С FC F*C

О

f,c

(f,fs + f2f4)c

 

с

f*c

(f,f, + $ с

с рангом, равным трем, если ігС—КмІІЬфО. Для второй формули-ров

ки матрица управляемости

 

 

О

0

с

 

 

С FC F*C II =

О с

ас

 

 

 

с

ас

be - j - а2 с

 

также имеет

ранг, равный трем,

если

с=К;,/Л.Ф0

(напомним, что

в примере 2-2

в первой формулировке

c = l / L , а во второй C—KM/JL,).

На этом примере видно, что управляемость является свойством динамической системы, а не конкретной си­ стемы координат, в которой представлена эта система (управляемость не зависит от выбора переменных со­ стояния). Можно показать, что это справедливо для уп­ равляемости и наблюдаемости в общем случае.

Дискретные линейные системы

В заключение рассмотрим вопрос об управляемости для дискретной линейной системы вида

x(k+l)=<D(k+l,

k)x(k)+y¥(k+\,

k)u(k),

(2-67)

где k = 0, 1,...; начальное состояние

х(0) предполагает­

ся известным, а остальные обозначения были описаны ранее.

Аналогично определению управляемости для непре­

рывных

линейных

систем

введем

следующее опреде­

ление.

 

 

 

 

 

 

 

 

Дискретная

линейная

система

(2-67)

называется

уп­

равляемой

в момент времени

& = 0 (соответствующий

на­

чальному

времени

to), если

существует управляющая

по­

следовательность

{и(0),

и(\),.. .,u(N1)},

зависящая

от

5*

67

х(0) и

начального

времени,

для

которой

x(N)=0,

где

N

конечно.

Если это справедливо

для

любого х(0)

и

для

любого

начального

времени,

то система называется

пол­

ностью

управляемой.

 

 

 

 

 

 

Докажем следующую теорему.

 

 

 

 

Теорема 2-4. Дискретная

линейная

система (2-67)

яв­

ляется

полностью

управляемой

тогда и

только

тогда,

когда

симметрическая

матрица

размера

пХп

 

 

 

N

 

 

 

 

 

 

Wd

(О, ^ ) =

}]Ф(О,

О 47(і,

і - 1)Щі,

І-1)Ф' (О, 0 (2-68)

положительно

определена

для

некоторого

конечного

/Ѵ>0,

где

 

 

 

 

 

 

 

Ф(0, О = Ф ( 0 , 1)ф(1, 2)

. . . Ф ( і — 1 ,

і);

і = 1 ,

2,...,N.

Д о к а з а т е л ь с т в о .

Достаточность. Используя уравнение (2-67), можно показать, что

 

 

 

 

 

 

N

 

 

 

 

 

 

 

х(М) = Ф (N, 0) je (0) +

£

Ф (N, t) 47 (/,

/ _

1) и (і - 1 ) ,

(2-69)

где

Ф(УѴ, i)=0(N,

N— 1) . . . Ф ( / + 1 ,

i),

i=N—

1,..., 1,

0.

 

Теперь

пусть

 

 

 

 

 

 

 

 

 

u(î-l)

=

-W

(i, i -

1) Ф' (0, i) W~l

(О, N) x (0)

(2-70)

для

 

i=\,...,N.

Подставляя уравнение (2-70)

в уравне­

ние

 

(2-69),

получаем:

 

 

 

 

 

 

 

 

 

 

 

 

 

x (N) =

Ф (N, 0) je (0)

-

 

 

 

 

- S

Ф;(^Ѵ,

О T (І, І - 1) T '

(i, f -

1) Ф'

(0, î) W-x

(О, N)

x (0).

 

Но Ф(ІѴ,

і ) = Ф ( Л / ,

0)Ф(0,

i) для

любого

начального

времени. Следовательно,

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x (N) =

Ф {N,

0) x (0) -

Ф (УѴ, 0) X Ф (0, i) W (i, i

-

 

- 1) 47' (f, i -

1) Ф' (0, i) [UT-1 (О, ЛО (0)] =

Ф (/V, 0) x (0)

-

 

 

 

-

Ф {N, 0) r d

(О, N) ИГ"1 (О, УѴ) je (Ü),

 

 

 

68

откуда ясно, что x(N)=ö. Поэтому система является полностью управляемой, если матрица Wd(0, N) положи­ тельно определена для HeKOTqporo конечного JV>0.

Необходимость. Доказательство необходимости остав­ лено читателю в качестве упражнения, поскольку за ис­ ключением несущественных подробностей оно повто­ ряет доказательство для непрерывных линейных систем.

Для стационарных систем справедлив следующий ре­

зультат.

 

 

 

 

 

 

 

 

 

Следствие 2-4. Стационарная

 

дискретная

линейная

система x(k+1) =Флг(&)+Чг и(А),

k—Ô,

1, ...

является

полностью

управляемой

тогда

и

только

тогда,

когда

матрица размера

пХпг

 

 

 

 

 

 

 

имеет ранг

п.

WW ФУ...

<№-»Щ

 

 

 

 

 

 

 

 

 

 

 

 

Пример 2-7. Для стационарной дискретной линейной системы

второго

порядка из примера

2-4

 

 

 

 

 

 

 

 

Ф

1

т

[

1/267

 

 

 

 

 

 

=

1 ; ч?

= 1

ьт

 

 

 

 

откуда

ясно, что

0

 

 

 

 

 

1/267"«

3/26 Л

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

67

 

67

 

 

 

 

Очевидно, что эта матрица имеет ранг, равный 2

для

7>0

и

6=И=0.

 

 

 

 

 

 

 

 

 

 

Вполне очевидно подобие между теоремами

2-1 и 2-2

о наблюдаемости

с одной стороны

и теоремами

2-3

и

2-4

об управляемости с другой. Например, теорему 2-3 фор­ мально можно получить из теоремы 2-1, проделав в по­ следней следующие замены:

Наблюдаемость -* Управляемость

 

 

Ф(і,

г 0 ) - +Ф'('„ .

0

 

 

 

н

(t) -» с

 

 

 

Аналогичная ситуация наблюдается также для тео-

ірем 2-2 и 2-4 и соответствующих следствий.

 

Это свойство

было

впервые

замечено Калманом

[Л. 2-7], который назвал

его дуальностью.

Итак,

наблю­

даемость и управляемость являются дуальными

свойст­

вами линейных

систем.

Исследование

многочисленных

приложений понятия дуальности выходит за рамки на­ стоящей книги и в дальнейшем этот вопрос не будет

69

Соседние файлы в папке книги из ГПНТБ