
книги из ГПНТБ / Медич Д. Статистически оптимальные линейные оценки и управление
.pdfдля k = Ö, 1 . . . В уравнении (2-30) векторы х, w й it имеют такое же число компонент, как и в предыдущем параграфе, и представляют собой соответственно векто ры состояния, возмущения и управления системы. Одна
ко здесь они определены только в дискретные |
моменты |
||||||||||||
времени. |
|
матрицу Ф(к+1, |
k) |
|
|
|
пХп |
переход |
|||||
|
Назовем |
размера |
|||||||||||
ной |
матрицей |
состояния, |
матрицу |
|
Г(&+1, k) |
размера |
|||||||
пХр |
— переходной |
матрицей |
возмущения |
и |
матрицу |
||||||||
4?(k+\, |
k) |
размера |
пХг |
— переходной |
матрицей |
управ |
|||||||
ления. Предположим, что k = 0 |
соответствует |
фиксиро |
|||||||||||
ванному |
начальному |
времени |
|
и начальное |
состояние |
||||||||
х(0) |
известно. |
|
|
|
|
|
|
|
|
|
|
||
|
Последовательность {w(0), |
w(\), |
...} |
называется воз |
|||||||||
мущающей |
последовательностью, |
а |
|
{«(0), ы(1), |
. . . } — |
||||||||
управляющей |
|
последовательностью. |
Зная |
эти две |
после |
||||||||
довательности |
и вектор х(0), |
можно |
с использованием |
||||||||||
уравнения (2-30) вычислить последовательность |
|
состоя |
|||||||||||
ния |
{х(1), |
х(2), |
.. .}. |
|
|
|
|
|
|
|
|
|
|
|
Пока будем полагать, что возмущающая и управляю |
||||||||||||
щая последовательности произвольны. |
|
|
|
||||||||||
|
Допустим, что измерительную систему можно описать |
||||||||||||
уравнением |
(2-2), ыо измерения |
проводятся только в те |
же дискретные моменты времени, в какие определено состояние системы (2-30). Поэтому в качестве модели
системы измерения |
выберем уравнение |
|
|
|
|||||
|
z(k |
+ \)=H(k+l)x(k+\)+v(k+l) |
|
|
(2-31) |
||||
для & = 0, |
1, ... , где z и V — m-векторы, |
а Я — матрица |
|||||||
размера шХп. |
Заметим, что аргумент (&+1) |
в уравне |
|||||||
нии (2-31) можно заменить на k. |
|
|
|
|
|
||||
Последовательность {г(1), |
z(2), |
...} |
называется |
по |
|||||
следовательностью |
измерений |
или |
выходной |
последова |
|||||
тельностью системы, a ( f ( l ) , ѵ(2), |
. . . } называется |
по |
|||||||
следовательностью ошибок измерения. |
|
|
|
||||||
Описание системы вида (2-30), (2-31) называется |
|||||||||
дискретной |
линейной |
системой. |
Структурная |
схема |
мо |
||||
дели приведена на рис. 2-7, где |
(здесь и далее) блок |
БЗ |
соответствует блоку хранения или задержки значения х из предыдущего вычислительного цикла для использова ния его в последующем цикле. Иными словами, после
того как состояние |
x(k) |
вычислено, его следует хранить |
до момента k + l, |
чтобы |
использовать при определении |
x(k+l). |
|
|
50
Наиболее часто такое описание системы встречается при дискретизации непрерывной линейной системы (2-1) и (2-2). Иными словами, модель системы в этом пара графе представляет собой дискретизацию модели преды дущего параграфа. Такая формулировка является есте-
ш(х)
Рис. 2-7. Структурная схема дискретной линейной системы.
ственной, если, например, из соображений экономии измерения проводятся только в дискретные моменты времени. Теперь покажем, что уравнения (2-30) и (2-31) являются дискретными аналогами уравнений (2-1) л (2-2).
Дискретизованная модель
Предположим, что векторы возмущения и управ ления системы (2-1) являются кусочно-постоянными функциями Бремени, причем оба они изменяют свои зна
чения в одни и те же момен |
|
|
||||||
ты времени. |
Далее |
предпо |
|
|
||||
ложим, |
что |
измерения |
про |
г - J |
|
|||
водятся |
в |
те |
же |
моменты |
! |
|
||
времени. |
|
|
|
|
L |
|||
|
|
|
|
-Ц |
1_ |
|||
Компоненты векторов w (і) |
||||||||
|
|
|||||||
и u(t) |
изображены |
на |
рис. |
j |
|
|||
2-8, где специально выде |
|
|||||||
|
|
|||||||
ляется то обстоятельство, |
что |
|
|
|||||
интервалы |
между |
дискрет |
|
|
||||
ными моментами времени не |
|
|
||||||
обязательно |
постоянны. |
|
|
|
Рис. 2-8. Компоненты кусочно-по стоянных функций w(t) и u(t) для дискретизованной модели.
4*
Рассмотрим интервал времени tk^J^.th+i |
для неко |
||||
торого & = 0, |
1, .. . Предположим, что x(tk) |
известно, |
|||
W(t) =W(k) = C O n s t |
И U(t) |
=u(k) |
= C O n s t Д Л Я |
ths^t^tk+l. |
|
Тогда из уравнения |
(2-19) следует, что |
|
|||
|
г- t h + i |
|
u(k). |
(2-32) |
|
|
|
|
|
||
Обозначая |
|
|
|
|
|
|
|
x(tk+1) |
= |
x(ff+4); |
|
|
|
x(tn) = x{k); |
|
||
f |
Ф(^+,. x)G(x)rft = r ( f e + l , fe); |
(2-33) |
|||
|
\
уравнение |
(2-32) |
можно переписать в виде |
|
||
x(k+l)=0(k+l, |
k)x(k)+T(k+l, |
k)w(k) |
+ |
||
|
|
+ ¥ 0 4 - 1 , |
k)u{k) |
|
|
для k = 0, |
1 .. . |
Полученное |
соотношение |
совпадает |
суравнением (2-30).
Вкаждый момент t — th+i, k = 0, 1 .. . уравнение (2-2) принимает вид:
|
z(tk+i) |
= Н (th+i)x(tk+i) |
+v(tk+i), |
|
или, что то же самое, |
|
|
||
|
z{k+l)=H(k+l)x(k+l)+ü(k+l). |
|||
|
Это уравнение |
аналогично |
уравнению (2-31). |
|
|
Заметим, что в последних |
двух равенствах из (2-33) |
||
для |
вычисления |
Г(&+1, |
k) и 4 r (fe+l, k) необходимо |
|
иметь переходную |
матрицу |
состояния в виде, в котором |
||
ее |
первый аргумент является |
постоянным, а второй — |
||
переменным. |
|
|
|
|
52 |
|
|
|
|
Пример 2-4. Применим изложенную методику для получения ди скретной модели стационарной системы второго порядка из приме ра 2-1. Для простоты предположим, что дискретные моменты отсчета отстоят друг от друга на постоянные промежутки времени Т. Тогда k+l соответствует моменту времени (£+1)7", a k— моменту kT.
Так как
О 1
О
то Fn=0 для всех п^2. Следовательно, переходная матрица со стояния
ф(*, |
т) = ф(г — т) = e f ( ' - T ) = |
/ + f |
(г1 |
— *) |
= |
|
1 t — |
|||||
|
О |
1 |
||||||||||
|
|
|
|
|
|
|
|
|
|
|
||
Поэтому |
|
|
|
|
|
|
1 |
Т |
|
|
|
|
|
|
|
ф - (Л+ |
1. |
k) |
= |
|
|
|
|
||
|
|
|
О |
1 |
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
||
Тогда, согласно уравнению (2-33), |
|
|
|
|
|
|
|
|||||
|
|
|
|
|
1 |
+ |
1)7"—т |
|
0 |
dz |
= |
|
|
|
|
|
|
|
|
1 |
|
|
1 |
||
|
|
|
kT |
|
|
|
|
|
|
|
||
|
(k + l)T |
|
|
|
|
|
|
|
|
|
||
|
{k+l)T-z |
|
|
|
1/2 7"г |
|
|
|||||
|
|
|
|
|
|
|
|
|||||
|
kT |
|
|
1 |
|
|
|
|
T |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Аналогично |
|
(k+\)T |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 (k+l) |
T — z |
|
0 |
|
|
|||
|
|
|
|
|
|
dz |
= |
|||||
|
|
|
|
|
0 |
|
1 |
|
1 |
|||
|
|
|
kT |
|
|
|
ь |
|
||||
|
|
|
|
|
|
1/2 ЬТг |
|
|
|
|||
|
= |
bT (k + |
1, |
k) |
= |
|
|
|
||||
|
|
bT |
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
Следовательно, |
динамика |
системы описывается |
уравнением |
|||||||||
x(k+ |
1 |
Т |
|
|
|
1/2 Т2 |
|
|
|
1/267™2 |
||
1): |
|
|
|
|
Т |
|
» ( * ) |
+ |
|
67- |
a(Ä). |
|
|
011 |
|
|
|
|
|
|
|
|
|||
Соответствующее |
уравнение |
модели* измерения |
|
|
|
|||||||
|
Z(k + |
|
1 |
0 |
|
x(k+l)+v(k+l). |
|
|
|
|
||
|
1): |
1 |
|
|
|
|
|
|||||
|
|
|
0 |
|
|
|
|
|
|
|
|
|
Непрерывная |
|
модель |
как предельный |
|
случай |
|||||||
дискретной |
|
модели |
|
|
|
|
|
|
|
|
|
При получении некоторых результатов теории оцен ки и управления в непрерывных линейных системах ока зывается удобным дискретизовать уравнения системы,
53
получить алгоритмы оценки и управления для дискрет ных систем и затем рассматривать предельное поведе ние этих алгоритмов при стремлении к нулю интервала между дискретными моментами времени.
Методика получения дискретной модели из непрерыв ной приведена выше. Теперь составим методику обрат ного перехода. Для этого обозначим дискретные момен
ты времени k и k+l |
через t |
и t+At |
соответственно, |
где |
|||||||||||
Д / > 0 . |
|
|
|
|
|
t) |
|
|
|
|
|
|
|
|
|
Затем, |
разлагая |
Ф(г + Д£, |
в |
ряд |
Тейлора |
по |
степе |
||||||||
ням At, получаем: |
|
|
|
|
|
|
|
|
|
|
|
|
|
||
ФЦ+М, |
t) =<b(t, |
t) + Ô(t, |
t)At |
+ |
|
0(At2), |
|
|
|||||||
где О (At2) |
—матрица |
размера |
пХп, |
все |
элементы кото |
||||||||||
рой имеют порядок |
(At2) |
и выше. |
|
|
|
|
|
|
|
|
|||||
Поскольку Ф(і, |
і ) = / |
и <b(t, t)=F(t)<D(t, |
t), |
имеем: |
|||||||||||
|
<î>(t+At, t)=I |
+ F(t)At |
+ 0(M2). |
|
|
|
(2-34) |
||||||||
Из четвертого равенства в (2-33) ясно, что |
|
|
|
||||||||||||
|
|
t+At |
|
|
|
|
|
|
|
|
|
|
|
|
|
Г(* + Д*. t)= |
|
j* |
Ф(* + |
Д/, z)G(T)dz |
= |
G(t)At |
+ |
0(Af). |
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(2-35) |
|
Аналогично |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
t+м |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
W(t-\-At, |
f)= |
J Ф(* + |
ДЛ х)С(т)Л = |
С(0Д< + |
О(ДО- |
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(2-36) |
|
Заменяя в уравнении (2-30) k |
и k + \ на |
t и t+At |
со |
||||||||||||
ответственно, имеем: |
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
*(/+Д/)=Ф(*+1Д*, |
t)x(t) |
+ |
|
|
|
|
||||||||
|
+ T(t+At, |
t)w(t)+W(t |
|
+ At, |
|
t)u(t). |
|
|
|
||||||
Подставляя |
в это |
соотношение |
уравнения |
(2-34) — |
|||||||||||
(2-36) и группируя члены, получаем: |
|
|
|
|
|
|
|
||||||||
|
x(t+At) |
={I+T(t)At |
|
+ 0(At2)]x(t) |
|
+ |
|
|
|
||||||
|
+{G |
(t) At + O (At2)]w |
(t) +[C(t)At |
|
+ |
|
|
|
|||||||
|
+0(At2)]u(t)=x(t)+F(t)x(t)At+ |
|
|
|
|
|
|
|
|||||||
|
+ G(t)w(t)At |
+ C(t)u(t)At |
|
+ 0 |
(At2). |
|
|
|
54
Перенося x(t) в левую часть уравнения, Деля обе ча
сти на M и переходя к пределу |
при At—>-0, для t^to по |
||
лучаем уравнение |
|
|
|
x = |
F(t)x+G(t)w{t)+C(t)u(t), |
||
совпадающее с уравнением (2-1). Уравнение |
|||
z(t + At) = H(t + At)x(t-{-At) |
+v{t+At) |
||
при At—>-0 принимает |
вид: |
|
|
z(t) |
=H(t)x(t) |
+v(t). |
|
2-4. Н А Б Л Ю Д А Е М О С Т Ь И УПРАВЛЯЕМОСТЬ |
|||
Теперь перейдем |
к рассмотрению |
двух фундамен |
тальных понятий теории линейных систем, тесно связан ных с основными идеями оценки и управления. Эти по
нятия, |
называемые |
наблюдаемостью |
и |
управляемостью, |
|
введены Калманом ,[Л. 2-7, 2-8], работы |
которого яви |
||||
лись |
основой для |
других |
исследований |
(см. также |
|
[Л. 2-9—2-15]). |
|
|
|
|
|
Формулировка и изучение |
понятий |
наблюдаемости и |
управляемости основаны, соответственно, на двух сле дующих вопросах, возникающих из очевидных физиче ских соображений:
1. При каких условиях можно восстановить поведе ние вектора состояния х динамической системы на ко нечном интервале времени, зная поведение вектора изме рения z на том же интервале?
2. При каких условиях можно перевести динамиче скую систему из заданного начального в требуемое ко нечное состояние за ограниченное время с использова нием кусочно-непрерывного управления и?
Перед тем как перейти к подробному обсуждению поставленных вопросов для двух классов линейных си стем, введенных в § 2-2 и 2-3, с помощью нескольких простых схем качественно проиллюстрируем понятия на блюдаемости и управляемости на системе общего вида.
Рассмотрим динамическую систему S с вектором со стояния X, вектором управления и и вектором измере ния z. Предположим, что возмущения и ошибки измере ния отсутствуют и система может быть как дискретной, так и непрерывной.
Вначале допустим, что структурная схема системы имеет вид рис. 2-9, где у — вектор, компонентами кото-
55
рого являются первые k компонент вектора х (хі,.. ,,Хь) или их часть. Из структуры системы ясно, что значения Xh+t, ..., xk нельзя определить, исследуя z, поскольку эти переменные не влияют на хи .. ., Хь. и не включены в z. Следовательно, система является ненаблюдаемой. В то
Рис. 2-9. Схема ненаблюдаемой |
Рис. 2-10. Схема наблюдаемой |
||
управляемой системы. |
неуправляемой системы. |
||
же время, если и воздействует |
на |
все элементы |
х, систе |
ма является управляемой. |
|
|
|
Аналогичным образом система |
на рис. 2-10 |
будет на |
блюдаемой, но неуправляемой, поскольку и воздействует только на переменные хи ..., xk.
Ясно, что системы можно разделить на четыре сле дующие категории: наблюдаемые управляемые, наблю даемые неуправляемые, ненаблюдаемые управляемые и ненаблюдаемые неуправляемые.
2-5. Н А Б Л Ю Д А Е М О С Т Ь В НЕПРЕРЫВНЫХ И ДИСКРЕТНЫХ ЛИНЕЙНЫХ СИСТЕМАХ
Исследуем более подробно понятие наблюдаемости для двух классов линейных систем, введенных выше (см. [Л. 2-7—2-15]). Рассмотрим этот вопрос в предположении, что возмущения системы и ошибки измерения равны нулю, т. е. при идеальных условиях (в этом же предпо ложении в § 2-6 будет рассматриваться понятие управ ляемости) .
Непрерывные линейные системы
Вначале рассмотрим непрерывную линейную си
стему |
|
£ = F(t)x+C(t)u(t); |
(2-37) |
z(t)=H(t)x(t) |
(2-38) |
56
для i^U, где все члены определены в § 2-2. Предполо жим, что «(/) является известной функцией времени для
всех t^t 0 , |
но x(to) неизвестно. |
Пусть |
требуется определить x(t), исследуя z(t) на |
некотором конечном интервале времени \t0, t^\. Очевидно,
если |
матрица |
H (t) |
имеет |
размер |
пХп |
и |
несингулярна |
|||||||
для всех t^to, |
то |
x(t)=H-4t)z(t), |
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|||||
и вопрос о наблюдаемости решается |
тривиально. |
|
||||||||||||
Этот вопрос |
также |
легко |
решается, |
если матрица |
||||||||||
H(t) |
имеет |
размер |
пХп |
и |
несингулярна |
только |
для |
|||||||
одного значения |
t^40, |
|
скажем, для іл. |
Чтобы убедиться |
||||||||||
в этом, вначале |
заметим, что |
|
|
|
|
|
||||||||
|
|
|
|
|
x(ta) |
= |
H-^ta)z(ta). |
|
|
|
||||
Согласно уравнению |
(2-19) |
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
t |
|
|
|
|
|
|
X (0 = |
Ф [t, |
ta) X (t0) |
+ J Ф (t, |
x) С (т) и (х) dz. |
(2-39) |
|||||||
Для |
t = |
ta |
|
|
|
|
|
'о |
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
('.)«('„) |
= |
<">('„. Qx{t0)+ |
|
\Ф{іа, |
x)C(x)a(x)rfx, |
|||||||
откуда |
следует, |
что |
|
|
|
|
|
|
|
|
= Ф & . ОН-Чіа)гѴа)- |
|
| Ф ( / 0 , |
-г)С(т)и (x)Л. (2-40) |
||||||||
|
|
|
|
|
и |
|
|
|
|
|
|
Подстановка |
значения |
x(t0) |
из |
|
уравнения (2-40) |
||||||
в уравнение (2-39) позволяет |
определить x(t) |
для |
всех |
||||||||
t^t 0 , |
поскольку |
и (г) известно |
при |
x^U. |
сингулярна |
||||||
Однако если |
матрица H(t) |
размера |
пХп |
||||||||
для |
всех t^tQ |
ИЛИ если |
H (4) |
имеет |
размер |
тХп |
при |
||||
тф'п, |
то не совсем |
ясно, как можно |
определить х(4) из |
||||||||
z(x), |
U^Lx^ti |
при |
некотором |
конечном |
Это и |
есть |
|||||
вопрос, который |
требуется |
здесь |
исследовать. |
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
$7 |
|
Заметим, |
что в силу |
уравнения |
(2-39) |
состояние |
x(t) |
||||||||
известно для всех |
t^t 0 , |
если |
начальное |
условие |
|
x(t0) |
||||||||
можно определить из измерений. Имея |
это в виду, |
вве |
||||||||||||
дем |
определение |
наблюдаемости |
следующим |
образом. |
||||||||||
|
Непрерывная |
линейная |
система |
(2-37), (2-38) |
|
назы |
||||||||
вается |
наблюдаемой, |
если x(to) |
можно |
определить, |
|
зная |
||||||||
z(t), |
h^.t^ti, |
для |
некоторого |
конечного |
ti. Если |
это |
||||||||
справедливо |
для |
любого |
to, то система |
называется |
|
пол |
||||||||
ностью |
наблюдаемой. |
|
|
|
|
|
|
|
|
|
||||
Необходимое |
и достаточное |
условие |
полной наблю |
|||||||||||
даемости системы дает следующая теорема. |
|
|
|
|||||||||||
Теорема 2-1. Непрерывная |
линейная |
|
система |
(2-37), |
||||||||||
(2-38) является полностью наблюдаемой |
|
тогда |
и |
только |
||||||||||
тогда, |
когда |
симметрическая |
матрица |
размера |
пХп |
|||||||||
|
|
Мс |
О = |
(V (t. Q H' (t) H (t) Ф {t, g dt |
(2-41) |
|||||||||
положительно |
определена |
для |
некоторого |
конечного |
||||||||||
ti>t0. |
|
|
|
|
|
|
|
|
|
|
|
|
|
Д о к а з а т е л ь с т в о . Так как предполагается, что u(t) известно для всех t^t 0 , легко определить воздей ствие управления u{t) на состояние x(t):
t
| Ф ( / , т)С(т)и(і)Л .
Следовательно, достаточно рассмотреть систему вида
x=F{t)x; |
(2-42) |
z(t)=H(t)x(t), |
(2-43) |
где t^t0.
Вначале докажем |
достаточность. Подставляя реше |
||
ние уравнения (2-42) |
|
|
|
х(і)=Ф(і, |
t0)x(t0) |
|
|
в уравнение (2-43), получаем: |
|
|
|
z(t)=H(t)0(t,to)x(to). |
(2-44) |
58
Умножая это уравнение слева |
на Ф'(^, U)H'(t) |
и ин |
|||
тегрируя в пределах от t0 |
до tu получаем: |
|
|
||
(ф'{і, і0)Н'(і)Н(()Ф(і, |
t0)dt |
|
|
||
io |
|
|
|
|
|
= |
fa(t, |
t0)H'{t)z(t)dt. |
|
(2-45) |
|
Если обозначить |
|
|
|
|
|
Me(t0, |
|
(0)Н'{І)Н(І)Ф{І, |
ta)dt, |
|
|
то из (2-45) следует, что |
|
|
|
|
|
x ( g = A T ' |
(f0, g |
JФ' р, |
g я ' (t) z (t) dt, |
(2-46) |
|
|
|
'о |
|
|
|
и система, очевидно, будет полностью наблюдаемой, ес
ли матрица Mc(to, |
ti) положительно |
определена для не |
||||||
которого |
конечного |
|
4>^о. |
|
|
|
||
Чтобы |
доказать |
необходимость, |
предположим, |
что |
||||
система |
полностью |
наблюдаема, но матрица Mc(to, ti) |
не |
|||||
является |
положительно определенной, т. е. для некоторо |
|||||||
го x(t0) фО |
|
|
|
|
|
|
|
|
|
|
|
x'{U)Mc{t0, |
U)x{U)=ü*. |
|
|||
В силу |
(2-45) это означает, что |
|
|
|||||
|
|
*'('.)(*'(*. |
QH'(t)z{t)dt |
= 0. |
|
|||
Подставляя |
в это выражение уравнение (2-44), полу |
|||||||
чаем: |
|
|
|
|
U |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
f z' {t)z(t)dt |
= 0, |
|
|
|
|
|
|
|
h |
|
|
|
откуда z(t)=0 |
для |
|
U^t^ti. |
|
|
|
||
* Случай x'(t0)Mc(to, |
|
ti)x(to)<0 |
исключается в силу определе |
|||||
ния матрицы |
Mc(t0, ti). |
|
|
|
|
59