Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Медич Д. Статистически оптимальные линейные оценки и управление

.pdf
Скачиваний:
70
Добавлен:
25.10.2023
Размер:
13.81 Mб
Скачать

для k = Ö, 1 . . . В уравнении (2-30) векторы х, w й it имеют такое же число компонент, как и в предыдущем параграфе, и представляют собой соответственно векто­ ры состояния, возмущения и управления системы. Одна­

ко здесь они определены только в дискретные

моменты

времени.

 

матрицу Ф(к+1,

k)

 

 

 

пХп

переход­

 

Назовем

размера

ной

матрицей

состояния,

матрицу

 

Г(&+1, k)

размера

пХр

— переходной

матрицей

возмущения

и

матрицу

4?(k+\,

k)

размера

пХг

— переходной

матрицей

управ­

ления. Предположим, что k = 0

соответствует

фиксиро­

ванному

начальному

времени

 

и начальное

состояние

х(0)

известно.

 

 

 

 

 

 

 

 

 

 

 

Последовательность {w(0),

w(\),

...}

называется воз­

мущающей

последовательностью,

а

 

{«(0), ы(1),

. . . } —

управляющей

 

последовательностью.

Зная

эти две

после­

довательности

и вектор х(0),

можно

с использованием

уравнения (2-30) вычислить последовательность

 

состоя­

ния

{х(1),

х(2),

.. .}.

 

 

 

 

 

 

 

 

 

 

Пока будем полагать, что возмущающая и управляю­

щая последовательности произвольны.

 

 

 

 

Допустим, что измерительную систему можно описать

уравнением

(2-2), ыо измерения

проводятся только в те

же дискретные моменты времени, в какие определено состояние системы (2-30). Поэтому в качестве модели

системы измерения

выберем уравнение

 

 

 

 

z(k

+ \)=H(k+l)x(k+\)+v(k+l)

 

 

(2-31)

для & = 0,

1, ... , где z и V — m-векторы,

а Я — матрица

размера шХп.

Заметим, что аргумент (&+1)

в уравне­

нии (2-31) можно заменить на k.

 

 

 

 

 

Последовательность {г(1),

z(2),

...}

называется

по­

следовательностью

измерений

или

выходной

последова­

тельностью системы, a ( f ( l ) , ѵ(2),

. . . } называется

по­

следовательностью ошибок измерения.

 

 

 

Описание системы вида (2-30), (2-31) называется

дискретной

линейной

системой.

Структурная

схема

мо­

дели приведена на рис. 2-7, где

(здесь и далее) блок

БЗ

соответствует блоку хранения или задержки значения х из предыдущего вычислительного цикла для использова­ ния его в последующем цикле. Иными словами, после

того как состояние

x(k)

вычислено, его следует хранить

до момента k + l,

чтобы

использовать при определении

x(k+l).

 

 

50

Наиболее часто такое описание системы встречается при дискретизации непрерывной линейной системы (2-1) и (2-2). Иными словами, модель системы в этом пара­ графе представляет собой дискретизацию модели преды­ дущего параграфа. Такая формулировка является есте-

ш(х)

Рис. 2-7. Структурная схема дискретной линейной системы.

ственной, если, например, из соображений экономии измерения проводятся только в дискретные моменты времени. Теперь покажем, что уравнения (2-30) и (2-31) являются дискретными аналогами уравнений (2-1) л (2-2).

Дискретизованная модель

Предположим, что векторы возмущения и управ­ ления системы (2-1) являются кусочно-постоянными функциями Бремени, причем оба они изменяют свои зна­

чения в одни и те же момен­

 

 

ты времени.

Далее

предпо­

 

 

ложим,

что

измерения

про­

г - J

 

водятся

в

те

же

моменты

!

 

времени.

 

 

 

 

L

 

 

 

 

1_

Компоненты векторов w (і)

 

 

и u(t)

изображены

на

рис.

j

 

2-8, где специально выде­

 

 

 

ляется то обстоятельство,

что

 

 

интервалы

между

дискрет­

 

 

ными моментами времени не

 

 

обязательно

постоянны.

 

 

 

Рис. 2-8. Компоненты кусочно-по­ стоянных функций w(t) и u(t) для дискретизованной модели.

4*

Рассмотрим интервал времени tk^J^.th+i

для неко­

торого & = 0,

1, .. . Предположим, что x(tk)

известно,

W(t) =W(k) = C O n s t

И U(t)

=u(k)

= C O n s t Д Л Я

ths^t^tk+l.

Тогда из уравнения

(2-19) следует, что

 

 

г- t h + i

 

u(k).

(2-32)

 

 

 

 

Обозначая

 

 

 

 

 

 

 

x(tk+1)

=

x(ff+4);

 

 

 

x(tn) = x{k);

 

f

Ф(^+,. x)G(x)rft = r ( f e + l , fe);

(2-33)

 

\

уравнение

(2-32)

можно переписать в виде

 

x(k+l)=0(k+l,

k)x(k)+T(k+l,

k)w(k)

+

 

 

+ ¥ 0 4 - 1 ,

k)u{k)

 

 

для k = 0,

1 .. .

Полученное

соотношение

совпадает

суравнением (2-30).

Вкаждый момент t — th+i, k = 0, 1 .. . уравнение (2-2) принимает вид:

 

z(tk+i)

= Н (th+i)x(tk+i)

+v(tk+i),

или, что то же самое,

 

 

 

z{k+l)=H(k+l)x(k+l)+ü(k+l).

 

Это уравнение

аналогично

уравнению (2-31).

 

Заметим, что в последних

двух равенствах из (2-33)

для

вычисления

Г(&+1,

k) и 4 r (fe+l, k) необходимо

иметь переходную

матрицу

состояния в виде, в котором

ее

первый аргумент является

постоянным, а второй —

переменным.

 

 

 

52

 

 

 

 

Пример 2-4. Применим изложенную методику для получения ди­ скретной модели стационарной системы второго порядка из приме­ ра 2-1. Для простоты предположим, что дискретные моменты отсчета отстоят друг от друга на постоянные промежутки времени Т. Тогда k+l соответствует моменту времени (£+1)7", a k— моменту kT.

Так как

О 1

О

то Fn=0 для всех п^2. Следовательно, переходная матрица со­ стояния

ф(*,

т) = ф(г т) = e f ( ' - T ) =

/ + f

1

— *)

=

 

1 t —

 

О

1

 

 

 

 

 

 

 

 

 

 

 

Поэтому

 

 

 

 

 

 

1

Т

 

 

 

 

 

 

 

ф - (Л+

1.

k)

=

 

 

 

 

 

 

 

О

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Тогда, согласно уравнению (2-33),

 

 

 

 

 

 

 

 

 

 

 

 

1

+

1)7"—т

 

0

dz

=

 

 

 

 

 

 

 

1

 

 

1

 

 

 

kT

 

 

 

 

 

 

 

 

(k + l)T

 

 

 

 

 

 

 

 

 

 

{k+l)T-z

 

 

 

1/2 7"г

 

 

 

 

 

 

 

 

 

 

 

kT

 

 

1

 

 

 

 

T

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Аналогично

 

(k+\)T

 

 

 

 

 

 

 

 

 

 

 

 

 

1 (k+l)

T z

 

0

 

 

 

 

 

 

 

 

dz

=

 

 

 

 

 

0

 

1

 

1

 

 

 

kT

 

 

 

ь

 

 

 

 

 

 

 

1/2 ЬТг

 

 

 

 

=

bT (k +

1,

k)

=

 

 

 

 

 

bT

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Следовательно,

динамика

системы описывается

уравнением

x(k+

1

Т

 

 

 

1/2 Т2

 

 

 

1/267™2

1):

 

 

 

 

Т

 

» ( * )

+

 

67-

a(Ä).

 

011

 

 

 

 

 

 

 

 

Соответствующее

уравнение

модели* измерения

 

 

 

 

Z(k +

 

1

0

 

x(k+l)+v(k+l).

 

 

 

 

 

1):

1

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

Непрерывная

 

модель

как предельный

 

случай

дискретной

 

модели

 

 

 

 

 

 

 

 

 

При получении некоторых результатов теории оцен­ ки и управления в непрерывных линейных системах ока зывается удобным дискретизовать уравнения системы,

53

получить алгоритмы оценки и управления для дискрет­ ных систем и затем рассматривать предельное поведе­ ние этих алгоритмов при стремлении к нулю интервала между дискретными моментами времени.

Методика получения дискретной модели из непрерыв­ ной приведена выше. Теперь составим методику обрат­ ного перехода. Для этого обозначим дискретные момен­

ты времени k и k+l

через t

и t+At

соответственно,

где

Д / > 0 .

 

 

 

 

 

t)

 

 

 

 

 

 

 

 

 

Затем,

разлагая

Ф(г + Д£,

в

ряд

Тейлора

по

степе­

ням At, получаем:

 

 

 

 

 

 

 

 

 

 

 

 

 

ФЦ+М,

t) =<b(t,

t) + Ô(t,

t)At

+

 

0(At2),

 

 

где О (At2)

—матрица

размера

пХп,

все

элементы кото­

рой имеют порядок

(At2)

и выше.

 

 

 

 

 

 

 

 

Поскольку Ф(і,

і ) = /

и <b(t, t)=F(t)<D(t,

t),

имеем:

 

<î>(t+At, t)=I

+ F(t)At

+ 0(M2).

 

 

 

(2-34)

Из четвертого равенства в (2-33) ясно, что

 

 

 

 

 

t+At

 

 

 

 

 

 

 

 

 

 

 

 

 

Г(* + Д*. t)=

 

j*

Ф(* +

Д/, z)G(T)dz

=

G(t)At

+

0(Af).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(2-35)

Аналогично

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t+м

 

 

 

 

 

 

 

 

 

 

 

 

 

W(t-\-At,

f)=

J Ф(* +

ДЛ х)С(т)Л =

С(0Д< +

О(ДО-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(2-36)

Заменяя в уравнении (2-30) k

и k + \ на

t и t+At

со­

ответственно, имеем:

 

 

 

 

 

 

 

 

 

 

 

 

 

*(/+Д/)=Ф(*+1Д*,

t)x(t)

+

 

 

 

 

 

+ T(t+At,

t)w(t)+W(t

 

+ At,

 

t)u(t).

 

 

 

Подставляя

в это

соотношение

уравнения

(2-34) —

(2-36) и группируя члены, получаем:

 

 

 

 

 

 

 

 

x(t+At)

={I+T(t)At

 

+ 0(At2)]x(t)

 

+

 

 

 

 

+{G

(t) At + O (At2)]w

(t) +[C(t)At

 

+

 

 

 

 

+0(At2)]u(t)=x(t)+F(t)x(t)At+

 

 

 

 

 

 

 

 

+ G(t)w(t)At

+ C(t)u(t)At

 

+ 0

(At2).

 

 

 

54

Перенося x(t) в левую часть уравнения, Деля обе ча­

сти на M и переходя к пределу

при At—>-0, для t^to по­

лучаем уравнение

 

 

 

x =

F(t)x+G(t)w{t)+C(t)u(t),

совпадающее с уравнением (2-1). Уравнение

z(t + At) = H(t + At)x(t-{-At)

+v{t+At)

при At—>-0 принимает

вид:

 

 

z(t)

=H(t)x(t)

+v(t).

 

2-4. Н А Б Л Ю Д А Е М О С Т Ь И УПРАВЛЯЕМОСТЬ

Теперь перейдем

к рассмотрению

двух фундамен­

тальных понятий теории линейных систем, тесно связан­ ных с основными идеями оценки и управления. Эти по­

нятия,

называемые

наблюдаемостью

и

управляемостью,

введены Калманом ,[Л. 2-7, 2-8], работы

которого яви­

лись

основой для

других

исследований

(см. также

[Л. 2-9—2-15]).

 

 

 

 

Формулировка и изучение

понятий

наблюдаемости и

управляемости основаны, соответственно, на двух сле­ дующих вопросах, возникающих из очевидных физиче­ ских соображений:

1. При каких условиях можно восстановить поведе­ ние вектора состояния х динамической системы на ко­ нечном интервале времени, зная поведение вектора изме­ рения z на том же интервале?

2. При каких условиях можно перевести динамиче­ скую систему из заданного начального в требуемое ко­ нечное состояние за ограниченное время с использова­ нием кусочно-непрерывного управления и?

Перед тем как перейти к подробному обсуждению поставленных вопросов для двух классов линейных си­ стем, введенных в § 2-2 и 2-3, с помощью нескольких простых схем качественно проиллюстрируем понятия на­ блюдаемости и управляемости на системе общего вида.

Рассмотрим динамическую систему S с вектором со­ стояния X, вектором управления и и вектором измере­ ния z. Предположим, что возмущения и ошибки измере­ ния отсутствуют и система может быть как дискретной, так и непрерывной.

Вначале допустим, что структурная схема системы имеет вид рис. 2-9, где у — вектор, компонентами кото-

55

рого являются первые k компонент вектора х (хі,.. ,,Хь) или их часть. Из структуры системы ясно, что значения Xh+t, ..., xk нельзя определить, исследуя z, поскольку эти переменные не влияют на хи .. ., Хь. и не включены в z. Следовательно, система является ненаблюдаемой. В то

Рис. 2-9. Схема ненаблюдаемой

Рис. 2-10. Схема наблюдаемой

управляемой системы.

неуправляемой системы.

же время, если и воздействует

на

все элементы

х, систе­

ма является управляемой.

 

 

 

Аналогичным образом система

на рис. 2-10

будет на­

блюдаемой, но неуправляемой, поскольку и воздействует только на переменные хи ..., xk.

Ясно, что системы можно разделить на четыре сле­ дующие категории: наблюдаемые управляемые, наблю­ даемые неуправляемые, ненаблюдаемые управляемые и ненаблюдаемые неуправляемые.

2-5. Н А Б Л Ю Д А Е М О С Т Ь В НЕПРЕРЫВНЫХ И ДИСКРЕТНЫХ ЛИНЕЙНЫХ СИСТЕМАХ

Исследуем более подробно понятие наблюдаемости для двух классов линейных систем, введенных выше (см. [Л. 2-7—2-15]). Рассмотрим этот вопрос в предположении, что возмущения системы и ошибки измерения равны нулю, т. е. при идеальных условиях (в этом же предпо­ ложении в § 2-6 будет рассматриваться понятие управ­ ляемости) .

Непрерывные линейные системы

Вначале рассмотрим непрерывную линейную си­

стему

 

£ = F(t)x+C(t)u(t);

(2-37)

z(t)=H(t)x(t)

(2-38)

56

для i^U, где все члены определены в § 2-2. Предполо­ жим, что «(/) является известной функцией времени для

всех t^t 0 ,

но x(to) неизвестно.

Пусть

требуется определить x(t), исследуя z(t) на

некотором конечном интервале времени \t0, t^\. Очевидно,

если

матрица

H (t)

имеет

размер

пХп

и

несингулярна

для всех t^to,

то

x(t)=H-4t)z(t),

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и вопрос о наблюдаемости решается

тривиально.

 

Этот вопрос

также

легко

решается,

если матрица

H(t)

имеет

размер

пХп

и

несингулярна

только

для

одного значения

t^40,

 

скажем, для іл.

Чтобы убедиться

в этом, вначале

заметим, что

 

 

 

 

 

 

 

 

 

 

x(ta)

=

H-^ta)z(ta).

 

 

 

Согласно уравнению

(2-19)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

 

X (0 =

Ф [t,

ta) X (t0)

+ J Ф (t,

x) С (т) и (х) dz.

(2-39)

Для

t =

ta

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

('.)«('„)

=

<">('„. Qx{t0)+

 

\Ф{іа,

x)C(x)a(x)rfx,

откуда

следует,

что

 

 

 

 

 

 

 

 

= Ф & . ОН-Чіа)гѴа)-

 

| Ф ( / 0 ,

-г)С(т)и (x)Л. (2-40)

 

 

 

 

 

и

 

 

 

 

 

 

Подстановка

значения

x(t0)

из

 

уравнения (2-40)

в уравнение (2-39) позволяет

определить x(t)

для

всех

t^t 0 ,

поскольку

и (г) известно

при

x^U.

сингулярна

Однако если

матрица H(t)

размера

пХп

для

всех t^tQ

ИЛИ если

H (4)

имеет

размер

тХп

при

тф'п,

то не совсем

ясно, как можно

определить х(4) из

z(x),

U^Lx^ti

при

некотором

конечном

Это и

есть

вопрос, который

требуется

здесь

исследовать.

 

 

 

 

 

 

 

 

 

 

 

 

 

$7

 

Заметим,

что в силу

уравнения

(2-39)

состояние

x(t)

известно для всех

t^t 0 ,

если

начальное

условие

 

x(t0)

можно определить из измерений. Имея

это в виду,

вве­

дем

определение

наблюдаемости

следующим

образом.

 

Непрерывная

линейная

система

(2-37), (2-38)

 

назы­

вается

наблюдаемой,

если x(to)

можно

определить,

 

зная

z(t),

h^.t^ti,

для

некоторого

конечного

ti. Если

это

справедливо

для

любого

to, то система

называется

 

пол­

ностью

наблюдаемой.

 

 

 

 

 

 

 

 

 

Необходимое

и достаточное

условие

полной наблю­

даемости системы дает следующая теорема.

 

 

 

Теорема 2-1. Непрерывная

линейная

 

система

(2-37),

(2-38) является полностью наблюдаемой

 

тогда

и

только

тогда,

когда

симметрическая

матрица

размера

пХп

 

 

Мс

О =

(V (t. Q H' (t) H (t) Ф {t, g dt

(2-41)

положительно

определена

для

некоторого

конечного

ti>t0.

 

 

 

 

 

 

 

 

 

 

 

 

 

Д о к а з а т е л ь с т в о . Так как предполагается, что u(t) известно для всех t^t 0 , легко определить воздей­ ствие управления u{t) на состояние x(t):

t

| Ф ( / , т)С(т)и(і)Л .

Следовательно, достаточно рассмотреть систему вида

x=F{t)x;

(2-42)

z(t)=H(t)x(t),

(2-43)

где t^t0.

Вначале докажем

достаточность. Подставляя реше­

ние уравнения (2-42)

 

 

 

х(і)=Ф(і,

t0)x(t0)

 

в уравнение (2-43), получаем:

 

 

z(t)=H(t)0(t,to)x(to).

(2-44)

58

Умножая это уравнение слева

на Ф'(^, U)H'(t)

и ин­

тегрируя в пределах от t0

до tu получаем:

 

 

(ф'{і, і0)Н'(і)Н(()Ф(і,

t0)dt

 

 

io

 

 

 

 

 

=

fa(t,

t0)H'{t)z(t)dt.

 

(2-45)

Если обозначить

 

 

 

 

 

Me(t0,

 

(0)Н'{І)Н(І)Ф{І,

ta)dt,

 

то из (2-45) следует, что

 

 

 

 

x ( g = A T '

(f0, g

JФ' р,

g я ' (t) z (t) dt,

(2-46)

 

 

 

 

 

и система, очевидно, будет полностью наблюдаемой, ес­

ли матрица Mc(to,

ti) положительно

определена для не­

которого

конечного

 

4>^о.

 

 

 

Чтобы

доказать

необходимость,

предположим,

что

система

полностью

наблюдаема, но матрица Mc(to, ti)

не

является

положительно определенной, т. е. для некоторо­

го x(t0) фО

 

 

 

 

 

 

 

 

 

 

x'{U)Mc{t0,

U)x{U)=ü*.

 

В силу

(2-45) это означает, что

 

 

 

 

*'('.)(*'(*.

QH'(t)z{t)dt

= 0.

 

Подставляя

в это выражение уравнение (2-44), полу­

чаем:

 

 

 

 

U

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f z' {t)z(t)dt

= 0,

 

 

 

 

 

 

 

h

 

 

 

откуда z(t)=0

для

 

U^t^ti.

 

 

 

* Случай x'(t0)Mc(to,

 

ti)x(to)<0

исключается в силу определе­

ния матрицы

Mc(t0, ti).

 

 

 

 

59

Соседние файлы в папке книги из ГПНТБ