Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Теория автоматического управления

..pdf
Скачиваний:
131
Добавлен:
15.11.2022
Размер:
16.96 Mб
Скачать

конечной (терминальной) ошибки ев (/п), учитываемой с помощью критерия оптимальности вида (11.21).

Обращаем внимание на то, что оптимальные коэффициенты об­ ратных связей в задачах стабилизации не зависят от параметров рассматриваемого случайного возмущения z (/) типа белый шум. Но от этих параметров зависит минимально достижимое при опти­ мальном управлении значение критерия (11.127). Так, если г (() — векторный белый шум, то минимальное значение Q* критерия

(11.127) определяется выражением

Qn = tr (DSzo),

(11.131)

где tr (•) — обозначение следа матрицы, который по определению равен сумме диагональных элементов матрицы, записанной внутри скобок; S z0 — матрица интенсивностей компонент вектора г (/), имеющая размер п х п.

Оптимальная передаточная функция замкнутой системы стаби­

лизации (см. рис. 11.11), связывающая медленные

изменения за­

дания Хв. 3 с ВЫХОДОМ Х в при | = 0 и Кп = 1,

 

Ф (р) = Хв (р)/хв. з (р) = Св (p i— А + ВКо. с)-1 В.

(11.132)

Ей соответствует характеристическое уравнение

 

\ Ы - А + ВКо.с\ = 0.

(11.133)

Так же, как в задачах фильтрации и оценивания (см. 8.6 и 8.7) коэффициенты обратных связей можно определять не по выраже­ ниям (11.129), (11.130), а использовать различные методы модаль­ ного синтеза, с помощью которых коэффициенты обратных связей выбирают таким образом, чтобы придать характеристическому полиному (11.133) замкнутой системы определенные требуемые свойства, например, заранее предписанное расположение ее собст­ венных значений на комплексной плоскости.

Пример 1. Определим для стационарного объекта

ГС'о (Р) = *в (Р)/У (Р) =

kol(T0P + О

 

 

<11Л34)

оптимальное

управление, стабилизирующее скалярный

выход

объекта

Хв (t) = х

(t)

в начале координат хв, 3 = 0 при помощи отрицательной об­

ратной связи

по единственной переменной состояния

(t)

= х (t)

и обеспе­

чивающее

минимум

функционалу

 

 

 

 

 

 

 

 

 

<?п=

Km

f M

( 0 + '»2(0 ]d*’

 

 

(11Л35)

 

К

 

0

 

 

 

 

где qB и г — заданные весовые коэффициенты. Уравнение состояния объекта (11.134) имеет вид

x(t) = ax(t) + by(t) + z(t),

(11Л36)

где а = — 1/Го, b = k j T 0.

Очевидно, что в данном примере А = а, В = Ь, Св = 1, и матричное уравнение Риккати принимает вид

do -|“ od -f“ (JB db bd = 0»

 

 

(11.137)

 

 

 

r

 

 

 

 

 

Положительное решение этого уравнения

 

 

 

d = {ar +

<\/а2г2+

&2<7вГ )/b 2,

 

 

(11.138)

а соответствующий оптимальный коэффициент

обратной связи

 

 

K>.c = r

'bd = (а + V “2 + b^ J r ) l b = ( — 1 + V 1+ % f l J r )/*0 -

 

 

 

 

 

 

 

 

(11.139)

Пример 2. Определим для стационарного объекта

 

 

 

(р) =

*в (Р)/У (Р) = kelp (ТоР + 1)

 

(11.140)

оптимальное управление, стабилизирующее выход объекта хв (t) =

х в, 3 =

0

при

помощи

обратных

связей

по

переменным

состояния х х (t) =

хв (t)

и

х 2 (t)

= х х (/) (см. рис.

11.11, б)

и

обеспечивающее минимум функционалу

(11.135).

Запишем уравнения состояния и выхода объекта и минимизируемый

функционал

в

матричной форме. Очевидно,

что

 

 

 

 

 

 

 

(11.141)

где а =

а 22 =

— 1/Г0;

Ь — 622 = k j T 0.

 

 

Матричное уравнение (11.130) в данном случае принимает вид

dn

dtf

] t: :м: n [i

 

 

[d<Li

do2

 

 

 

 

£

]

z

n i

: * ]■ • [ £

Перемножив матрицы в уравнении (11.142), и учтя, что всегда d12 = d2i* получим равносильную ему систему трех алгебраических уравнений:

Явг

b dyy —0;

“Ь 0^12 ~ 0»

(11.143)

Ь^22 ~г 2rdj2 “Г 20Г^22 = О*

 

С учетом

условий

положительной определенности

матрицы D

dn > 0 и

dnd22 — d2l2> 0

(11.144)

решения

системы (11.143) следующие:

 

du =

V aV + 26/6;

dl2 = du = л/д вг/Ь;

(11.145)

d22 = г {а

V « 2 +

26 V 9 B/T)/62.

 

имеет вид

di2

k*О. сс = — [0 ; Ь ] [ du

гL d2i ^22 .

Соответственно, коэффициенты <

*ас1 =■- bdl2/r У qBlr

 

 

и сигнала х 2 (0

 

 

 

 

*0.02 =

: bd22/r

II &

!

C51

:2 +

 

i

<

+ V o ^ o ) + 2To V<?B r / k 0 .

(11.146)

(11.147)

(11.148)

Если измерение координаты состояния х 2 (t) затруднено, то обратную

связь &o.c2 можно осуществить по оценке х2(t), полученной при помощи оценивающего устройства (см. 8.7).

Следящие системы при полном и точном наблюдении объекта.

Примечательно, что отрицательные обратные связи, определяемые выражениями (11.129) и (11.130), остаются оптимальными и для случая, когда синтезируется следящая система управления объек­ том (11.123), (11.124) по критерию

Qn = lim

(11.149)

l‘ _L [ej (/) q BeB(/) + y T (/) ry (/)] d /,

'к -00

к

J 2

 

 

 

о

 

где 8g (/) = x B(() х в, з (/) — /-мерный вектор отклонений ком­ понент вектора выхода x B(t) от соответствующих компонент век­ тора х в. з (/); х в. з (/) = Св. 3х 3 (0 — /-мерный вектор требуемых значений выходных (управляемых) переменных .*„(/).

Но при этом оптимальное управляющее воздействие у* (/) со­ держит, кроме составляющих, пропорциональных переменным со­ стояния x (i), еще слагаемые, пропорциональные компонентам век­ тора задающего воздействия х 3 (/):

У (0 = К*ПХ3 (/)К о . с* (0 = Уп (0 + У*о. с (0-

О1 ' 15°)

Матричный коэффициент К* определяют по выражениям, ана­

логичным (11.129) и (11.130), но вместо матриц А, By Св используют так называемые расширенные матрицы, получаемые при объеди­ нении уравнений объекта и задающего воздействия. Для этого задающее воздействие х 3 (/), которое в общем случае является стационарным случайным вектором, рассматривают как вектор состояния многомерного формирующего фильтра (на рис. 11.11, а обозначен матричной передаточной функцией W$. з), на входе которого действует стационарный белый шум | с нулевым матема­

тическим ожиданием и известной матрицей-столбцом интенсивно­

стей

т.

е.

 

 

 

 

 

 

 

 

x 3(t) = A 3x 3(t) + l(t),

 

 

 

 

 

 

(11.151)

а вектор требуемых значений выходных

переменных х в. 3 (0 пред­

ставляют

в

форме (11.124):

 

 

 

 

 

 

 

лгв.з (0 =

С,. **„(/).

 

 

 

 

 

 

(11.152)

Теперь можно записать объединенную (расширенную) систему

уравнений состояния объекта

г (() =

0) и задающего фильтра:

 

НJ Loл

\*

if)

1 +

Г в 1 ^ ( о +

Г

 

(11.153)

L - м о

0А з 11\ \ Lx 3(t)

J

L o

J

L

»°

1

 

 

 

 

 

 

 

 

m

\

или

 

 

 

 

 

 

 

 

 

 

x (t) = А х (t) +

By (t) +

 

 

 

 

 

 

(11.154)

 

 

 

c « : ]•

 

 

 

 

 

где х(() == \x{t)\

x 3 (t) ]r — расширенный вектор

состояния.

Соответственно критерий (11.126) принимает для расширенной

системы

(11.154)

следующий вид:

 

 

 

 

 

 

К

 

 

 

 

Qn =

Игл -j— f

[xl (0 qBx B(t) + у т(t) ry (f)]d/ =

 

 

к

 

о

 

 

 

 

= lim —

f —

[л:т (0 Cj q BCBx (t) + y T (t) r y

(*)] d t,

(11.155)

C-*°°

J

2

 

 

 

 

где лгв(t)

= CBx

(t)

= [CB; — CB. 3] x

(t).

(11.155) для рас­

Очевидно,

что задача минимизации

критерия

ширенной системы (11.154) эквивалентна задаче синтеза оптималь­ ной по критерию (11.127) системы стабилизации объекта (11.123), т. е. задача синтеза следящей системы оказалась сведенной к за­ даче стабилизации. Решение задачи (11.154), (11.155) в соответствии

со структурой вектора х (t) находят в виде

у * ( 0 = — K * x (t)=

К*Г

1

(11.156)

 

L Хз (0 J ’

 

где К* = 1К‘0С; — /С*].

 

 

Уравнение Риккати

(11.130)

для расширенных

матриц А, В,

Св распадается на четыре уравнения, и его общее решение также можно рассматривать как расширенную (блочную) матрицу

D =

(11.157)

Входящие в (11.157) простые матрицы находят как решение следующих трех матричных алгебраическихуравнений Риккати:

D nA-\-A Du-{- CBq BCBDn Br lBTDn = 0,

(11.158)

DI2A S-{-[AB f В £>xj] DI2—Св<7вСв.з = 0,

(11.159)

D22A 3~\~ A 3D22Hr ^в. зЯ»Св. з—Г)\2Вг В D ^ — O.

(11.160)

Оптимальный коэффициент обратной связи в расширенной за­ даче

Ко. с = г-1Вт£>11

(11.161)

и определяется уравнением (11.158), в которое входят только па­ раметры объекта управления и критерия оптимальности. В то же время оптимальный коэффициент

K n = — r ~ lBD12

(11.162)

зависит как от параметров объекта и критерия, так и от параметров задающего воздействия.

Пример 3. Синтезируем оптимальную следящую систему управления объектом

(р) = *в (Р)1У (Р) = k0l(T0p + 1),

(11.163)

если случайное задающее воздействие х3 (t) можно рассматривать как выход формирующего фильтра

ГСф.3 (Р) = *3 (р)И (Р) = V2D3a3 Цр + а3),

 

(11.164)

и требуется, чтобы хв (t) = хв. 3

(/) =

х3 (/), т. е. Св. з =

1.

 

Уравнения

состояния

объекта —

 

 

 

х (t) = ах (t) +

by (/),

 

 

 

 

(11.165)

фильтра —

 

 

 

 

 

 

 

 

x3(t) = a3x3(t) + b3l(t),

 

 

 

 

( П . 166)

где а—1/7V,

Ь = k0IT0\

а3 =

—а3,

Ь3 = л/2й3а 3 при

Sg0 =

1

или Ь3 = \

при

S£0 =

2D3a 3.

_

(t)\ х3 (t)\т уравнение

 

Для

расширенного

вектора х (/) =

состояния

 

 

0

 

 

 

 

 

 

(11.167)

 

 

а3 ]x( 0 + [ J ] p (0 + [ ° J ^ W ,

 

 

а критерий

 

 

 

 

 

 

 

 

<?п =

lim —

 

 

 

 

 

 

\ [qB (хв (0 -

хв. 3 (б)2 + гу2 (<)] d t =

 

 

 

‘к+°° tK

b

 

 

 

 

 

 

= ,lim

$

[?» * 2 (0 + r*2 ( 0 1 d '-

 

(11.168)

 

 

 

tK

0

 

 

 

 

 

 

 

где xB(<) = [1; — 1] x (t).

Таким образом, задача синтеза следящей системы оказалась сведенной к задаче синтеза стабилизирующей системы уравнения этим же объектом,

решенной в примере 1.

Оптимальное управляющее воздействие в следящей системе состоит из двух слагаемых:

/ ( 0 = - * а ( 0 - £ с*(0-

 

(11Л69)

Оптимальный коэффициент обратной связи в выражении (11.169) будет

таким же, как в стабилизирующей системе, т. е. (см. пример

1)

*0. с = ( — 1 + V 1 + *°<?в/Г )/*о-

 

(11Л7°)

Согласно (11.159) уравнение для коэффициента d12 имеет вид

di2a3 + [а — Ь г -Ш п ] d12 — qB = 0.

 

(11.171)

Из него получаем

 

 

<*12= “ ^ o /O V la + V 1+ * & / ' ' )

<11Л72)

и соответствующий коэффициент прямой цепи

 

*„ = — bdl2/r = qBk J r ( T 0a3 + ' s j \ + k2Qq J r \

(11.173)

Передаточная функция замкнутой

системы между входом х3 и выхЬдом

*в (О

 

 

Ф (р) = knk0/ ( r 0p + д / l + k20q j r

).

(11.174)

Стабилизирующие и следящие системы при неполном и неточном наблюдении объекта. Перейдем теперь к задачам АКОРдля объектов

с н е п о л н о й и (или) н е т о ч н о й и н ф о р м а ц и е й о текущем состоянии, т. е. для таких объектов, у которых переменные состоя­ ния x ( t ) не поддаются полному и точному наблюдению. В этих случа­ ях для построения замкнутых систем управления вместо сигналов

х (/) используют их оценки х (t), полученные из наблюдаемых пе­ ременных х н (0 при помощи специальных устройств оценивания состояния (УОС) объекта (см. 8.7). Методика АКОР для объектов с неполным и неточным наблюдением состояния основана на так называемом принципе разделения, согласно которому задача син­ теза оптимальной системы управления при неполных и неточных измерениях может быть разделена на две независимые друг от друга задачи — оптимального оценивания состояния объекта управле­

ния и оптимального управления объектом по оценкам x ( t ) f кото­ рые рассматриваются как истинные значения переменных состоя­ ния х (t). Соответственно, оптимальное управляющее устройство в целом должно состоять из последовательно соединенных опти­ мального устройства оценивания и регулятора, оптимального при полных и точных измерениях. Причем, параметры этих двух ча­

стей управляющего

устройства могут быть определены раздельно

и независимо друг

от друга.

Рис. 11.12. Замкнутая система оптимального управления объектом с не­ полным и неточным наблюдением состояния и задающего воздействия:

а — полная структура; 6 — упрощенная структура

Стабилизирующая система управления

объектом с неполными

и неточными

измерениями содержит

устройство

УОС0

(рис. 11.12, а),

которое оценивает состояние объекта. В следящей

системе, в которой х 3 (/) Ф const, кроме

основного устройства

УОС0, требуется еще устройство оценивания состояния задающего

устройства (У0С3). Устройство У0С3 выдает оценку х 3 ((), из ко­ торой блок Кп формирует составляющую у* (t) оптимального уп­

равляющего воздействия.

При анализе динамических свойств систем управления с УОС

полагают

для простоты,

что x(t) да х (/),

и тогда данная схема

(см. рис.

11.12, а) может

быть заменена

другой (рис. 11.12,6).

Для последней схемы основная матричная функция между входом

■*з. н (0 и ВЫХОДОМ Х в

ф (Р) = Св(р1— А + В К о . с)-1 В К п (pI— A s + Кф. зСз. н)'1 Кф. з =

= Ф с ( р ) Д п 1 У ф . з ( р ) ,

( 11Л75)

407

где Фс (р) — матричная передаточная функция контура стабили­ зации; №ф.3(р) — матричная передаточная функция оптимального фильтра, выделяющего полезный сигнал х3; К п — матричный пе­ редаточный коэффициент, формирующий компоненты вектора

Уп (/)■

Весовые коэффициенты, образующие матрицы q и г, подбирают обычно экспериментально — путем моделирования синтезируемой системы на ЭВМ. При этом руководствуются следующими сообра­ жениями. Процессы оценивания и управления в системе стабили­ зации должны протекать приблизительно в одинаковом темпе. Если интенсивность помехи измерения g (/) больше интенсивности возмущения z (/), то процесс оценивания медленный, и чрезмерное быстродействие управляющего устройства будет приводить только к увеличению среднеквадратичного значения воздействия у (t) без уменьшения среднеквадратичного значения ошибки стабилизации ев (t). С другой стороны, и при малой интенсивности помехи изме­ рения, когда устройство оценивания может быть достаточно быстро­ действующим, нецелесообразно большое быстродействие управле­ ния, так как в этом случае критерий будет возрастать из-за соста­ вляющих у (/).

Пример 4. Определим для объекта

W 0 (Р) =

(Р)1У (Р) = Ьо!р (Т0Р + 1),

(11.176)

рассмотренного в примере 2, параметры следящей системы, осуществляющей по схеме, приведенной на рис. 11.12, оптимальное управление в следующих условиях:

1) скалярное воздействие х3 (/) описывается, как и в примере 3, урав­ нением состояния

**(0 = а3*з (0 + 6W,

 

 

 

(11.177)

где а3 = —а3; 5g0 =

2D3 а3 (b3 =

1), но измеряется с помехой g3

(t), имею­

щей интенсивность Sg0l т. е.

 

 

 

 

*з. н(0 = *з ( 0 + £ з ( 0 ;

 

 

 

(П.178)

2) единственная

наблюдаемая

переменная

хн (t) также

представляет

собой сумму переменной состояния х г (/) и помехи g (t):

 

 

*H (0 = *I ( t)+ g (0 -

 

 

 

(11.179)

Требуется, чтобы

управляемая

переменная

хв (t) = х г (t)

с

минималь­

ными по критерию (11.149) потерями следовала за задающим воздействием *з (0. т. е.

хв (0 =

х в. з (0 = хз (0 •

 

(11.1 80)

Из выражений

(11.177)

— (11.180) видно,

что в данном примере

с в = [1;

0];

С„ = [1;

0]; Св. 3 = [1;

0]; С3. н = [1; 0]; (11.181)

Оптимальное устройство оценивания для задающего воздействия вида

(11.177) было определено в примере из 8.6. В обозначениях решаемой задачи уравнение устройства У0С3

(0 = — сс3х3 (/) + рф' з [х 3 н (/) — х3' и (/)],

(11.182)

*ф. 3 = - аз + V a3 + S|o /5go •

(11.183)

Оптимальные коэффициенты обратных связей по оценкам х[ (/) и х 2 (t) выдаваемым устройством УОС0, полностью определяются матрицей D, !’

элементы которой были получены в

примере

2 для

стабилизации объекта

(11.140) [см. (11.145)].

 

 

 

 

Оптимальный коэффициент пропорциональности между сигналами х3 (/)

и Уп (0 согласно

формуле (11.162)

 

 

 

v;

 

 

 

 

 

 

(11.184)

Обозначения

k для элементов матрицы D 12 =

/С12 введены для того,

чтобы отличать их от элементов матрицы D ll9

полученных в примере 2.

Для определения коэффициента kn запишем матричное уравнение вида

(11.159):

 

 

 

 

 

 

К12А3+ [ А -

B r - 'B TD 11]T K n -

CjgBC, , = 0.

 

(11.185)

После перемножения матриц в уравнении (11.185) и решения эквива­

лентной системы скалярных уравнений получим:

 

 

*22 = °;

*21 = ?в/( —*'V /г — «3 + аз л

/ “2 + 26 V 4 J r )

 

 

 

 

 

 

(11.186)

Отсюда искомый коэффициент

 

 

 

 

*п1 = — **21/' = 9в*о//' (,*0

+ “зТо + аз Х

 

X ^ / l

+ 2 k j 0 л/ g j r ).

 

 

 

(11.187)

Согласно (11.175) передаточная функция системы между входом х3.н (t)

и выходом хв (/)

 

 

 

 

 

Ф (р ):

____ £ф. 3____

1/^0. с

 

 

 

Р +

а з + ^ф. 3

,

1 + * 0 * 0 . с2 „

 

 

kokn

Рг Ч

 

р

 

 

 

«о«о. cl

(11.188)

 

 

 

 

 

 

Она включает в себя передаточную функцию устройства У0С3, которое

определяет оптимальную оценку *3 (/) задающего воздействия х3<н (0» иска­ женного помехой g3 (£), и эквивалентно в данном примере инерционному звену первого порядка. Кроме того, общая передаточная функция оптималь­ ной следящей системы содержит масштабирующий коэффициент &пи сящий от параметров задающего воздействия, объекта и от весовых коэффи­

циентов критерия. Основная

часть

синтезируемой системы эквивалентна

в данном случае инерционному

звену

второго порядка.

11.5. Адаптивные системы управления

Адаптивными (или самоприспособляющимися) называют такие системы управления, которые в.условиях непредвиденного измене­ ния свойств управляемого объекта, внешних воздействий или дели управления автоматически изменяют структуру или параметры своего управляющего устройства, обеспечивая при этом необхо­ димое качество управления. Для осуществления адаптации (авто­ матического изменения алгоритма управления) эти системы содер­ жат дополнительное управляющее устройство — устройство адап­ тации, которое по результатам измерений сигналов в главном кон­ туре управления выявляет изменения свойств внешних воздейст­ вий и объекта и производит необходимые изменения в управляю­ щем устройстве.

Показатель качества, по которому осуществляется адаптация, может характеризовать либо работу управляемого объекта, либо функционирование системы в целом.

Необходимость применения адаптивных систем управления возникает в случаях, когда условия функционирования и свойства управляемого объекта изменяются в широких пределах и по за­ ранее неизвестным законам. Объектами с переменными свойствами и условиями функционирования могут быть, например, шахтные подъемные установки, добычные механизмы, шаровые мельницы. В шахтной подъемной установке от цикла к циклу может изме­ няться масса скипа с рудой, у добычного механизма затупляются режущие элементы исполнительного органа, в шаровой мельнице постепенно уменьшается масса мелющих шаров. Как следствие, для этих объектов изменяются передаточный коэффициент и по­ стоянные времени.

Объекты, для которых изменяются собственные параметры и па­ раметры внешних воздействий, называются объектами с неполной информацией.

Неполнота информации об объекте создает неопределенность в постановке задачи управления, и обычные принципы построения системы управления оказываются непригодными или малоэффек­ тивными. Систему приходится строить таким образом, чтобы она в процессе управления сама (автоматически) получала и использо­ вала для выработки управляющих воздействий недостающую ин­ формацию.

Управление, во время которого происходит изучение характе­ ристик объекта, называется дуальным.

Дуальность управления является специфической особенностью адаптивных систем. От обычных систем они отличаются также бо­ лее сложной структурой, возможностью переключений в контуре управления, наличием логического и запоминающего устройств, использованием поисковых воздействий.

Рассмотрим обобщенную функциональную схему адаптивной

410

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]