
книги из ГПНТБ / Живоглядов, В. П. Адаптация в автоматизированных системах управления технологическими процессами
.pdfКогда информационные координаты марковские, они удов- -летворяют рекуррентному соотношению
mi = /n [s]= /7(m[s—1],tt’[s],y[s]), |
(1- 66^ |
причем т0 определяется по Ро(р). В общем случае
wi[s] = /n*(a[s],y [/c,s]).
-Оптимальное управление u*[i] ищем в классе регулярных не рандомизированных стратегий:
u*[i]=u*(i,mi-1). |
(1- 67) |
Задача синтеза формулируется следующим образом. Требу ется найти такую последовательность! w*[s] ) управляющих воздействий, чтобы функция риска S(o,T) или R(\in) принимала
минимальное значение при ограничениях (1. 59), (1. 66) и, со ответственно, (1. 62), (1. 66). Укажем два частных случая, которые вытекают из этой постановки задачи.
I. Пусть помеха h очень велика, либо в системе отсутству ет обратная связь, т. е. накапливать информацию нельзя и управление осуществляется по априорной информации, содер
жащейся в Я0(р)- |
t= 1, |
..., п. Задача сводится |
|
Из (1. 66) |
получаем /п /= m 0, |
||
к синтезу оптимальной в среднем |
управляющей прог |
||
раммы [1. 15] |
|
|
|
|
u*[L] = u*(i,m0)=Fi{i,PQ(v.)). |
||
II. Пусть |
Я0(р )= 6 (р —ц*), |
где |
б — дельта-функция, |
р* — истинное значение вектора параметра р. Приходим к задаче детерминированного управления [В. 29—В. 30].
Обозначим R* значение риска R при оптимальном управлении. Для нахождения алгоритма управления восполь зуемся методом динамического программирования. Оптималь ные управляющие воздействия u*[s]=u* (s, m s—i ) опреде ляются из функционального уравнения
min [rs+ M {/?*(Sfn)(m,) | u[s]€£y«)
l
min
Q i |J-) k=0
'60
+ |
R*(s,n)(ms)P(MS I OTs_i)dQ , |
(1. |
68).. |
Q ( l) |
|
|
|
причем^(Л7г)*= 0. |
Аналогичное уравнение |
получаем |
для, |
S*(ts~At,T). |
|
|
|
Если известен вид (Pftj. | /ws_i), P(ms | ms- 1), W7,^, то принципиально можно последовательно определить все управления u.*(s,ms-i), начиная с последнего такта и кончая u(s=1, Р0(р.)). Укажем последовательность операций для, получения P(ix | /л,).
1- |
Используя уравнения объекта, находим Р(У /| ц,«[/])-. |
2- |
Вычисляем Р/(|а) по формуле |
P(V- I /n,-t)P(yf 1|*,ц[/])
P /(!x)=P(li |тн ,и [1'],У ,) =
Р(р. | wz-_i) Р(У/)ц, и [s])dQ
Q(h-)
(1. 69)..
3- Представляем Р/(ц) в виде
PiM = P(v- I т ()Р2(лг/_,,У[г],и[/]).
Из последнего соотношения выводится уравнение (1. 66). Условную плотность P(ms \ ms^i) в выражении (1. 68) находим по уравнению (1. 66) с учетом соотношения
Р(У5 | m,-i,«[s]) = J p (y , | w [ s ] ) P b I ms_i)dQ. |
(1. 70> |
Вотдельных задачах (например, для нейтральных систем,
сзапаздыванием) уравнение (1. 68)существенно упрощается,, и оптимальные управляющие воздействия находятся из ус ловия минимума только функций удельного риска rs .
Заметим, что в общем случае в системах с запаздыванием и распределенными параметрами информационные координаты не обладают свойством марковости, что существенно услож
няет вычисления. В частности, при наличии различных запаз дываний в параллельных каналах измерения с гауссовыми
61
помехами достаточные статистики являются немарковскими. Однако и для таких систем иногда могут быть предложены рекуррентные процедуры вычисления информационных коор динат.
Изложенные общие методы синтеза применены в нижесле дующих подразделах для нахождения точных аналитических решений нескольких более частных задач оптимального дур ального управления.
1. 3. ДУАЛЬНОЕ УПРАВЛЕНИЕ РАСПРЕДЕЛЕННЫМ ОБЪЕКТОМ ПЕРВОГО ПОРЯДКА (ОБЪЕКТОМ С ЗАПАЗДЫВАНИЕМ)
Запаздывание в распределенных объектах |
определяется |
||||||
временем, необходимым для перемещения |
обрабатываемого |
||||||
материала (среды и т. д.) |
из |
одной пространственной точки |
|||||
в другую, т. е. из точки, |
где прикладывается |
управляющее |
|||||
воздействие, к месту установки датчика. |
|
(см. |
подраздел |
||||
Пусть объект описывается |
уравнением |
||||||
В. 2. 1) |
|
|
|
|
|
|
|
|
|
|
|
|
|
(1. |
71) |
•с граничным условием |
|
|
|
|
|
|
|
<?(0,Jf)=/[“(0.1‘] - f ( 0 |
|
|
|
(1. |
72) |
||
и некоторыми начальными условиями. |
Здесь / |
непрерывная |
|||||
монотонная функция u(t) |
и |
р; |
— |
выход |
объекта; |
q(x, t) — функция текущего состояния объекта; u(t) — уп равление, р — возмущение (.случайная-величина); v характе ризует скорость перемещения материала. В устройствах, изме
ряющих выходной сигнал, действуют |
случайные помехи h |
|
с независимыми значениями. |
|
|
Решение уравнения (1. 71) при О |
— имеет вид |
|
<7(*,0= f(t—**)> |
(1. |
73) |
q(i-H>t)—f(t тя) 1 |
(1. |
74) |
тде |
|
|
<62
В качестве второго примера рассмотрим трубчатый реак тор для непрерывного процесса, в котором протекает необ
ратимая |
реакция |
первого порядка |
Математическая |
|||
модель |
реактора |
задана |
уравнениями |
|
|
|
|
|
<?<7а ■ |
ддА |
_ |
|
|
|
|
dt |
дх |
k'qx , |
|
|
|
|
|
(1. |
75) |
||
|
|
|
|
|
||
|
qt |
дх _= k 'q\ , |
/> 0, |
/н> * > 0 |
|
с нулевыми начальными и следующими граничными уело виями:
qA (0 ,о = Д О = /И * М .
где k' — константа, характеризующая скорость реакции; v — скорость движения веществ (м/сек)-,
«7л»<7/?— соответственно концентрации (моль/м3) веществ.
Управление процессом осуществляется изменением кон центрации вещества А на входе в реактор, выходом объекта считаем значение q%(/н>0= |7(0 в точке х=1и-
Получим передаточную функцию объекта
qг>(х,р) |
v x |
)е |
Р v |
(1.76) |
Ф(*.Р)= fip) |
= ( l - g |
• |
||
Переходя к реальному времени, находим |
|
|
||
qR {*<0 = 0 —« |
v )Ш- ~ |
)- |
|
О- 77) |
<?(0=<7r ( U ) = ( i - / |
|
|
|
0- 78) |
Для дискретной по х и t системы имеем |
|
|
|
|
q[l,s] = KJ[s—-c], т=тн/Д/. |
|
(1. 79) |
63
При k'-^oo уравнение (1. 78) переходит в уравнение |
звена |
с чистым запаздыванием |
|
— тн)- |
(1. 80) |
Сформулируем задачу следующим образом.
Требуется осуществить синтез управляющего устройства (УУ), которое, измеряя состояние объекта в одной выходной точке (х = /н) или по длине объекта, вырабатывало бы управ ляющие воздействия, обеспечивающие минимум функции риска.
1.3. 1. Управление линейным объектом при наличии аддитивных гауссовых помех
Пусть в уравнении (1. 79) |
|
f[s] = !(u[s],v.) = f1(u[s},s)+\>., |
(1. 81) |
y[s]=<?[s]-b/i[s], s = 1,2, |
|
где f — взаимнооднозначная функция; р — случайный параметр;
h[s] — помеха с независимыми значениями.
Законы распределения р и /фз] — нормальные с нулевыми математическими ожиданиями и дисперсиями о2 р и ^ с о о т
ветственно. Ограничение на управляющее воздействие и от сутствует.
Здесь мы приведем алгоритмы управления в дискретном и непрерывном времени для f\ = u и различных квадратичных функций потерь W.
а) Пусть функция потерь имеет вид |
|
^ + х = ( ^ - ф + - ] ) г= ( ^ - ^ - ^ И ) 2. |
(1. 82) |
Учтем, что для объекта с чистым запаздыванием от u[.s] за висит только удельный риск и не зависят риски Rj при
j=£s-\-~. М ожно показать, что система является приводимой и
нейтральной, |
стратегия регулярная. Функцию |
получаем |
из формулы |
(1. 15) |
|
|
0 0 |
|
|
—со |
|
64

J _ Y |
m - K 0r - K o u v - ' ] y } ^ . |
|
Оптимальные управляющие воздействия ti*[s] находим, на
чиная с последнего, |
из условия минимума функции |
При |
этом убеждаемся, |
что j -f*s+1cfQ(;y[s]) не зависит от .«[«]. |
Следовательно, для вычисления £<*|s] достаточно минимизи ровать функцию по as |_T . Алгоритм оптимального управле
ния сохраняет свою форму для различных s и имеет вид
“*[«]= |
^ уМ - Ф '- Ф |
где |
:(1. 83') |
|
В формуле (1. 83) m[s—1] представляет собой текущую оцен ку параметра р, условное математическое ожидание р.
Полученный результат можно распространить достаточно просто на случай непрерывной системы [В. 15, В. 16]. Путем предельного перехода можно получить представление уцравлений в виде функционалов при условии, что предел сущест вует в данной задаче. Последнее условие 'Выполняется и ал* горитм управления имеет вид
t
;(1. 84)
о
Я *(0= jQ 4*(t)-m [t)4
где
б 22-17 |
« 5 |
Рис. 1.4
спектральная плотность белого шума h(l). Оптимальная оценка т возмущения ц получается на выходе фильтра, с переменными параметрами [1. 15], причем опти мальный фильтр можно описать следующим уравнением:
= —a(t)m + о(/)[ |
т„)]. |
(1. 85) |
Структура управляющего устройства в непрерывной системе показана на рис. 1. 4. Приняты обозначения: О — объект, Ф — фильтр, М — модель объекта, J — интегратор, (—1) — инвертор, a(t) — усилитель с переменным коэффициентом
усиления а(1),.П — усилитель с коэффициентом усиления-^. ■''о
Для нелинейного объекта с уравнением (1. 81) П реализует преобразование, обратное Kofi-
б) Рассмотрим задачи управления с более сложными квадратическими критериями. Пусть
Ws+Z=(q*—<7[5+т])2+ с ( ф ] —u[s— I])2.
Введение второго члена в выражение функции потерь связа но со стремлением препятствовать резким изменениям управ ляющих воздействий. Например, для некоторых технологиче
ских |
процессов (в |
частности, для обжиговых вращающихся |
печей |
в цементном производстве) важно обеспечить «ровный |
|
ход». |
Пусть Ко= 1- |
4 |
Для нахождения оптимального u*[s] применим изложен ный в подразделе 1. 2 метод информационных координат, а именно воспользуемся уравнением (1. 68). По формуле
.(1. 69) определяем апостериорную плотность вероятности
|
|
|
* ® - 0 = - т = = = Х |
|
|
|
|
|
|
у 2itDs_i |
|
|
|
|
Х 6 Х Р' 2{ D ^ |
— |
1 ] ) * j . |
|
||
>где |
xs_ i= || ot[s—l],D s_i || т — вектор |
|
достаточных |
|||
|
|
|
статистик; |
|
|
|
лг[в—1]=ЛГ{н- | y[s—1], и [s—"—!])— условное |
апостериор |
|||||
|
|
|
ное |
математическое |
||
|
|
|
ожидание; |
|
||
|
|
|
D s- 1— условная |
дисперсия, |
||
|
|
|
причем |
|
|
|
m[s—l] = m[s—2]+ |
0 ft |
(y [s~ lj —“[s—т—1]—-/n[s—2]), |
|
|||
|
|
|
|
|
|
|
|
|
|
0 _ 2 + « V ; |
|
(1' |
87> |
|
|
|
|
О- M) |
||
т[0],О0=о2р — априорные |
математическое |
|
ожидание |
и |
||
Условную |
дисперсия |
параметра р.. |
вычисляем |
по |
||
плотность |
P(y[s] | Xj-j.afs—т]) |
|||||
-формуле (1. 70) |
|
|
|
|
|
|
|
P(y[s] |
| /n[s—l],£>s_ba[s—т]) = |
|
|
||
|
1 |
|
_ (y[s]~ u[s—-] —m[s— l])2 |
|
||
Y2*{Ds-i+o'd |
exPi |
2(Ds_t+ o2n) |
|
|
Наконец, выписав для-wtts] уравнение, аналогичное (1. 87), мз последнего выражения находим1
1и[8- ,1>3 ^ 1 -ЗД Г,1 “
67
|
|
=ехр — |
В. |
1’ |
|
|
|
|
|
|
|
||
где Bs зависит только от s, а2^ , а2,г. |
|
|
||||
Оптимальные управляющие воздействия |
определяем начи |
|||||
ная |
с последнего u n_ z из уравнения (1. |
68) с учетом |
за |
|||
паздывания в объекте: |
|
|
|
|
||
|
|
R0*= |
min |
[r„+0], |
|
|
|
|
u[n—t] |
|
|
|
|
|
rn= M { W n I U\n—x],/n[/z—x -1 ], Dn_ z_ x }= |
|
||||
|
=(<?*- тп\п—t— 1 ]—u\n—x\)2-\-Dn_x_j |
-\-c{u[ti—xj— |
|
|||
|
|
—u[n—t—l])a. |
|
|
||
Из условия |
dr„ |
|
|
|
|
|
= в получаем |
|
|
||||
и*[п—х] = и[п—х—1 ]-(- |
_! {q*—т[п—х—1]— и\п—х—1J). |
|||||
|
|
1 "т" С |
|
(1. |
89) |
|
|
|
|
|
|
||
Соответствующий этому управлению риск /?0* равен |
|
|||||
Ra*= {q*—m{n—x— \] - u [ ti —x— \ ] y - ~ ^ |
(1. |
90) |
||||
Для |
предпоследнего такта |
имеем |
|
|
||
|
00 |
|
|
|
|
|
Яi |
= j * |
R0*P(m[n—х—1] |
| m[n—i—2])dm\n—x— \] = |
|||
|
z- |
Г1 !'[(?*— |
|
2]—ц[га—x—1])2+ |
91). |
|
|
|
4 4 1 |
|
|
(1, |
|
|
+ c[l](«[ra—■x—1]—u[n—x—2])21Ч-Л/, |
|
||||
где |
|
4 i: |
c |
|
|
|
|
|
|
|
|
||
|
|
1 |
1 + c |
|
|
|
|
|
|
|
|
|
|
68 |
|
|
|
|
|
|
N — константа, не зависящая от я [я—х—1]. Минимизируя Ri по и[я—х—1], находим
и*[я—х— 1 ]= и[п —х—2] Н— 1 + g^ j (д*—т[п—х—2]— |
|
|||
|
—и[п—х—2}). |
(1. |
92) |
|
Продолжая вычисления далее, устанавливаем, |
что /?я_ т_ 5 |
|||
и «[s] при любом |
s имеют |
вид, аналогичный (1- 91) и |
||
(1. 92), т. е. |
|
|
|
|
и*[«] = ф - 1 ] + |
1_1: , г„1 |
- - • о1- ( 7 * - /и[^ -1] |
- “[«—!]), |
|
|
1+с[п—х—s] |
(1. |
93) |
|
|
5=1,2,.--,Я —х |
|||
где |
|
|
||
|
|
|
|
|
■с[п—х—s]= - |
|
(1. |
94) |
|
|
1 + |
1+с[я —X—S—1] |
||
|
|
|
1+ ...
|
|
с[0] |
—с |
|
|
|
1+ |
с |
|
|
|
|
Т+~с |
|
|
|
|
2(n—x—s) раз |
|
|
|
||
При (я—s)-+°о получаем |
|
____ |
|
|
|
с[п—S—х ]^ с[я -х —S — 1 ]—Сое = __ |
|
(1. |
95) |
||
'Структура управляющего |
устройства показана на |
рис. |
1.5, |
||
где Д t— звено задержки |
на |
один такт, |
Ф— дискретный |
||
•фильтр, Т— усилитель с коэффициентом |
---- • |
Из |
схе- |
||
|
|
1 |
1^оо |
|
|
мы (рис. 1.5) легко получить блок-схему системы управле
ния инерционным объектом 6 первого порядка |
с запазды |
ванием. Однако критерий оптимальности при |
этом име |
ет вид |
|
6!)