Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Живоглядов, В. П. Адаптация в автоматизированных системах управления технологическими процессами

.pdf
Скачиваний:
9
Добавлен:
19.10.2023
Размер:
6.85 Mб
Скачать

Когда информационные координаты марковские, они удов- -летворяют рекуррентному соотношению

mi = /n [s]= /7(m[s—1],tt’[s],y[s]),

(1- 66^

причем т0 определяется по Ро(р). В общем случае

wi[s] = /n*(a[s],y [/c,s]).

-Оптимальное управление u*[i] ищем в классе регулярных не­ рандомизированных стратегий:

u*[i]=u*(i,mi-1).

(1- 67)

Задача синтеза формулируется следующим образом. Требу­ ется найти такую последовательность! w*[s] ) управляющих воздействий, чтобы функция риска S(o,T) или R(\in) принимала

минимальное значение при ограничениях (1. 59), (1. 66) и, со­ ответственно, (1. 62), (1. 66). Укажем два частных случая, которые вытекают из этой постановки задачи.

I. Пусть помеха h очень велика, либо в системе отсутству­ ет обратная связь, т. е. накапливать информацию нельзя и управление осуществляется по априорной информации, содер­

жащейся в Я0(р)-

t= 1,

..., п. Задача сводится

Из (1. 66)

получаем /п /= m 0,

к синтезу оптимальной в среднем

управляющей прог­

раммы [1. 15]

 

 

 

 

u*[L] = u*(i,m0)=Fi{i,PQ(v.)).

II. Пусть

Я0(р )= 6 (р —ц*),

где

б — дельта-функция,

р* — истинное значение вектора параметра р. Приходим к задаче детерминированного управления [В. 29—В. 30].

Обозначим R* значение риска R при оптимальном управлении. Для нахождения алгоритма управления восполь­ зуемся методом динамического программирования. Оптималь­ ные управляющие воздействия u*[s]=u* (s, m s—i ) опреде­ ляются из функционального уравнения

min [rs+ M {/?*(Sfn)(m,) | u[s]€£y«)

l

min

Q i |J-) k=0

'60

+

R*(s,n)(ms)P(MS I OTs_i)dQ ,

(1.

68)..

Q ( l)

 

 

 

причем^(Л7г)*= 0.

Аналогичное уравнение

получаем

для,

S*(ts~At,T).

 

 

 

Если известен вид (Pftj. | /ws_i), P(ms | ms- 1), W7,^, то принципиально можно последовательно определить все управления u.*(s,ms-i), начиная с последнего такта и кончая u(s=1, Р0(р.)). Укажем последовательность операций для, получения P(ix | /л,).

1-

Используя уравнения объекта, находим Р(У /| ц,«[/])-.

2-

Вычисляем Р/(|а) по формуле

P(V- I /n,-t)P(yf 1|*,ц[/])

P /(!x)=P(li |тн ,и [1'],У ,) =

Р(р. | wz-_i) Р(У/)ц, и [s])dQ

Q(h-)

(1. 69)..

3- Представляем Р/(ц) в виде

PiM = P(v- I т ()Р2(лг/_,,У[г],и[/]).

Из последнего соотношения выводится уравнение (1. 66). Условную плотность P(ms \ ms^i) в выражении (1. 68) находим по уравнению (1. 66) с учетом соотношения

Р(У5 | m,-i,«[s]) = J p (y , | w [ s ] ) P b I ms_i)dQ.

(1. 70>

Вотдельных задачах (например, для нейтральных систем,

сзапаздыванием) уравнение (1. 68)существенно упрощается,, и оптимальные управляющие воздействия находятся из ус­ ловия минимума только функций удельного риска rs .

Заметим, что в общем случае в системах с запаздыванием и распределенными параметрами информационные координаты не обладают свойством марковости, что существенно услож­

няет вычисления. В частности, при наличии различных запаз­ дываний в параллельных каналах измерения с гауссовыми

61

помехами достаточные статистики являются немарковскими. Однако и для таких систем иногда могут быть предложены рекуррентные процедуры вычисления информационных коор­ динат.

Изложенные общие методы синтеза применены в нижесле­ дующих подразделах для нахождения точных аналитических решений нескольких более частных задач оптимального дур­ ального управления.

1. 3. ДУАЛЬНОЕ УПРАВЛЕНИЕ РАСПРЕДЕЛЕННЫМ ОБЪЕКТОМ ПЕРВОГО ПОРЯДКА (ОБЪЕКТОМ С ЗАПАЗДЫВАНИЕМ)

Запаздывание в распределенных объектах

определяется

временем, необходимым для перемещения

обрабатываемого

материала (среды и т. д.)

из

одной пространственной точки

в другую, т. е. из точки,

где прикладывается

управляющее

воздействие, к месту установки датчика.

 

(см.

подраздел

Пусть объект описывается

уравнением

В. 2. 1)

 

 

 

 

 

 

 

 

 

 

 

 

 

(1.

71)

•с граничным условием

 

 

 

 

 

 

 

<?(0,Jf)=/[“(0.1‘] - f ( 0

 

 

 

(1.

72)

и некоторыми начальными условиями.

Здесь /

непрерывная

монотонная функция u(t)

и

р;

выход

объекта;

q(x, t) — функция текущего состояния объекта; u(t) — уп­ равление, р — возмущение (.случайная-величина); v характе­ ризует скорость перемещения материала. В устройствах, изме­

ряющих выходной сигнал, действуют

случайные помехи h

с независимыми значениями.

 

 

Решение уравнения (1. 71) при О

— имеет вид

 

<7(*,0= f(t—**)>

(1.

73)

q(i-H>t)—f(t тя) 1

(1.

74)

тде

 

 

<62

В качестве второго примера рассмотрим трубчатый реак­ тор для непрерывного процесса, в котором протекает необ­

ратимая

реакция

первого порядка

Математическая

модель

реактора

задана

уравнениями

 

 

 

 

<?<7а

ддА

_

 

 

 

 

dt

дх

k'qx ,

 

 

 

 

(1.

75)

 

 

 

 

 

 

qt

дх _= k 'q\ ,

/> 0,

/н> * > 0

 

с нулевыми начальными и следующими граничными уело виями:

qA (0 ,о = Д О = /И * М .

где k' — константа, характеризующая скорость реакции; v — скорость движения веществ (м/сек)-,

«7л»<7/?— соответственно концентрации (моль/м3) веществ.

Управление процессом осуществляется изменением кон­ центрации вещества А на входе в реактор, выходом объекта считаем значение q%(/н>0= |7(0 в точке х=1и-

Получим передаточную функцию объекта

qг>(х,р)

v x

Р v

(1.76)

Ф(*.Р)= fip)

= ( l - g

Переходя к реальному времени, находим

 

 

qR {*<0 = 0 —«

v )Ш- ~

)-

 

О- 77)

<?(0=<7r ( U ) = ( i - /

 

 

 

0- 78)

Для дискретной по х и t системы имеем

 

 

 

q[l,s] = KJ[s—-c], т=тн/Д/.

 

(1. 79)

63

При k'-^oo уравнение (1. 78) переходит в уравнение

звена

с чистым запаздыванием

 

— тн)-

(1. 80)

Сформулируем задачу следующим образом.

Требуется осуществить синтез управляющего устройства (УУ), которое, измеряя состояние объекта в одной выходной точке (х = /н) или по длине объекта, вырабатывало бы управ­ ляющие воздействия, обеспечивающие минимум функции риска.

1.3. 1. Управление линейным объектом при наличии аддитивных гауссовых помех

Пусть в уравнении (1. 79)

 

f[s] = !(u[s],v.) = f1(u[s},s)+\>.,

(1. 81)

y[s]=<?[s]-b/i[s], s = 1,2,

 

где f — взаимнооднозначная функция; р — случайный параметр;

h[s] — помеха с независимыми значениями.

Законы распределения р и /фз] — нормальные с нулевыми математическими ожиданиями и дисперсиями о2 р и ^ с о о т ­

ветственно. Ограничение на управляющее воздействие и от­ сутствует.

Здесь мы приведем алгоритмы управления в дискретном и непрерывном времени для f\ = u и различных квадратичных функций потерь W.

а) Пусть функция потерь имеет вид

 

^ + х = ( ^ - ф + - ] ) г= ( ^ - ^ - ^ И ) 2.

(1. 82)

Учтем, что для объекта с чистым запаздыванием от u[.s] за­ висит только удельный риск и не зависят риски Rj при

j=£s-\-~. М ожно показать, что система является приводимой и

нейтральной,

стратегия регулярная. Функцию

получаем

из формулы

(1. 15)

 

 

0 0

 

 

—со

 

64

J _ Y

m - K 0r - K o u v - ' ] y } ^ .

 

Оптимальные управляющие воздействия ti*[s] находим, на­

чиная с последнего,

из условия минимума функции

При

этом убеждаемся,

что j -f*s+1cfQ(;y[s]) не зависит от .«[«].

Следовательно, для вычисления £<*|s] достаточно минимизи­ ровать функцию по as |_T . Алгоритм оптимального управле­

ния сохраняет свою форму для различных s и имеет вид

“*[«]=

^ уМ - Ф '- Ф

где

:(1. 83')

 

В формуле (1. 83) m[s—1] представляет собой текущую оцен­ ку параметра р, условное математическое ожидание р.

Полученный результат можно распространить достаточно просто на случай непрерывной системы [В. 15, В. 16]. Путем предельного перехода можно получить представление уцравлений в виде функционалов при условии, что предел сущест­ вует в данной задаче. Последнее условие 'Выполняется и ал* горитм управления имеет вид

t

;(1. 84)

о

Я *(0= jQ 4*(t)-m [t)4

где

б 22-17

« 5

Рис. 1.4

спектральная плотность белого шума h(l). Оптимальная оценка т возмущения ц получается на выходе фильтра, с переменными параметрами [1. 15], причем опти­ мальный фильтр можно описать следующим уравнением:

= —a(t)m + о(/)[

т„)].

(1. 85)

Структура управляющего устройства в непрерывной системе показана на рис. 1. 4. Приняты обозначения: О — объект, Ф — фильтр, М — модель объекта, J — интегратор, (—1) — инвертор, a(t) — усилитель с переменным коэффициентом

усиления а(1),.П — усилитель с коэффициентом усиления-^. ■''о

Для нелинейного объекта с уравнением (1. 81) П реализует преобразование, обратное Kofi-

б) Рассмотрим задачи управления с более сложными квадратическими критериями. Пусть

Ws+Z=(q*—<7[5+т])2+ с ( ф ] —u[s— I])2.

Введение второго члена в выражение функции потерь связа­ но со стремлением препятствовать резким изменениям управ­ ляющих воздействий. Например, для некоторых технологиче­

ских

процессов (в

частности, для обжиговых вращающихся

печей

в цементном производстве) важно обеспечить «ровный

ход».

Пусть Ко= 1-

4

Для нахождения оптимального u*[s] применим изложен­ ный в подразделе 1. 2 метод информационных координат, а именно воспользуемся уравнением (1. 68). По формуле

.(1. 69) определяем апостериорную плотность вероятности

 

 

 

* ® - 0 = - т = = = Х

 

 

 

 

 

у 2itDs_i

 

 

 

 

Х 6 Х Р' 2{ D ^

1 ] ) * j .

 

>где

xs_ i= || ot[s—l],D s_i || т — вектор

 

достаточных

 

 

 

статистик;

 

 

лг[в—1]=ЛГ{н- | y[s—1], и [s—"—!])— условное

апостериор­

 

 

 

ное

математическое

 

 

 

ожидание;

 

 

 

 

D s- 1— условная

дисперсия,

 

 

 

причем

 

 

m[s—l] = m[s—2]+

0 ft

(y [s~ lj —“[s—т—1]—-/n[s—2]),

 

 

 

 

 

 

 

 

 

 

0 _ 2 + « V ;

 

(1'

87>

 

 

 

 

О- M)

т[0],О0=о2р — априорные

математическое

 

ожидание

и

Условную

дисперсия

параметра р..

вычисляем

по

плотность

P(y[s] | Xj-j.afs—т])

-формуле (1. 70)

 

 

 

 

 

 

P(y[s]

| /n[s—l],£>s_ba[s—т]) =

 

 

 

1

 

_ (y[s]~ u[s—-] —m[s— l])2

 

Y2*{Ds-i+o'd

exPi

2(Ds_t+ o2n)

 

 

Наконец, выписав для-wtts] уравнение, аналогичное (1. 87), мз последнего выражения находим1

1и[8- ,1>3 ^ 1 -ЗД Г,1

67

(/n[s]-m [s— 1])а \

 

 

=ехр —

В.

1’

 

 

 

 

 

 

 

где Bs зависит только от s, а2^ , а2,г.

 

 

Оптимальные управляющие воздействия

определяем начи­

ная

с последнего u n_ z из уравнения (1.

68) с учетом

за­

паздывания в объекте:

 

 

 

 

 

 

R0*=

min

[r„+0],

 

 

 

 

u[n—t]

 

 

 

 

rn= M { W n I U\n—x],/n[/z—x -1 ], Dn_ z_ x }=

 

 

=(<?*- тп\пt— 1 ]—u\nx\)2-\-Dn_x_j

-\-c{u[ti—xj—

 

 

 

u[nt—l])a.

 

 

Из условия

dr„

 

 

 

 

= в получаем

 

 

и*[п—х] = и[п—х—1 ]-(-

_! {q*—т[п—х—1]— и\п—х—1J).

 

 

1 "т" С

 

(1.

89)

 

 

 

 

 

Соответствующий этому управлению риск /?0* равен

 

Ra*= {q*—m{n—x— \] - u [ ti —x— \ ] y - ~ ^

(1.

90)

Для

предпоследнего такта

имеем

 

 

 

00

 

 

 

 

Яi

= j *

R0*P(m[n—х—1]

| m[n—i—2])dm\n—x— \] =

 

z-

Г1 !'[(?*—

 

2]—ц[га—x—1])2+

91).

 

 

4 4 1

 

 

(1,

 

+ c[l](«[ra—■x—1]—u[n—x—2])21Ч-Л/,

 

где

 

4 i:

c

 

 

 

 

 

 

 

 

 

 

1

1 + c

 

 

 

 

 

 

 

 

 

68

 

 

 

 

 

 

N — константа, не зависящая от я [я—х—1]. Минимизируя Ri по и[я—х—1], находим

и*[я—х— 1 ]= и[п —х—2] Н— 1 + g^ j (д*—т[п—х—2]—

 

 

—и[п—х—2}).

(1.

92)

Продолжая вычисления далее, устанавливаем,

что /?я_ т_ 5

и «[s] при любом

s имеют

вид, аналогичный (1- 91) и

(1. 92), т. е.

 

 

 

 

и*[«] = ф - 1 ] +

1_1: , г„1

- - • о1- ( 7 * - /и[^ -1]

- “[«—!]),

 

1+с[п—х—s]

(1.

93)

 

5=1,2,.--,Я —х

где

 

 

 

 

 

 

■с[п—х—s]= -

 

(1.

94)

 

1 +

1+с[я —X—S—1]

 

 

 

1+ ...

 

 

с[0]

—с

 

 

 

1+

с

 

 

 

 

Т+~с

 

 

 

2(n—x—s) раз

 

 

 

При (я—s)-+°о получаем

 

____

 

 

с[п—S—х ]^ с[я -х —S1 ]—Сое = __

 

(1.

95)

'Структура управляющего

устройства показана на

рис.

1.5,

где Д t— звено задержки

на

один такт,

Ф— дискретный

•фильтр, Т— усилитель с коэффициентом

---- •

Из

схе-

 

 

1

1^оо

 

 

мы (рис. 1.5) легко получить блок-схему системы управле­

ния инерционным объектом 6 первого порядка

с запазды­

ванием. Однако критерий оптимальности при

этом име­

ет вид

 

6!)

Соседние файлы в папке книги из ГПНТБ