книги из ГПНТБ / Живоглядов, В. П. Адаптация в автоматизированных системах управления технологическими процессами
.pdf
Поскольку риск г* s |_т инвариантен относительно u[s—1], то
u*[s—1] имеет вид, аналогичный (1. 119), и оптимальное уп равление для любого момента времени определяется форму лой (1. 119). Конкретный вид формул для вычисления инфор мационных координат т и D зависит от статистических ха рактеристик p[s] и h[s]. Например, для независимых и нор мально распределенных /г [s] и p[s] = р,= const (как в подраз деле 1. 3. 1) имеем
|
|
S—1--X |
|
|
ms_i[s] |
|
1 |
q { /+т] |
' |
|
Н10+ S |
«[/1 |
(1. 121) |
|
|
|
|||
|
|
/= 1 |
|
|
|
|
Dя—'2 |
|
|
|
D s—1 |
S |
|
( 1. 122} |
|
1+ ■Qs—а |
|
||
|
|
|
|
|
|
|
°2/г |
|
|
где а2Л , |
, т0— априорные дисперсии |
и математическое |
||
ожидание. |
|
|
|
|
1. 4. ДУАЛЬНОЕ УПРАВЛЕНИЕ
МАРКОВСКИМ РАСПРЕДЕЛЕННЫМ ОБЪЕКТОМ
1.4. 1. Управление по одной выходной точке
Вданном подразделе мы рассмотрим задачу оптималь ного дуального управления, имеющую практическую значи мость для ряда процессов промышленной технологии непре рывных или полунепрерывных производств. Нормированные корреляционные функции р (v) возмущений в таких объектах часто аппроксимируют [1. 18, 1. 19] экспонентами вида
|
—«114 I |
|
|
|
(1. 123) |
|
|
P(v) = e |
. |
|
|
|
|
Пусть требуется |
стабилизировать выходной |
сигнал |
q(t)=> |
|||
= <7д(/н>$ реактора (1. 75) |
при условии, |
что |
/(м,р-)=«+р и |
|||
возмущение р.(/) |
представляет собой |
марковский центриро |
||||
ванный гауссов |
случайный |
процесс |
с |
дисперсией |
о3^ и |
|
80
корреляционной функцией |
в стационарном режиме |
вида |
(1. 123)-Запишем уравнения |
v |
|
объекта для i > |
|
|
qR (x,i)=K0(x) |
i |
|
q{t)=K0[и(/—т„)+ р-(/-тн)1, |
|
|
|
(1. |
124) |
y(t) = q(t)+h(t)
или в дискретном времени:
^[S] ==/<o(M[S— X] +{X[S—х]Х, t =
125)
y[s]=qls] + h[s].
Помеха /z[s]— центрированная гауссова с дисперсией о?Л. Функция потерь имеет вид
V^s=(^*[s] —^[s])a.
Плотность вероятности перехода для р. задана выражением
Л И Л /И /-!]): |
(|a[z]—pix[z—I})2 |
|
2aV ('1 -Р‘ |
|
|
/ 2 * о -р*) ехрГ |
|
|
|
(;1. |
126) |
где р=р( А /).
Рассматриваемая система является приводимой и нейтраль
ной. Оптимальное управляющее |
воздействие w*[s] находим |
из условия минимума функции as |_T. Получаем |
|
а+1 |
|
«*[s] = К ; я* [s+x] —р |
(At) — S + т |
5+т
где
A p-J[Q]-f-
6 |
2247 |
81 |
S— 1— x
+ 2 (h-U'I—PF-ti—ll)sAi-h
i=\
5—1
+ У^у[Л — Kau[i—x] —A^U’—*])2 ) ^[0]й[л[1]...^|х[5—x —1],
|
|
Д = |
|
-> |
A i— ~r |
|
|
|
|
|
||
|
|
|
|
-,X |
|
eV (l-p * ) |
|
|
|
|
||
Функция a"s__ |
отличается |
от a's ^_x |
лишь |
наличием |
мно |
|||||||
жителя (i[s—х—1] под знаком интеграла- |
После |
вычисле |
||||||||||
ний (подробные выкладки приведены в [В. |
16]) |
находим |
||||||||||
“' lSl |
Л о ^ + |
“ |
Р |
W hPs- , - \ , |
|
^ -y[s— 1]— Ills—X— 1] + |
||||||
|
Ло |
|
|
|
|
|||||||
|
+ |
|
|
|
-J-y[s—2] —w[s—х—2] ]H- |
|
||||||
|
Ps—X—2 |
|
Ao |
|
|
|
|
(1. |
127) |
|||
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
+ |
|
|
|
— y[s-3] — |
|
|
|
||
|
|
|
|
Ps- * - 3 Lv^o |
|
|
|
|
|
|||
|
— u[s—x— 3] ) + ...+ |
p -f yJ -yH -H l— ^[1] |
|
|
|
|||||||
где- |
|
|
pAi |
_ ______ p |
|
|
|
(1. |
128) |
|||
|
|
|
|
|
2 a \ |
(1—Pa) |
|
|
||||
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
P1= |
- ^ - ( 1 + |
Дх); |
|
|
|
|
|||
|
|
|
|
|
|
h |
|
|
|
|
|
|
Pj |
n i - ( l + |
A x + p 'A i)--^ — |
при y = 2 ,3 ,...,s -x -2 ; |
|||||||||
|
za h |
|
|
|
|
1 /-1 |
|
|
|
|
|
|
|
P s - |
, |
- |
1 |
za Л |
|
|
( 1 + |
A |
i ) - |
- p — |
|
|
|
|
|
|
|
|
r s —z—2 |
|
|
|
||
причем1 справедливо |
|
|
|
f |
|
|
|
|
||||
неравенство q—< 1 при /= l,...,s —х—1. |
||||||||||||
Формулу (ll. 127) |
можно |
записать |
в более |
компактном |
||||||||
виде: |
|
|
|
|
|
|
|
|
|
|
|
|
82-
5ф1 в ? ! | ^ _ Р(,11+д ,) £ |
(1. 130) |
i= t+ l
Весовые коэффициенты g £- удовлетворяют условию
l> ^ - i> g 's - a > .- .> £ 't+ l >0.
■Их значения легко могут быть определены путем сопоставле ния выражений (1. 127) и (1. 130). Второй член в формуле (1. 130) представляет собой оптимальную оценку т возму-
•щения в (s+x)-fi момент времени. Это условное математи
ческое ожидание |
p [ s + t ] |
при известных y[s—1] и «[s—1]. |
|
Как видно из (1. |
127) и (1. |
130), разности |
у[г']—u[i—t] j |
входят в выражение с различными весами, более старая ин формация деградируется и одновременно накапливается но вая. Появление множителя р(тн+ Д t) перед знаком суммы в (1. 130) означает, что в УУ должно быть прогнозирование в статистическом смысле будущих значений р. Действительно, для определения условного математического ожидания p[s+r] при известном p[s—1] необходимо умножить p[s—1] на ко эффициент корреляции р(тн + Д 0 ■ Оценка т является мар ковской достаточной статистикой возмущения. Другую доста точную статистику — апостериорную дисперсию—мы не при водим, поскольку она не используется при вычислении опти
мальных |
управляющих |
воздействий. |
|
|
|
С учетом сказанного преобразуем алгоритм управления |
|||||
•{1. 130) и приведем его к марковскому виду: |
|
|
|||
|
И*[S] = ^(<7* [s+ т ]- b s-iq* [ s + T - 1 ]) + |
|
|
||
+ 6s_itt[s—11—g s - l |
y[s— 1] —u[s—T—1] |
(1. |
131) |
||
|
|
|
Ко |
|
|
где |
|
£>s—i= P |
2° \ P S |
(1. |
132) |
|
|
|
|
|
|
1: |
Ps |
1 - - |
P4 Д< |
(1. |
133) |
|
|||||
|
:1+р2Д 1+ Д 1- |
|
|
||
|
|
|
|
||
P s - , - 3
83
Переменные коэффициенты bs- 1, g s-i могут быть заранее вычислены и введены в память управляющей вычислительной машины.
Закон управления (1. 130) или (1. 131) получен в пред положении, что р — центрированный процесс. Если на объ ект действует возмущение с отличным от нуля средним значе нием X, то его можно представить в виде суммы ^+ p [s], где ц[5] по-прежнему центрировано. При известном априори К алгоритм остается прежним (1. 131), но непосредственно на объект вместо m*[s] следует подавать управляющие воздейст вия и* [s] = u*[s]—X. Если же параметр X не известен заранее и является случайной величиной, распределенной по нормаль ному закону
то описанная выше общая методика синтеза алгоритма УУ применима с непринципиальными изменениями. Закон уп равления линейный
(1. 134)
:+1
но весовые коэффициенты Р/ отличаются от полученных выше
(Р £/)•
Перейдем к рассмотрению непрерывной системы в ста
ционарном режиме. При больших s |
и малых Л/(Д/->0) имеем |
||
a*[s]=a*[sA /] = —- — q*(s А / + т Д /)—р(тн+ Д ()MiX |
|
||
Л" |
|
(1. |
135) |
Aj) —u (s A t —- A l —jA t) |
■ |
||
Устремляя At к нулю, получим |
|
|
|
t |
|
|
|
_Z,vW _v) |
—u(t—тн—v) |
dv, |
|
’ |
— к' |
||
о |
А0 |
|
|
|
|
|
|
v = /A /, |
|
(1. |
136) |
84
Рис. 1.8
где |
/ - й , г +л |
(1. |
137) |
|
; |
|
|
|
ai°V |
(1. |
138) |
|
1 «S^L + aJ |
|
|
|
Блок-схема оптимального управляющего устройства |
(УУ) |
|
для i7* [s]= 7 * приведена на рис. 1. 8. |
УУ включает модель М |
объекта с передаточной функцией Кое |
~р-.ч |
и вычислительное |
устройство, выполняющее операцию с выходными сигналами объекта и модели: усреднение — фильтром Ф и статистический
прогноз на время тн — блоком S2 (усилитель с коэффициен- —ai|"« I
том усиления^=р("н)=(? ). Фильтр Ф представляет со бой инерционное звено с постоянной времени Тф и коэффи
циентом |
усиления |
Si |
|
|
|
|
|
|
_1 |
Д1°У |
2 |
|
|
|
|
|
(1. |
139) |
||
|
|
L |
а 2! |
5 |
||
|
|
|
|
|
|
|
М х |
|
ацау |
|
|
|
|
L |
( |
а |
, / |
Sh) V a ^ |
+iza1%Sh |
|
|
|
|
|
|
(I. |
НО) |
85
Рис. 1.9
Обозначив
можно привести последние формулы к более простому виду:
Р |
(1. 141) |
P(ai+7^j
86
Номограммы* |
для нахождения |
числовых |
значений |
пара |
|||||
метров фильтра Tfo и V |
приведены |
на рис- |
1- 9- |
Они |
по |
||||
строены для |
0,01<ах<0,1; |
0,1<р<3,3 (т- |
е. O.lo2^ < 5 /г< |
||||||
< ° v ). При |
отсутствии |
помех |
в |
цепи |
обратной |
связи |
|||
5/j= 0, 7’ф=0, |
?i= l; |
блок усреднения измеренных |
значений |
||||||
в УУ отсутствует- |
Номограммы |
(рис- 1- 9) |
могут |
быть ис |
|||||
пользованы для получения V |
и 7ф при значениях |
ах, вы |
|||||||
ходящих за пределы интервала 0,01-г0,1. Для этого вводим
масштабные |
коэффициенты М а, |
|
, |
М т, |
удовлетворяю |
||||
щие соотношениям. |
=1!M a, м , = м а. |
|
|
||||||
|
|
|
|
|
|
||||
Имея |
исходные значения ах° и (3°, |
вычисляем |
ах=айхМ а и |
||||||
р = р°УИр . Находим по номограмме для |
ах |
и |
р значения |
||||||
I1 и 7ф. |
Требуемую |
величину |
постоянной времени Т°ф |
||||||
фильтра определяем |
по формуле |
Т°ф= М 7Тф. |
|
||||||
Интересно |
выяснить влияние величины |
чистого запаз |
|||||||
дывания тн при оптимальном УУ на |
дисперсию |
выходного |
|||||||
сигнала объекта q(t) (или, равносильно, на |
установившийся |
||||||||
удельный риск)- Пусть корреляционная функция |
возмуще |
||||||||
ния |
(1. |
123), |
/Г0= 1, |
<7*= const- |
Опуская |
промежуточные |
|||
выкладки, запишем выражение для дисперсии °а9 выхода в конечном виде
г |
—2аххя |
|
{2-Щ |
-2в!ТЯ• |
(1. |
142) |
||
О |
<1 |
е |
- f a 2.. |
\ + а хТф е |
||||
|
Ч |
|
к- |
|
|
|||
|
|
|
|
|
|
|
|
|
Для системы без помех в обратной связи имеем |
|
|
||||||
|
|
|
°29= ° V ( 1- |
e_2aiT")- |
|
(1- 143) |
||
На рис. 1. 10 показана |
зависимость |
отношения |
aV °V |
от |
||||
величины запаздывания хн для следующих случаев: |
|
|||||||
5/1=0, ai=0,5 |
(кривая |
/); S/j=0,3o2H. , ^ = 0 ,5 (кривая 2); |
||||||
5/г = 0, |
ах=0,05 |
(кривая |
3); 5^=0,250^ |
, ^ = 0 ,0 5 |
(кривая 4). |
|||
|
Приведем теперь алгоритм управления, соответствующий |
|||||||
более |
сложной |
функции |
потерь |
|
|
|
||
* Расчет номограммы на ЦВМ «Минск-22» по формуле (1. 141) вы полнен А. А. Селюгиным.
87
^s=(<7*—<7ts])2+ ^ («[s]—k[s—1])*.
Рассматриваемая система также является нейтральной. Оптимальное управление при нормальном законе распреде ления и и к имеет вид:
а) |
в дискретном времени |
|
|
|
|
C j \ n —s] |
1 |
|
|
|
1—c2[/i—s] «[s—1] + |
1+Сг[/1—s] |
K0 |
|
|
s— |
1 |
|
|
|
—p(th+ A 0 2 |
gif^y>[i]—u[i--] |
(1. 144) |
|
|
/=-+! |
|
|
|
где |
*«№] = |
l> f r - i> ? s - * > - > £ x + I> 0 ; |
||
e2[n—s] может быть представлена непрерывной дробью типа
(1- 94);
б) в непрерывном времени в стационарном режиме
— Ь A?0Zi*= K 0q*— Л‘2ор(хн)’^ 1 У |
( ^ - 0) ^ 7 “ |
О |
|
_и (/ _ е — xH)]d0. |
(1. 145) |
8&
Таким образом, как в дискретном, так и непрерывном времени система управления линейная, причем в последнем случае УУ включает модель объекта, 2 фильтра первого по рядка и предиктор на время т„ (усилитель с коэффициентом усиления р(тн)). Указанные блоки сохраняются и в более сложных случаях, например, когда в объекте последовательно с запаздыванием включены емкости с передаточной функцией
ф, \ |
di0+dnp+---+dinpn |
|
{ р > |
d ao+ d 31D + . . . + d 2np n |
|
Включением блока с передаточной функцией |
—l |
|
после |
||
довательно между УУ и объектом задача сводится к рассмот ренной выше. Полученные алгоритмы легко реализуются на цифровой управляющей вычислительной машине или в не прерывном времени после некоторых упрощений — на анало говой стандартной аппаратуре ГСП, ЭАУС и т. д.
1.4. 2. Оптимальное управление
сиспользованием распределенного контроля
Произведем замену переменной х в уравнении (1. 71)
х
х1
V
Тогда (1. 71) перепишется следующим образом:
dt |
dx1 |
о |
(1. |
146) |
|
|
Решение его при нулевых начальных условиях и гранич ном условии q{0,t) = и(/)-|-р.(£) имеет вид
q(x1,t) = 0 при t< x x, |
|
q(xu t)=u{t—x 1)-\-y.{t—xl) при |
(1. 147) |
Рассмотрим несколько более общее выражение, вклю чающее модели (1. 124) и (1- 147):
Ч{х\Ь)=Ки{х')и{1-х')+К„. ( x ' W - x 1), |
(1. 148) |
89
