
книги из ГПНТБ / Живоглядов, В. П. Адаптация в автоматизированных системах управления технологическими процессами
.pdfУсловная плотность |
вероятности |
P(e[j] | р) |
и другие |
|||||
плотности могут быть вычислены |
по |
известным |
статисти |
|||||
ческим характеристикам |
помех |
и |
уравнениям |
объекта и |
||||
ИУПусть измерительные устройства |
ИУ |
безынерционные |
||||||
и описываются |
взаимнооднозначными функциональными |
|||||||
зависимостями |
|
|
|
|
|
|
|
|
|
e°[5] = fe(2 0[s],g-[s]), |
|
|
|
|
|||
Плотности, вероятности помех g°,gl заданы |
аналитическими |
|||||||
выражениями |
|
|
|
|
|
|
|
|
|
^(£ ВМ ) = С(£°И), |
|
|
(1. |
38) |
|||
|
P(gl[s]) = J{gl[s])r |
. |
|
|
||||
|
|
|
|
|
||||
Найдем. |
g 0[s]=/£-(e°[s],p,s), |
|
|
|
|
g lle] = flg (^[sl.p.s)
из (1- 37) и поставим их в (1. 38). Получим условные плотности
P(e°[s] | р.)—C(fg.(e0[s],|x,s)),
|
P(el[s] |
| |>-)=rJ (flg |
(^[sl.p.s)). |
|
|
|||
Аналогично, зная плотности P{h) |
помех /i[/c,s] и v-> мнение |
|||||||
объекта, |
вычисляем |
условные |
плотности |
Р{у[к,]\ | |
р.Х./с,/', |
|||
и°1Л,“*[/])■ Стратегия |
управляющего |
устройства |
Гу |
пред |
||||
ставляет |
собой совместную |
условную |
плотность |
веро |
||||
ятности |
|
|
|
|
|
|
|
|
|
Г у = Р (п °[/]У [/] I |
UH 1, Ay-i, Уу-i). |
|
|
||||
Можно показать, |
что при ограничениях |
вида |
n[s]eQ(n) |
|||||
и выпуклой функции |
потерь оптимальная |
стратегия |
явля |
|||||
ется не случайной, а |
регулярной, т. |
е. плотности |
Гу вы |
|||||
рождаются в дельта-функции |
|
|
|
|
|
|
||
|
Гу= ®(Uj |
U*j). |
|
|
|
|
Оптимальное управление Uj* находится методом дина мического программирования, начиная с (Jn*, путем мини мизации по «°[s] и ul[s\ функции
'50.
1S
где
|
|
l |
|
|
|
|
minXy=min |
{S |
|
°X + j 4*s+idQ |
s = ],...,rt |
(I. 39) |
|
Us |
Us |
'<=0 |
Q{Es,ys) |
|
|
|
|
|
|
|
T V i= 0 , |
|
|
|
|
|
|
S—1 |
|
|
« * - j u v w w П и в°ш i |
i h-)}x |
|
||||
Q([j-,X) |
|
|
i—i |
|
|
|
|
s—1 |
/ |
|
|
|
|
x |
П |
|
П |
P(yU,j\ I цЛ, |
Uj)dQ. |
(1 . 40) |
|
/= 1 |
/= 0 |
|
|
Если (i- |
и X являются марковскими случайными процес |
||||||||||
сами |
с |
условными |
плотностями |
вероятности |
перехода |
||||||
-P((/-[s] I V-[s—l]),P(X[.s] |
I ^[s— 1]), а q измеряется |
лишь в не |
|||||||||
которых точках та, функция aKS приобретает вид |
|
||||||||||
|
|
|
$ |
|
|
|
|
|
|
|
|
* * = |
J w KsP(Hi0) П И М Л I |
И/-П)Я(Х[/] |
I M/-1D1X |
|
|||||||
(ЙН-i Ir-s) |
^ |
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
(1. |
41) |
|
S— 1 |
|
|
|
S— 1 |
|
|
|
|
|
|
X |
П |
№ |
1 / 1 1р)№ !/1 |
11*)1 П |
П Р ( п ч \ I rXUjic®. |
|
|||||
|
/ = |
1 |
|
|
|
/ = I |
т |
|
|
|
|
Индекс та под знаком |
произведения п |
означает, |
что |
||||||||
произведение берется |
по всем |
точкам |
т |
в которых изме |
|||||||
та, |
|||||||||||
ряется функция состояния q. |
Буквами |
p.s, |
Xs |
обозначены |
|||||||
временные матрицы |
|
|
|
|
|
|
|
|
P s= ИИ-10] ... v-ls] || г ,Ха= || X[0]...X[s] II гл.
51
1.1. 3. Оператор объекта задан в виде уравнений
вчастных разностях
В этом случае применение описанной выше методики не возможно без предварительного решения уравнений с уче том начальных и граничных условий. Оправдан поэтому и иной подход [1. 10]. Изложим метод синтеза управляющего устройства для управления распределенными объектами, ко торые описываются уравнениями в «частных» разностях
qKs=q[K,s]=F(\i,q[K— \,s],u[K,s],y.KS,q[K+l,s],g[K,s]) (1- |
42} |
|
с граничными условиями |
|
|
ф . 5]= <7о*(н-.«[о,5],ф[5],£[о,5]), |
(1. |
43) |
|
||
и некоторыми начальными условиями. Здесь F — однознач |
||
ная, вообще говоря, нелинейная функция, и[к, s] |
— распре |
|
деленное управление. Переменные в к-й точке |
и в s-й мо |
мент времени отмечены соответствующими индексами. Кван
тование по уровню отсутствует. В уравнении (1. 42) |
kks |
учи |
|
тывает зависимость q [к, s] от всех значений q[i, /], |
0 |
I |
/, |
/ s—1 и граничных воздействий u[o,s], ср, ...; |
<?[к:—1, |
s], |
7[к+1, s] могут не входить в правую часть уравнения (1. 42). Для простоты считаем, что q[K, s] — скаляр. При обобщении
для случая, когда |
q[K, s] — вектор, не возникает принцнпи |
|
альных трудностей. Значения помехи g[K, s] для |
различных |
|
/ с и э и случайные |
параметры р статистически |
независимы. |
Плотности вероятности P(g), Р(р) случайных воздействий g |
и параметров р известны. Вначале считаем, что помехи h в
измерительных |
устройствах отсутствуют, |
т. е. |
у[к, s] = |
= Я[к, 5]. |
|
на |
указанный |
Обобщим теорию дуального управления |
|||
класс задач управления распределенными объектами. |
|||
Предполагая, что алгоритм работы управляющего устрой |
|||
ства случайный, |
запишем выражение для удельного риска в |
||
s-м такте при известных q*[K,s] = q*K; 6[s]: |
|
|
|
i |
|
|
|
Rs== |
U[k s],q[K,s])dQ, |
(1. 44) |
|
ic--= 0 |
|
|
|
и [/C,S], q |
[K,sD |
|
|
52
где й(-)—- область |
изменения аргументов, |
a dQ— ее бес |
|||||
конечно малый элемент. |
Буквами |
о [к,5] |
и |
и [k,s] обозна |
|||
чена совокупность |
q[ic,s] |
и |
[ k ,s ] |
д л я |
scex |
к |
и s типа |
|
q[o,i] |
- |
q[0,s] |
|
|
|
|
q [k,s] = |
?[«.!]- |
|
I! |
Q !••• Qs II • |
|||
|
|
|
|
|
|
||
|
?[/.!]• |
|
|
|
|
|
|
Преобразуем |
совместную |
плотность |
вероятности |
||||
Р(р, и [«.s], q |
учитывая |
статистическую |
независимость |
||||
V-,g и известное начальное состояние Q0= |
|| ^[о,о]...^[/,о] || т |
P(|j.,« [k,s], g[K ,s])=P^) X
(1- 45)
X f [ x [ P ( Q y 1*'UJ~U |
I V i.Q ;- i) ] - |
/—I
Последнее выражение справедливо, поскольку УУ вырабаты вает воздействия в /-м такте лишь на основании информа ции, полученной измерениями в предыдущих тактах, а зави
симость управления от р. проявляется только через
Qj-i. Рассмотрим условную плотность вероятности P(Qy \ р,
Uj, Qj-i). Используя уравнение объекта и предполагая, что д[к, j] не зависит от q[i, j], где i>K, получим
1
P{Qj \ V-,Uj,Qj-i)= f ] P(qlk,j] |
| v-,4 jMk,j],qlk -/,/]). (1.46) |
|||
K=1 |
последних |
сомножителей |
||
Перейдем к рассмотрению |
||||
в (1. 45): |
|
|
|
|
P(U j \ U j-u Q j-i)= P (u [l,j] | и |
[ 0 |
, |
1,/], Uj-i, Qj-i) X |
|
X — XP(u[k,j-] I и[0,/].....и[к—1,/], |
U j - u Q j - O X -X |
47) |
||
|
|
|
(1. |
53
|
|
|
I |
|
|
Х |
- Р ( и |
[ 0 ,U/ j]-|i,Q j-x) |
— J - |
1 Г |
ку , |
|
|
|
/с=0 |
|
|
где Гку - стратегия |
управляющего |
устройства, причем |
|||
Здесь учтена |
|
Гку>0- |
|
q[fс, |
у] в уравнении: |
возможная зависимость |
(1. 42), следовательно, и оптимального управления и[к, у] от управлений, прикладываемых в тот же момент времени в точках объекта 0, 1, .... к—1. Нужно указать на принципиаль ное различие зависимостей и[к, у] от u[i, j], где t'C/c, и уп равлений в предыдущие такты. В первом случае связь между управляющими воздействиями определяется лишь операто ром объекта (1. 42). Во втором — зависимость возникает не только за счет распределенности и наличия памяти в объек те, но обусловлена эффектом накопления информации о не
известных параметрах. |
Поставив (1. 46) и (1. 47) в (1. 45), |
а результат — в (1. 44), находим |
|
I |
1 s |
к=О |
П П |
' |
|
|
к—0 1=1 |
|
|
|
|
Q ( u [ k , s] , q [ k ,s — 1/) |
|
(1. |
48) |
|
где |
l |
|
|
|
s —1 |
|
|
|
|
J ~ J |
m [ |
* - W 1 W |
. x“ [ * V ] ) |
|
j= 1 |
/= 0 |
|
|
|
Q(fv?/0s/...qfr.Ф |
|
|
|
|
k |
|
|
|
|
X |
I (М [г-М ]>у-/5.*Ф'.Л)^- |
(1. |
49) |
|
/=0 |
|
|
|
|
Можно показать, что и стратегия Г/,„_ь и все Гк^ вырождаются
в дельта-функции- |
Оптимальные управляющие |
воздействия |
||
«*[«,«] находятся из условия минимума по |
и |
[/c,s] функ |
||
ции 7кs, которая строится по следующему правилу: |
||||
l K S — a K s ' lT l ' i:K + l , s |
П р и К ф 1 , |
S < / t |
||
Т/s= a/s+ |
j* TfVs-H^ |
при s<n. |
|
(1- 50) |
Q(Qj
T ln—aln
54
В частности, для |
определения управляющего |
воздействия |
||
«[о, s] по границе используется соотношение |
|
|
||
|
T*os= min K 5+T*iS)- |
0- |
51) |
|
|
u[o,s] |
|
|
|
Если на границе приложено только |
возмущение яр [s], |
во |
||
всех уравнениях |
следует принять и[о, |
s ]= 0 . В другом слу |
чае может оказаться, что возмущение распределено по длине объекта, а управлять можно лишь по границе, т. е. и[к, s]= 0 , к= 1 ..., /—1. Задача синтеза оптимального алгоритма УУ сводится к исследованию выражений вида (1. 51).
Если в измерительных устройствах кроме помех g имеют ся случайные помехи h, т. е. состояние объекта измеряется со случайными погрешностями, задача управления усложняется, но общий подход к ее решению остается прежним. Приведем без вывода формулу полного риска:
п 1 |
|
|
s |
i |
|
|
R — |
|
aKs |
| | |
j- 1 EijdQ , |
(1. |
52) |
s= lK= 0Q(y;i>^._l)/ = 1 г'=° |
|
|
||||
причем для объектов типа |
(1- |
46) |
равняется |
|
|
|
|
s - l |
/ |
|
|
|
|
« « = j U V (,0P (Q 0) |
|
Y \ |
[ “[ |
\р Ш ] I Ф Я ) Х |
|
|
|
|
i= i |
i=o |
|
|
|
X P(q[i,j] I \h-'-ij, Ф',Л)}Х |
|
|
||||
К |
|
|
|
|
|
|
x (~] P(q[i,s] |
I |
p,x/;,K[/,s])fl?Q. |
(1. |
53) |
i =0
Применение метода динамического программирования приво дит к выражениям, аналогичным (1. 50), для вычисления уп равлений и* [к, s].
Пример. |
: |
Пусть объект описывается разностным уравнением |
|
q[K,s]=Aq[K— l,s]+5g[M,s—l]-f-C.7[/c—l.,s —1] + |
|
55
+a[K,s] + |t+£[K,s], «=1,2,...,/, |
(1. 54) |
9[0,s] = ^[s],
которое является дискретным аналогом уравнения гиперболи ческого типа
~дШ "*~а (Эх |
+ |
О- 55) |
Случайная величина р распределена по нормальному закону с нулевым математическим ожиданием и дисперсией а2^ • По
меха g[/c, s] — гауссова центрированная с независимыми зна чениями и дисперсией a2g; А, В, С — постоянные коэффи циенты.
О означи м
1,s]+ 5?[k,s—1] + Cq[K— l,s—1], |
(1. 56) |
Начальное состояние q[K, о] может быть измерено и счита ется известным. По границе на объект действует контроли руемое возмущение ф[$]. Функция потерь квадратичная
(I- 57))
Воспользуемся изложенной выше методикой для нахождения оптимального управления и* [к, s]. После некоторых преобра зований получаем
tt*[l,s]=!7*[l]—Л’Ь[5]—C6[s—1 ] ,s—1]— (1- 53
h*[/c,s]=(1—Л)<7*[/с] — Bq[i<,s—1] -Cq[K— \,s— \] —ms,
«=2,3,...,/
s—1 l
т$=-ш----- ------ |
2 ( Ч Ш ] -АФ ’1— l]—C q [ c - \,i - \} — |
4 + ^ - , ) / = , i / = i
Интересно отметить, что задача дуального управления распалась на две самостоятельных задачи: стохастического управления при известном р и определения оценки m s пара метра р.
56
1.2. МЕТОД И Н Ф О РМ А Ц И О Н Н Ы Х КООРДИ НАТ
Развитый ниже подход при сохранении основной идеологии дуального управления приводит к существенному уменьше нию вычислительных трудностей [1. 11].
Пусть объект управления описывается уравнением
о 0 |
< ^ < |
7 ’, 5= 1,2, |
59) |
q&{q), |
q0£&{q), |
(1. |
|
рбП(р), ф ]еП («), |
|
где u[s] — вектор управляющих воздействий на границе рас пределенного объекта в момент времени s;
ц — вектор случайных параметров; ф ц , х ) — векторная функция, определяющая начальное
состояние;
Q(-) — область изменения аргументов;
х — пространственная координата, t — непрерывное время;
s — дискретное время, п — |
Т |
|
|
|
|
|
|
|||
—, A t > t —$Д ф О ; |
|
|
||||||||
/4i(-J — |
некоторый непрерывный на |
£ ф , |
р, |
и) |
оператор, |
|||||
•определяющий связь начального состояния, |
входных сигна |
|||||||||
лов и текущих значений выхода q(x, t) |
и |
характеризующий |
||||||||
динамику |
распределенного |
объекта, |
причем |
Л] = 7 о(р,, |
х) |
|||||
при /= 0 . |
|
|
устройства |
имеет |
вид |
|
||||
Уравнение измерительного |
|
|||||||||
|
y(xK.ts)=y[K,s] =H(q[K,s],h[K,s]), |
|
|
|
||||||
где |
х к= к А х , |
ts= sA t, |
к=0,1,■•■,/; |
|
|
|
|
|||
Ах, At — интервалы квантования по х и t\ |
|
|
точке |
в |
||||||
q[K, s] — значения |
функции |
состояния q в к-й |
s-й момент времени;
h\tc, s] — случайная помеха с независимыми в различные моменты времени значениями;
Я — непрерывная взаимнооднозначная известная функ ция аргументов q, h.
Таким образом, предполагаем, что управление и меняется ■скачкообразно в моменты времени t s, а информация с объек та снимается лишь в фиксированных точках хк.
57
Критерий оптимальности (условный риск) задается в виде
Ти
S (‘s, т) =М |
dt |
W[q*,q(x,t),x,t,a[i\\dx\ a[s],y[fc,j] |
, |
||
ts+At О |
/ = s + l ,■■■,«■ |
(1. |
60) |
||
|
|
|
|||
Если качество |
процессов |
управления определяется состоя |
|||
нием объекта |
q(x,t) |
во всех точках хе[о,/я] |
и на интервале |
||
времени [^+ А / . Г ] |
или |
в виде |
|
|
|
|
п |
I |
|
|
|
R(s,n)= м { X |
X |
*Ф']) |
ф ] . y[/c,s] j |
, |
|
/'=5+1 К=0 |
|
(1- |
61) |
||
|
|
|
|
если проектировщика интересует лишь состояние объекта в точках х к и в дискретные моменты времени. В последнем слу чае вместо (1. 59) достаточно иметь следующую математиче скую модель:
|
^г[л,5] = Л3(н-, U[s])- |
(1. G2) |
|
Предполагаем заданными |
априорную плотность |
вероятности |
|
Р0(р) вектора |
случайных |
параметров р и плотности вероят |
|
ности помех. |
Следовательно, можно определить условную |
плотность вероятности Р(у[к, s] |р, u[s]). Процесс накопле ния информации об объекте проявляется в редукции плотно сти вероятности Ро(р), в замене априорной плотности апосте риорной Я^(р). Рассмотрим класс самовоспроизводящихся законов распределения [1. 12, В. 23]. Если существует раз ложение Ps (р) на множители
I |
“[S],y [х,5])=Я(р ‘ |
f\s)f(U И , у [/c,s]), |
(1. 63) |
то вектор |
7ls= 7Js( и [s]. у [/с,s]) |
является вектором |
достаточ |
ных координат, достаточных статистик [1. 13]. Иногда исполь зуют термин «информационные координаты» [1. 12] или ин формационные образы [1. 14].
Мы под информационными координатами будем понимать, совокупность применяемых в алгоритме управления доста точных статистик (всех или части) и фазовых координат (если
58
неопределенность состояния объекта обусловлена не толькослучайными параметрами, но и действием на объект помех). В общем случае размерность вектора информационных коор динат может быть больше, равной пли меньшей размерности достаточных статистик, определяющих плотность Рз (М).
Определение.
Конечномерный вектор ws_i = /?zs_i( и. [s—1], y[/r,s]) |
бу |
|
дем называть |
вектором информационных координат, |
если- |
полный риск |
Rm при управлении «[s]=«(m s_i,s) удовлет |
воряет условию
Rpn> R m>R*n>
Rm- R * n<Z,
где RPn и R*n— полные риски в разомкнутой системе (при. программном управлении «[s] и при оптимальном управле
нии |
m*[s]= и*(з, h[s—1], y[«:,s—1]) соответственно, 8— напе |
ред |
заданная достаточно малая величина- |
Если существует конечномерный вектор достаточных
статистик vjs_j и /7zs_ i= t)s_ 1( то R*n= R m, |
8=0. |
Достаточ |
||||
ные статистики У 5_ 1, не зависящие от (г ф —l],y[/r,s]), |
т. е. |
|||||
от фактического состояния объекта, а зависящие |
лишь от |
|||||
времени s, к информационным координатам относить |
не |
|||||
будем. В задаче, поставленной в данном |
подразделе, |
ин |
||||
формационные координаты формируются только |
из |
доста |
||||
точных статистик, |
характеризующих |
апостериорную |
плот |
|||
ность вероятности |
Р ф )- С учетом (1- |
63; |
запишем |
функ |
||
цию риска: |
|
|
|
|
|
|
Ти
s (ts,T)= fs{u \s]>y [«,«]) |
J J di ]^dxWP(ii | ms)dQ, |
(1. |
64} |
|||
|
Q((x) ^+дго |
|
|
|
||
|
|
n |
l |
|
|
|
R(s,n)=fs ( « [s ], |
у [ K,S ] |
Г |
S w *i( Ф ' ] ) р ^ |
I ms)dQ, |
|
|
|
|
Q(H-) l=s + 1k=0 |
(1. |
65} |
||
где Q(-)— область изменения аргумента; |
||||||
|
|
|||||
dQ— ее |
бесконечно малый |
элемент. |
|
|
59.