Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Живоглядов, В. П. Адаптация в автоматизированных системах управления технологическими процессами

.pdf
Скачиваний:
9
Добавлен:
19.10.2023
Размер:
6.85 Mб
Скачать

Условная плотность

вероятности

P(e[j] | р)

и другие

плотности могут быть вычислены

по

известным

статисти­

ческим характеристикам

помех

и

уравнениям

объекта и

ИУПусть измерительные устройства

ИУ

безынерционные

и описываются

взаимнооднозначными функциональными

зависимостями

 

 

 

 

 

 

 

 

 

e°[5] = fe(2 0[s],g-[s]),

 

 

 

 

Плотности, вероятности помех g°,gl заданы

аналитическими

выражениями

 

 

 

 

 

 

 

 

 

^(£ ВМ ) = С(£°И),

 

 

(1.

38)

 

P(gl[s]) = J{gl[s])r

.

 

 

 

 

 

 

 

Найдем.

g 0[s]=/£-(e°[s],p,s),

 

 

 

 

g lle] = flg (^[sl.p.s)

из (1- 37) и поставим их в (1. 38). Получим условные плотности

P(e°[s] | р.)—C(fg.(e0[s],|x,s)),

 

P(el[s]

| |>-)=rJ (flg

(^[sl.p.s)).

 

 

Аналогично, зная плотности P{h)

помех /i[/c,s] и v-> мнение

объекта,

вычисляем

условные

плотности

Р{у[к,]\ |

р.Х./с,/',

и°1Л,“*[/])■ Стратегия

управляющего

устройства

Гу

пред­

ставляет

собой совместную

условную

плотность

веро­

ятности

 

 

 

 

 

 

 

 

 

Г у = Р (п °[/]У [/] I

UH 1, Ay-i, Уу-i).

 

 

Можно показать,

что при ограничениях

вида

n[s]eQ(n)

и выпуклой функции

потерь оптимальная

стратегия

явля­

ется не случайной, а

регулярной, т.

е. плотности

Гу вы­

рождаются в дельта-функции

 

 

 

 

 

 

 

Гу= ®(Uj

U*j).

 

 

 

 

Оптимальное управление Uj* находится методом дина­ мического программирования, начиная с (Jn*, путем мини­ мизации по «°[s] и ul[s\ функции

'50.

1S

где

 

 

l

 

 

 

minXy=min

{S

 

°X + j 4*s+idQ

s = ],...,rt

(I. 39)

Us

Us

'<=0

Q{Es,ys)

 

 

 

 

 

 

T V i= 0 ,

 

 

 

 

 

 

S—1

 

 

« * - j u v w w П и в°ш i

i h-)}x

 

Q([j-,X)

 

 

i—i

 

 

 

s—1

/

 

 

 

x

П

 

П

P(yU,j\ I цЛ,

Uj)dQ.

(1 . 40)

 

/= 1

/= 0

 

 

Если (i-

и X являются марковскими случайными процес­

сами

с

условными

плотностями

вероятности

перехода

-P((/-[s] I V-[s—l]),P(X[.s]

I ^[s— 1]), а q измеряется

лишь в не­

которых точках та, функция aKS приобретает вид

 

 

 

 

$

 

 

 

 

 

 

 

 

* * =

J w KsP(Hi0) П И М Л I

И/-П)Я(Х[/]

I M/-1D1X

 

(ЙН-i Ir-s)

^

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(1.

41)

 

S— 1

 

 

 

S— 1

 

 

 

 

 

X

П

1 / 1 1р)№ !/1

11*)1 П

П Р ( п ч \ I rXUjic®.

 

 

/ =

1

 

 

 

/ = I

т

 

 

 

 

Индекс та под знаком

произведения п

означает,

что

произведение берется

по всем

точкам

т

в которых изме­

та,

ряется функция состояния q.

Буквами

p.s,

Xs

обозначены

временные матрицы

 

 

 

 

 

 

 

 

P s= ИИ-10] ... v-ls] || г ,Ха= || X[0]...X[s] II гл.

51

1.1. 3. Оператор объекта задан в виде уравнений

вчастных разностях

В этом случае применение описанной выше методики не­ возможно без предварительного решения уравнений с уче­ том начальных и граничных условий. Оправдан поэтому и иной подход [1. 10]. Изложим метод синтеза управляющего устройства для управления распределенными объектами, ко­ торые описываются уравнениями в «частных» разностях

qKs=q[K,s]=F(\i,q[K— \,s],u[K,s],y.KS,q[K+l,s],g[K,s]) (1-

42}

с граничными условиями

 

 

ф . 5]= <7о*(н-.«[о,5],ф[5],£[о,5]),

(1.

43)

 

и некоторыми начальными условиями. Здесь F — однознач­

ная, вообще говоря, нелинейная функция, и[к, s]

— распре­

деленное управление. Переменные в к-й точке

и в s-й мо­

мент времени отмечены соответствующими индексами. Кван­

тование по уровню отсутствует. В уравнении (1. 42)

kks

учи­

тывает зависимость q [к, s] от всех значений q[i, /],

0

I

/,

/ s—1 и граничных воздействий u[o,s], ср, ...;

<?[к:—1,

s],

7[к+1, s] могут не входить в правую часть уравнения (1. 42). Для простоты считаем, что q[K, s] — скаляр. При обобщении

для случая, когда

q[K, s] — вектор, не возникает принцнпи

альных трудностей. Значения помехи g[K, s] для

различных

/ с и э и случайные

параметры р статистически

независимы.

Плотности вероятности P(g), Р(р) случайных воздействий g

и параметров р известны. Вначале считаем, что помехи h в

измерительных

устройствах отсутствуют,

т. е.

у[к, s] =

= Я[к, 5].

 

на

указанный

Обобщим теорию дуального управления

класс задач управления распределенными объектами.

Предполагая, что алгоритм работы управляющего устрой­

ства случайный,

запишем выражение для удельного риска в

s-м такте при известных q*[K,s] = q*K; 6[s]:

 

 

i

 

 

 

Rs==

U[k s],q[K,s])dQ,

(1. 44)

ic--= 0

 

 

 

и [/C,S], q

[K,sD

 

 

52

где й(-)—- область

изменения аргументов,

a dQ— ее бес­

конечно малый элемент.

Буквами

о [к,5]

и

и [k,s] обозна­

чена совокупность

q[ic,s]

и

[ k ,s ]

д л я

scex

к

и s типа

 

q[o,i]

-

q[0,s]

 

 

 

 

q [k,s] =

?[«.!]-

 

I!

Q !••• Qs II •

 

 

 

 

 

 

 

?[/.!]•

 

 

 

 

 

Преобразуем

совместную

плотность

вероятности

Р(р, и [«.s], q

учитывая

статистическую

независимость

V-,g и известное начальное состояние Q0=

|| ^[о,о]...^[/,о] || т

P(|j.,« [k,s], g[K ,s])=P^) X

(1- 45)

X f [ x [ P ( Q y 1*'UJ~U

I V i.Q ;- i) ] -

/—I

Последнее выражение справедливо, поскольку УУ вырабаты­ вает воздействия в /-м такте лишь на основании информа­ ции, полученной измерениями в предыдущих тактах, а зави­

симость управления от р. проявляется только через

Qj-i. Рассмотрим условную плотность вероятности P(Qy \ р,

Uj, Qj-i). Используя уравнение объекта и предполагая, что д[к, j] не зависит от q[i, j], где i>K, получим

1

P{Qj \ V-,Uj,Qj-i)= f ] P(qlk,j]

| v-,4 jMk,j],qlk -/,/]). (1.46)

K=1

последних

сомножителей

Перейдем к рассмотрению

в (1. 45):

 

 

 

 

P(U j \ U j-u Q j-i)= P (u [l,j] | и

[ 0

,

1,/], Uj-i, Qj-i) X

X — XP(u[k,j-] I и[0,/].....и[к—1,/],

U j - u Q j - O X -X

47)

 

 

 

(1.

53

 

 

 

I

 

 

Х

- Р ( и

[ 0 ,U/ j]-|i,Q j-x)

— J -

1 Г

ку ,

 

 

 

/с=0

 

 

где Гку - стратегия

управляющего

устройства, причем

Здесь учтена

 

Гку>0-

 

q[fс,

у] в уравнении:

возможная зависимость

(1. 42), следовательно, и оптимального управления и[к, у] от управлений, прикладываемых в тот же момент времени в точках объекта 0, 1, .... к—1. Нужно указать на принципиаль­ ное различие зависимостей и[к, у] от u[i, j], где t'C/c, и уп­ равлений в предыдущие такты. В первом случае связь между управляющими воздействиями определяется лишь операто­ ром объекта (1. 42). Во втором — зависимость возникает не только за счет распределенности и наличия памяти в объек­ те, но обусловлена эффектом накопления информации о не­

известных параметрах.

Поставив (1. 46) и (1. 47) в (1. 45),

а результат — в (1. 44), находим

I

1 s

к

П П

'

 

 

к—0 1=1

 

 

 

Q ( u [ k , s] , q [ k ,s — 1/)

 

(1.

48)

где

l

 

 

 

s —1

 

 

 

J ~ J

m [

* - W 1 W

. x“ [ * V ] )

j= 1

/= 0

 

 

 

Q(fv?/0s/...qfr.Ф

 

 

 

 

k

 

 

 

 

X

I (М [г-М ]>у-/5.*Ф'.Л)^-

(1.

49)

/=0

 

 

 

 

Можно показать, что и стратегия Г/,„_ь и все Гк^ вырождаются

в дельта-функции-

Оптимальные управляющие

воздействия

«*[«,«] находятся из условия минимума по

и

[/c,s] функ­

ции 7кs, которая строится по следующему правилу:

l K S — a K s ' lT l ' i:K + l , s

П р и К ф 1 ,

S < / t

Т/s= a/s+

j* TfVs-H^

при s<n.

 

(1- 50)

Q(Qj

T ln—aln

54

В частности, для

определения управляющего

воздействия

«[о, s] по границе используется соотношение

 

 

 

T*os= min K 5+T*iS)-

0-

51)

 

u[o,s]

 

 

 

Если на границе приложено только

возмущение яр [s],

во

всех уравнениях

следует принять и[о,

s ]= 0 . В другом слу­

чае может оказаться, что возмущение распределено по длине объекта, а управлять можно лишь по границе, т. е. и[к, s]= 0 , к= 1 ..., /—1. Задача синтеза оптимального алгоритма УУ сводится к исследованию выражений вида (1. 51).

Если в измерительных устройствах кроме помех g имеют­ ся случайные помехи h, т. е. состояние объекта измеряется со случайными погрешностями, задача управления усложняется, но общий подход к ее решению остается прежним. Приведем без вывода формулу полного риска:

п 1

 

 

s

i

 

 

R —

 

aKs

| |

j- 1 EijdQ ,

(1.

52)

s= lK= 0Q(y;i>^._l)/ = 1 г'=°

 

 

причем для объектов типа

(1-

46)

равняется

 

 

 

s - l

/

 

 

 

« « = j U V (,0P (Q 0)

 

Y \

[ “[

\р Ш ] I Ф Я ) Х

 

 

 

 

i= i

i=o

 

 

 

X P(q[i,j] I \h-'-ij, Ф',Л)}Х

 

 

К

 

 

 

 

 

 

x (~] P(q[i,s]

I

p,x/;,K[/,s])fl?Q.

(1.

53)

i =0

Применение метода динамического программирования приво­ дит к выражениям, аналогичным (1. 50), для вычисления уп­ равлений и* [к, s].

Пример.

:

Пусть объект описывается разностным уравнением

q[K,s]=Aq[K— l,s]+5g[M,s—l]-f-C.7[/c—l.,s —1] +

 

55

+a[K,s] + |t+£[K,s], «=1,2,...,/,

(1. 54)

9[0,s] = ^[s],

которое является дискретным аналогом уравнения гиперболи­ ческого типа

~дШ "*~а (Эх

+

О- 55)

Случайная величина р распределена по нормальному закону с нулевым математическим ожиданием и дисперсией а2^ • По­

меха g[/c, s] — гауссова центрированная с независимыми зна­ чениями и дисперсией a2g; А, В, С — постоянные коэффи­ циенты.

О означи м

1,s]+ 5?[k,s—1] + Cq[K— l,s—1],

(1. 56)

Начальное состояние q[K, о] может быть измерено и счита­ ется известным. По границе на объект действует контроли­ руемое возмущение ф[$]. Функция потерь квадратичная

(I- 57))

Воспользуемся изложенной выше методикой для нахождения оптимального управления и* [к, s]. После некоторых преобра­ зований получаем

tt*[l,s]=!7*[l]—Л’Ь[5]—C6[s—1 ] ,s—1]— (1- 53

h*[/c,s]=(1—Л)<7*[/с]Bq[i<,s—1] -Cq[K— \,s— \] —ms,

«=2,3,...,/

s—1 l

т$=-ш----- ------

2 ( Ч Ш ] -АФ ’1— l]—C q [ c - \,i - \} —

4 + ^ - , ) / = , i / = i

Интересно отметить, что задача дуального управления распалась на две самостоятельных задачи: стохастического управления при известном р и определения оценки m s пара­ метра р.

56

1.2. МЕТОД И Н Ф О РМ А Ц И О Н Н Ы Х КООРДИ НАТ

Развитый ниже подход при сохранении основной идеологии дуального управления приводит к существенному уменьше­ нию вычислительных трудностей [1. 11].

Пусть объект управления описывается уравнением

о 0

< ^ <

7 ’, 5= 1,2,

59)

q&{q),

q0£&{q),

(1.

рбП(р), ф ]еП («),

 

где u[s] — вектор управляющих воздействий на границе рас­ пределенного объекта в момент времени s;

ц — вектор случайных параметров; ф ц , х ) — векторная функция, определяющая начальное

состояние;

Q(-) — область изменения аргументов;

х — пространственная координата, t — непрерывное время;

s — дискретное время, п —

Т

 

 

 

 

 

 

—, A t > t $Д ф О ;

 

 

/4i(-J —

некоторый непрерывный на

£ ф ,

р,

и)

оператор,

•определяющий связь начального состояния,

входных сигна­

лов и текущих значений выхода q(x, t)

и

характеризующий

динамику

распределенного

объекта,

причем

Л] = 7 о(р,,

х)

при /= 0 .

 

 

устройства

имеет

вид

 

Уравнение измерительного

 

 

y(xK.ts)=y[K,s] =H(q[K,s],h[K,s]),

 

 

 

где

х к= к А х ,

ts= sA t,

к=0,1,■•■,/;

 

 

 

 

Ах, At — интервалы квантования по х и t\

 

 

точке

в

q[K, s] — значения

функции

состояния q в к-й

s-й момент времени;

h\tc, s] — случайная помеха с независимыми в различные моменты времени значениями;

Я — непрерывная взаимнооднозначная известная функ­ ция аргументов q, h.

Таким образом, предполагаем, что управление и меняется ■скачкообразно в моменты времени t s, а информация с объек­ та снимается лишь в фиксированных точках хк.

57

Критерий оптимальности (условный риск) задается в виде

Ти

S (‘s, т)

dt

W[q*,q(x,t),x,t,a[i\\dx\ a[s],y[fc,j]

,

ts+At О

/ = s + l ,■■■,«■

(1.

60)

 

 

 

Если качество

процессов

управления определяется состоя­

нием объекта

q(x,t)

во всех точках хе[о,/я]

и на интервале

времени [^+ А / . Г ]

или

в виде

 

 

 

п

I

 

 

 

R(s,n)= м { X

X

*Ф'])

ф ] . y[/c,s] j

,

/'=5+1 К=0

 

(1-

61)

 

 

 

 

если проектировщика интересует лишь состояние объекта в точках х к и в дискретные моменты времени. В последнем слу­ чае вместо (1. 59) достаточно иметь следующую математиче­ скую модель:

 

^г[л,5] = Л3(н-, U[s])-

(1. G2)

Предполагаем заданными

априорную плотность

вероятности

Р0(р) вектора

случайных

параметров р и плотности вероят­

ности помех.

Следовательно, можно определить условную

плотность вероятности Р(у[к, s] |р, u[s]). Процесс накопле­ ния информации об объекте проявляется в редукции плотно­ сти вероятности Ро(р), в замене априорной плотности апосте­ риорной Я^(р). Рассмотрим класс самовоспроизводящихся законов распределения [1. 12, В. 23]. Если существует раз­ ложение Ps (р) на множители

I

“[S],y [х,5])=Я(р ‘

f\s)f(U И , у [/c,s]),

(1. 63)

то вектор

7ls= 7Js( и [s]. у [/с,s])

является вектором

достаточ­

ных координат, достаточных статистик [1. 13]. Иногда исполь­ зуют термин «информационные координаты» [1. 12] или ин­ формационные образы [1. 14].

Мы под информационными координатами будем понимать, совокупность применяемых в алгоритме управления доста­ точных статистик (всех или части) и фазовых координат (если

58

неопределенность состояния объекта обусловлена не толькослучайными параметрами, но и действием на объект помех). В общем случае размерность вектора информационных коор­ динат может быть больше, равной пли меньшей размерности достаточных статистик, определяющих плотность Рз (М).

Определение.

Конечномерный вектор ws_i = /?zs_i( и. [s—1], y[/r,s])

бу­

дем называть

вектором информационных координат,

если-

полный риск

Rm при управлении «[s]=«(m s_i,s) удовлет­

воряет условию

Rpn> R m>R*n>

Rm- R * n<Z,

где RPn и R*n— полные риски в разомкнутой системе (при. программном управлении «[s] и при оптимальном управле­

нии

m*[s]= и*(з, h[s—1], y[«:,s—1]) соответственно, 8— напе­

ред

заданная достаточно малая величина-

Если существует конечномерный вектор достаточных

статистик vjs_j и /7zs_ i= t)s_ 1( то R*n= R m,

8=0.

Достаточ­

ные статистики У 5_ 1, не зависящие от (г ф —l],y[/r,s]),

т. е.

от фактического состояния объекта, а зависящие

лишь от

времени s, к информационным координатам относить

не

будем. В задаче, поставленной в данном

подразделе,

ин­

формационные координаты формируются только

из

доста­

точных статистик,

характеризующих

апостериорную

плот­

ность вероятности

Р ф )- С учетом (1-

63;

запишем

функ­

цию риска:

 

 

 

 

 

 

Ти

s (ts,T)= fs{u \s]>y [«,«])

J J di ]^dxWP(ii | ms)dQ,

(1.

64}

 

Q((x) ^+дго

 

 

 

 

 

n

l

 

 

R(s,n)=fs ( « [s ],

у [ K,S ]

Г

S w *i( Ф ' ] ) р ^

I ms)dQ,

 

 

 

Q(H-) l=s + 1k=0

(1.

65}

где Q(-)— область изменения аргумента;

 

 

dQ— ее

бесконечно малый

элемент.

 

 

59.

Соседние файлы в папке книги из ГПНТБ