Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Живоглядов, В. П. Адаптация в автоматизированных системах управления технологическими процессами

.pdf
Скачиваний:
9
Добавлен:
19.10.2023
Размер:
6.85 Mб
Скачать

XQnB-'iyis]—GqMls]), 5=» 1.2,..., /я0 = 0,

(1.

197)

Q ^ = Q ^ - lW + ( 5 - 1GC(, VQhB-'GC^ =

 

 

= Q ^ ( Q (AS_ i + P r Q^P)-1Q;aS_ lP- 1+ ( 5 - 1G Cti ) T Q h B - ^ G C p .

 

(1.

198)

Таким образом, во всех рассмотренных случаях оптималь­ ные алгоритмы вычисления информационных координат и уп­ равления линейные, причем для марковского многомерного объекта с различными запаздываниями по каналам управле­ ния стратегия и структура управляющего устройства зада­ ются формулами (1. 184), (1. 195), (1. 197).

Упрощенная блок-схема системы приведена на рис. 1. 11. ■Система включает модель части объекта Oi, управляющий блок УБ с алгоритмом функционирования (1. 184) и вычис­ лительное устройство ВУ, определяющее информационные координаты т.

Все полученные алгоритмы легко могут быть реализованы «а цифровой управляющей вычислительной машине.

Р а з д е л 2

СИНТЕЗ АЛГОРИТМОВ С ПАССИВНЫМ НАКОПЛЕНИЕМ

ИНФОРМАЦИИ ДЛЯ АСУ ТП С РАСПРЕДЕЛЕННЫМИ ПАРАМЕТРАМИ

2. 1. РАЗДЕЛЕНИЕ ЗАДАЧ НАКОПЛЕНИЯ ИНФОРМАЦИИ И УПРАВЛЕНИЯ

Как отмечалось в разделе I, при исследовании ряда задач дуального управления линейными объектами с квадратичны­ ми критериями качества было замечено, что алгоритмы уп­ равления можно разделить на две части: вычисление оценок и управление по оценкам. Указанное обстоятельство позво­ лило высказать предположение [2 . 12 . 3], что и в других системах возможно разделение задач синтеза на две: синтез алгоритмов управления в предположении, что параметры р заданы, и синтез алгоритмов вычисления текущих статистиче­ ских оценок т параметров р с целью последующего их ис­ пользования в алгоритме управления. В соответствии с двумя выполняемыми функциями (управление и изучение объекта) представим управляющее устройство УУ (рис. 2. 1) в виде совокупности двух связанных блоков: собственно управляю­ щего блока УБ и вычислительного устройства ВУ, вычисляю­ щего оценки т.

Укажем следующие пути синтеза алгоритмов:

1)Независимый синтез УБ и ВУ [2. 1, 2. 2, В. 16].

2)Поэтапный синтез. Вначале находится алгоритм УБ, затем проводится синтез ВУ с учетом того, как оценки т ис­ пользуются для управления [2. 2, В. 16].

Оптимальные текущие оценки m*s (для дискретного вре­ мени) определяются, например, методом, изложенным в [2. 4], из условия минимума по р математического ожидания функции потерь

111

W$=Vfr$[()*fStCjitsiPtl-ls)]

Q*)]-

Особенность состоит в том, что оценки т* находятся из ус­ ловия близости действительного и предсказанного выходов объекта, а не из близости оценок и параметров.

3)Поэтапный синтез. Вначале решается задача иден­

тификации (находится алгоритм ВУ), затем синтезируется УБ, причем задача второго этапа сводится к задаче стохасти­ ческого управления обычно уже нелинейной системой, вклю­ чающей объект и вычислительное устройство ВУ. Указанные два этапа выделяет И. А. Богусловский [2. 7] при исследова­ нии стохастического оптимального управления инерционны­ ми объектами с сосредоточенными параметрами. На первом: этапе выводятся уравнения для достаточных координат, а на втором — используются рекуррентные уравнения Веллмана, независимыми переменными в которых служат достаточные координаты. По существу, этой же идеологии мы придержи­ вались при изложении в подразделе 1 . 2 метода информаци­ онных координат для распределенных систем с запазды­ ванием.

Наиболее простым является путь полностью независимого синтеза УБ и ВУ. Такой подход оказался конструктивным и позволил получить ряд помехоустойчивых алгоритмов для типовых объектов с запаздыванием [2. 6]. В частности, бы­ ла решена задача синтеза близких статистически оптимальных систем управления [2. 6, В. 16]. Однако во многих случаях это путь приближенного решения, и полученные таким об­ разом алгоритмы требуют дополнительного исследования.

Позднее были сделаны шаги в направлении строгого ре­ шения проблемы разделения задач управления и накопления информации. Важный вклад был внесен В. И. Иваненко [2. 7, 2. 8], который установил достаточные условия приво­ димости систем к разомкнутым для одного класса стационар­ ных случайных объектов с конечной памятью (в общем слу­ чае нелинейных), а также условия распада функционала ка­ чества, при которых допустима одношаговая оптимизация, Условия разделения задач для линейных динамических объ­ ектов с аддитивными возмущениями и помехами измерения даны в [2. 9]. Хорошо известен также полученный в послед­ ние годы в теории стохастического оптимального управления результат решения линейно-квадратических задач — так на­ зываемая теорема разделения [2 . 10—2 . 12 ]. Было. установ-

112

лено, что для линейных систем, описываемых обыкновенны­ ми дифференциальными (или разностными) уравнениями, при аддитивных гауссовых помехах оптимальное по квадратиче­ скому критерию качества управление представляет собой де­ терминированное управление по оценкам фазовых координат.

Ниже описаны достаточные условия разделимости задач накопления информации для более общих математических моделей объектов, в том числе для нелинейных нестационар­ ных объектов с чистым запаздыванием и распределенными параметрами, для объектов, описание которых задано услов­ ными плотностями вероятности, а также для негауссовых за­ конов распределения и для неаддитивных помех. Предвари­ тельно сделаем два замечания.

Замечание 1. Полный рискР^т^при оптимальном управле­

нии и* (v) на оставшемся интервале времени (непрерывного или дискретного) vs [f, Т] зависит от состояния объекта q{x, t) в момент t, в общем случае от предыстории управления, w(Tl)/7Je [0, 2] и от объема информации о неизвестных пара­ метрах р, которая накоплена к моменту t и содержится в апо­

стериорной плотности вероятности РДр.) или Ps.(p-),s

ДР

8

2247

.113

Дефицит, полезной информации при задании плотности Р*(|а) будем измерять разностью

Д /,=Я (,>Г)[д(т)),

 

 

 

 

(2. 1)

—R^,T)Hfl)MO,t],q(x,t,Y.),Pt (!x )= 8(1A-ix HCT)],

где рист— истинное значение параметра jj--

 

ией(д),тг]е[0,21],

Если Pt(\L) инвариантна относительно «(■/)),

то имеем

систему с пассивным

накоплением

информации

или без накопления информации.

так и q,

то

управление

Если от и зависит как Р((р),

имеет двойственный (дуальный) характер

и

выбирается в

результате

компромисса между

управлением

при Р{р) =

t=8(p— и-Ист)

и уточнением РДр).

 

 

 

Замечание 2 . Из зависимости .РДц.) от и еще не следует дуальность управления. Можно привести пример, когда Я/(р) зависит от и и вместе с тем дуального управления нет, необ­ ходимость в накоплении информации с точки зрения задан­ ного критерия отсутствует.

Пусть объект задан уравнением

? ( 0 = [Ч О -н (0 1г'Н-+Л(0 .

где р — случайная величина;

h(t) — центрированная помеха с независимыми значе­ ниями;

%,{t) — контролируемый вход;

Wt=q{t).

Плотность Р} (р) зависит от и, в частности, с ростом ошибки

г — Гки( дисперсия

/^ ( р )

уменьшается.

Однако

выбрав

u*(t)=A,(0 , находим

Af{№ri; } = 0 при любом

конечном р.

При этом дефицит полезной

информации

Д// =

0

и R(t,T)ин'

вариантен относительно Pt (р). Согласно принятой в [В. 16] терминологии, р в данном примере относится к несуществен­ ным неизвестным параметрам. Если же X — неконтролируемая случайная величина, оптимальное управление является ду­ альным. То же самое имеет место при некоторых другие функциях потерь.

Таким образом, при рассмотрении вопроса о разделении задач накопления информации (идентификации, оценки функ-

114;

;ций состояния объекта) и управления следует принимать во.

.внимание следующие факторы: вид критерия оптимальности; уравнения объекта и измерительных устройств, вид услов­ ных плотностей вероятностей; область Й(ы) изменения управ­ ляющих воздействий, выделяя из нее область Q,p (u), для ко­ торой допустимо разделение задач изучения и управления.

Ниже сформулированы достаточные условия разделения

.для нескольких типов моделей объектов управления. Модель 1

Пусть описание объекта задано условными плотностями

вероятности

 

 

 

 

.P(Ms]/y[s—1], иЫ, цЫ),

где УЫ и цЫ — векторы, УЫ =

 

•—>

У

— пространственно

= || y[0,s]...y[K,s]...y[/,s] || т , У[$ — 1],иЫ

временные матрицы, мЫеП(иЫ).

 

 

■Считаем предварительно

установленным

существование

за­

висимости риска от плотности P s (p), т. е. величина AI St

вы­

численная по формуле (2 . 1 ),

отлична от нуля (A /s> 0).

ин­

Достаточные условия

выделения задачи накопления

формации из общей задачи синтеза управляющего устройст­ ва и возможности ее независимого исследования сформули­ руем в виде следующей теоремы.

Теорема 1 Разделение задач накопления информации и управления

возможно,

если

существует

такое

преобразование Z[s] =

= f(a [s],

У[5]),

что при «[s] e£2p(u[s])

условная

плотность

вероятности представима в

виде

 

 

 

Р(УЫ/У[з— 1],

иЫ, fx[s]) =

G u ( u [ s ] ,

ylslJGjj. (z[s],

p[s]) (2.2)

аи 0 [А(-) инвариантно

 

 

—У

•—*

 

относительно А^ЫеЦА/Ы).

 

Доказательство

 

 

 

 

 

Рассмотрим

апостериорную плотность вероятности

 

.

Р { У[з]

| иЫ,р[а])Р(

рЫ )______

(2. 3)

 

^

Я, УЫ | иЫ, р [s ])P ([j. [s])dQ

 

Ж 5 »

где

Р{ У Ы /Ш ,^ Ы) = f t Р(У[/]/У[/—

‘И*

- 1 ], U [/], ГШ)Я(У[0]/^[0],1х[0]).

При выполнении условий теоремы преобразуем (2. 3) с уче­ том (2. 2). После сокращения общих множителей получим

р

( Z

[s]) P ( V - M ) ______

(2. 4)

^Gp (Z [s],~p [s])pfp. [s])tfQ

П( ф ])

Апостериорная плотность инвариантна относительно u[s]. Пример Пусть уравнение объекта с запаздыванием на время т име­

ет вид

уЫ —y[s —П f |x«[s—х]+ЛЫ, ueQ(u).

Помеха представляет собой центрированную последова­ тельность независимых нормально распределенных величин с дисперсией оаЛ.. При этом для

P(y[s]/y[s—1],|a,m[sт]) =

1

exp

(уЫ —y[s— П—jj-ttls—т])а

V 2^* a

2 o2/i

 

 

 

В общем случае условие теоремы не выполняется и в опти­ мальной системе разделение задач невозможно. Однако для области Qp (u) = ±a, a = const система нейтральна с пассив­ ным накоплением ’информации. Действительно, введя новую

переменную

Z[s] =

1

(уЫ—y[s— 1

]) , устанавливаем,

«[s—t]

что Ps (р)

инвариантна относительно и

 

116

P(li)exp j

^

- }

j

( Z

[

/ ] -

i

x )

2

j

 

P s M = -----------------------l- ^ —

s----------------------

 

(2.

5)

 

 

 

J

Я(|х)ехр| — - щ -

 

^

(Z[/] —|x)21

dQ

 

 

 

Q ( tx )

 

 

 

 

I=T

 

 

 

 

 

 

 

Предположим, что

а2Л = и2[5т]а2.

В этом

случае допусти­

мая область разделения Ц,(гг)

расширяется

и

включает

все значения и, кроме

и = 0 ;

Я5(у)

вычисляется

по форму­

ле (2. 5), в

которой

под

знаком

ехр

стоит

 

выражение

S

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

При

и=0

накопление

информации

О |а невозможно.

 

 

 

 

 

 

 

 

 

 

 

 

Модель 2

 

 

 

 

 

 

 

 

 

 

 

 

q[K,s]= qKS([x,Q0,K,s, гг Ы),

k = 0,1,...,/;

s = 0 ,l.....

 

 

 

 

y[/c,s] =

 

 

 

 

 

 

 

(2 . 6)

 

У Ы =

|| y[0 ,s],...,y[«,s],....y[/,s] || T.

 

 

 

Будем рассматривать пространственно-временные

матрицы

u[s], t/[s], Ii [k, s ].

Плотности вероятности

/5(ц)

и

P(h[tc,

s])

и начальное состояние Q0 считаем заданными, f

— известный

функционал. Из соотношений (2 . 6 ) можно получить модель объекта и измерительного устройства в матричной форме, ко­ торую можно записать следующим матричным уравнением:

УЫ-Ь/^иЫ.^.Рв. h [«,s] ) = 0

(2.7)

или в более общем виде

 

y[s]+E(//[s — l],K[i,Q0) /T[k,s])= 0.

(2. 8)

Теорема 2

 

Если выражение (2. 7) можно представить в виде двух

слагаемых Fu и F^

 

Fu( У Ы, и [s],Q0)+ ((a, h [«,s]) = 0,

(2. 9}

И 7

инвариантных относительно U[s] в области («[$]), то си­ стема управления нейтральна и возможно разделение задач1 синтеза алгоритмов накопления информации и управления..

Доказательство

Предполагая, что AIs в (2. 1) отлично от нуля, а стратегия управления нерандомизированная, рассмотрим апостериорную после s-ro такта плотность вероятности

^Р(ц, y[s],h[6 ,s ]/ и [s])dQ

£2 (ftpcsj)_____________________

(2. 10):

^P(^,y[s],h\K,s]/a [s])d£2

Л[лг,х])

Преобразуем выражение, стоящее под знаком интеграла

Р(|а, y[s],h.[K,s] / u [s])=P(p)P(Ii [k,s])P ( У Ы/щЛ k,s], «[s]) =

(2 . U )

—P(\i.)P(h l/c,s]) 3 (y [s]+ /7(MЫ,|а, Q0,h Ik,s])),

где б — многомерная дельта-функция.

При выполнении условий теоремы и после введения обозна­ чения

-х [«,s]=Fu( y[s],tt[s],Q0) получим

^P(p)P(h[K,s]) 1 [tf.sl-f-fjj, ([j. , h [/с,з].)Ий

РМ = --------- ---------

-----------------^ ------------

\Р(рР(А [/c,s ]) 5 [х [k,s]+F^ (p,/i [K,s])]dQ

£2(н-,Л[«,5])

Поскольку по

условию х [к,si инвариантно

относительно

u[s] при ие Qp(u), то и плотность Ps{p)

инвариантна

отно-

сительно

иЫ. Теорема доказана.

разделимости

и

для

Аналогичный

вид имеют условия

модели (2 . 8).

 

 

 

 

 

 

 

Модель 3

 

 

 

 

 

 

 

 

q(x,t)=A[q0{xv\i),U ls],\>.,x,t},

/ > 0, xeQ(x),

(2.

13)

y(xK,ts)= HK{q{xK,ts),h[rc,s]}=yln,s], к = 0Л,...,1,

 

 

где А{-}— непрерывный на

Q(q,\>.,u)

оператор.

Из

послед­

них соотношений находим

 

 

 

 

 

 

Введем

векторы УЫ= || y[0,s],...,}'[/,s] ||

т, Н =

|| Я 0,...,Я/ || г .

Получим

 

 

 

 

 

 

 

 

 

УЫ =Ж /4{<70 (л:,р.) M s],[j.,jck,/s),/i [k:,s].}.

 

(2.

14)

Теорема 3

 

можно представить в виде двух

Если выра-кение (2. 14)

слагаемых Fu и F^

 

 

 

 

 

 

 

/^ ( У Ы ^ Я Ы ) - ^

(90(*,|i),^[«,d)= O f

 

(2.

15)

—►

инвариантных относительно £/[s]eQp(Ms]), то система ней­ тральна и возможно разделение при синтезе задач накоп­ ления информации и управления.

Доказательство аналогично предыдущему. Модель 4

^ - M x , t ) , H xJ)Mx,t))=0,

(2 . 16)

0 , xeQ(x),

y(x,t) = q(x,i).

Теорема 4 Независимое исследование задачи накопления информации

возможно, если выражение (2 . 16) представимо в виде сум­ мы двух слагаемых Fu и F[X

119

Соседние файлы в папке книги из ГПНТБ