Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
306
Добавлен:
10.04.2015
Размер:
5.96 Mб
Скачать

5.6. Способы упрощения решения задач оптимального управления технологическими процессами

Вычислительные устройства в системах управления имеют-сравнительно малую память, а время, отводимое для решения оптимизационных задач, ограничено, Поэтому при решении задач оптимального управления стремятся, где это возможно,. использовать упрощенные, пусть иногда и приближенные, ме­тоды. Некоторые пути для такого упрощения рассмотрены ниже.

Использование переменной состояния в качестве независимой переменной для автономных объектов. Многие объекты управ­ления имеют характеристики, не зависящие в явной форме от времени. Дифференциальные уравнения, связывающие пере­менные состояния х и управляющие воздействия и, имеют вид:

'Ху==Мх, и), у= 1,2,..., п (5.94)

Такие объекты называют автономными. Критерий оптималь­ности имеет форму:

т

/= 1 /д(л, и)сИ ——> тах (5.95) о

Отметим, что и в функцию /о время не входит в явном виде.

Для подобных объектов можно попытаться упростить за­дачу, приняв в качестве независимой переменной вместо { (это может быть и длина аппарата) одну из фазовых координат. Пусть для определенности такой координатой является х\.. Из первого уравнения системы (5.94) выразим сИ через с1х\:

сИ=ах^1(х1,и) 270

и получим систему уравнений (х,и);у=2,п (5.96)

с критерием оптимальности

*1(Г) <1(Г)

/ = [ м^- ах! = | р^' ")^1 ——»- тах (5-97)

*1(0) ^1(0)

Если величина Т в исходной задаче (5.94), (5.95) фиксирована, то к уравнениям (5.96) следует добавить условие

*1(Г)

*1(0)

После такого преобразования независимой переменной раз­мерность задачи становится на единицу меньше размерности вектора состояния, что упрощает решение. Кроме того, опти­мальный закон управления зависит от х\, что в ряде случаев лучше, чем зависимость от времени. Для того, чтобы правые части уравнений (5.96) модифицированной задачи были непре­рывны, нужно, чтобы функция ]\(х,и) на оптимальном решении не обращалась в нуль, т. е. из предварительного анализа зада­чи необходимо установить, что х^(1) на оптимальном решении меняется монотонно.

Если такой фазовой координаты не найдется, то не исклю­чено, что можно подыскать такую функцию у(х), для которой

я V ду

у = 5^ ^х' ") = Ф (х' ")

у=1

не меняет знака (не обращается в нуль). Кроме того, функцию стремятся выбрать так, чтобы после замены I на у правые ча­сти уравнений

<1х^ ^у(х, и)

, v = 1,п

йу ~ Ц1(х, и)

и отношение /'о/ср, определяющее в модифицированной задаче критерий оптимальности, оказались возможно проще.

Подобная замена также уменьшает на единицу размерность задачи, так как одну из фазовых переменных можно выразить через у и исключить из системы соответствующее дифферен­циальное уравнение.

Пример. Рассмотрим задачу оптимального управления процессом тепло­обмена, словесная постановка которой такова: требуется найти такой закон изменения температуры нагреваемого потока, чтобы за фиксированное время

контакта * передавалось заданное количество тепла 0 и при этом необра­тимое рассеяние энергии было минимальным.

Из термодинамики известно, что необратимое рассеяние энергии пропор­ционально повышению энтропии системы, состоящей из источника тепла и нагреваемого потока. Скорости изменения энтропии потока и источника со­ответственно равны

5=9 (Г,7и)/Г; 5„ = - (?(Г, Ги)/Ги,

где Ги—температура источника; ^—тепловой поток. Приращение энтропии системы за время I равно

7

Д5 = Г ^(Т, Г„) (———} М ——> пип. ^ \ ! о

Общее количество тепла, которое требуется передать, равно

/

0=(\(7\7и)^. О

При отдаче тепла температура источника Ги падает со скоростью, пропор­циональной потоку ц и обратно пропорциональной емкости источника С:

Ги = - ^ (Г, Ги)/С; Ги (0) = 7и° (5.99)

Управлением в задаче является температура потока Т. Найденный закон изменения Г"(0 можно реализовать, меняя скорость потока либо организуя соответствующим образом гидродинамику потоков.

Заменим продолжительность контакта < единственной в данной задаче фазовой переменной—температурой источника Ги. Получим:

С ^=- 9(7. Ги) ат«'

^т^

Д5 = \ — С { -р- — —\ йГи——> пип ^

.) \ ' ' и/

Г°

при условиях

Модифицированная задача не содержит связей в форме дифференциальных уравнений. Для решения задачи составим функцию Лагранжа

^_с[(^--^)+^^1^-^.

Запишем условие ее стационарности по Т:

72 + ^1 ^ ^ (Т, Г,,) - °

ИЛИ

уде ^,1 — постоянный множитель.

Из условия оптимальности теплового контакта (5.102) для линейного за­кона теплопереноса 9=а(Ги—Г) следует, что

Г-^Гя. (5.103)"

Коэффициент пропорциональности /г, как и ^.ь находят при подстановке-Г'(Ги) в условия (5.100), (5.101).

Когда 1-»-<х> или 0->0, то и в равенстве (5.103) стремится к единице,-и процесс теплопереноса становится обратимым (Д5-*Ю). Для расчета Т'(1)-нужно подставить Г*(7'и) в (5.99), решить получившееся уравнение, а ре­шение Т»'(1) вновь подставить в Т*(Тш).

Верхняя оценка значения задачи и ее приближение с исполь­зованием допустимых решений. Широкие возможности для упрощения решения задачи дает подход, основанный на отбра­сывании тех или иных условий, определяющих множество до­пустимых решений О. При этом решение ищут на более широ­ком и более простом множестве V, включающем О. Задачу, поставленную на множестве V, называют расширенной. Крите­рий оптимальности в расширенной задаче определен на V. Обычно этот критерий таков, что на Д он совпадает с крите­рием оптимальности исходной задачи, так что решение расши­ренной задачи, если оно оказалось допустимым в исходной,. является и ее оптимальным решением. Если же найденное-ре­шение расширенной задачи не принадлежит В, получают ве­личину iv*, которая является оценкой сверху для максималь­ного значения критерия в исходной задаче /о* (для опреде­ленности считаем, что исходная задача — задача определения-максимума).

Пример. Найти такой закон изменения напряжения на входе электриче­ской цепи и (0 (рис. 5.11), при котором тепловые потери на сопротивлении" Я. были бы минимальны, а конденсатор емкостью С получил бы за время I. заряд 0.

, Д

^ч=>-^

и И) 1 Нс —.р-Рис. 5.11. Схема НС-цепочки 0———————————'

Критерий оптимальности имеет вид:

Г

/ = | РКсИ ——> тт (5.104)

о

при условиях ' -••—---—-.-• ^

1=(и—ис)/К, (5.105)

-^=С-^=«; (?(0)=0; (3(Г)=0. (5.106)

Здесь ;'—зарядный ток; ис—напряжение на зажимах конденсатора. Отбро­сим связи (5.106), оставив лишь условие

[^=0," (5.107) о

вытекающее из уравнения (5.106) и его граничных условий, и рассмотрим задачу (5.104), (5.107) с 'расширенным множеством допустимых решений. В этой задаче управлением является уже 1(1), а не напряжение и(1), как в исходной задаче. Очевидно, что решение расширенной задачи будет

г(()=0/т.

Зарядный ток не зависит от времени, а соответствующее ему значение /* равно:

/»=.^02/т\ (5.108)

Решение исходной задачи, соответствующее найденному оптимальному за­рядному току, имеет вид:

«* (/)=№* +ие =-^-+ -^- 1.

.Если это управление допустимо, то оно оптимально и в исходной задаче. Если же на и(1} наложены ограничения, например вида

й(0<0/С+^0/2Г,

то оценка (5.108) не достижима и может служить лишь оценкой снизу для .минимальных тепловых потерь в исходной задаче.

Тот же прием расширения множества допустимых решений лежит в основе перевода одной или нескольких фазовых коор­динат в разряд управлений. При этом сокращается размер­ность вектора фазовых- координат, что сильно облегчает реше­ние. По найденному решению расширенной задачи находят обеспечивающие его законы управления, а затем стремятся аппроксимировать найденные законы изменения управляющих воздействий допустимыми по условиям исходной задачи.

Пример. Требуется найти оптимальный закон изменения во времени теп­лового _потока ^ в периодическом реакторе—такой, чтобы за минимальное время I достигалась заданная концентрация С\. Заданы начальная концент­рация Со, связь между скоростью изменения концентрации и температурой

С=—г(С,Т); С(0)=Со; С(7)=С1 (5.109) я между скоростью изменения температуры, тепловым потоком ^ и тепловым эффектом реакции у

Т=уг(С,Т)+с!. (5.110) Температура ограничена условием

Ттш^Г^Тюах. (5.111)

Отбросим уравнение (5.110) и в получившейся расширенной задаче бу­дем считать управляющим воздействием температуру Г. Расширенная задача на быстродействие с критерием оптимальности

1

\ сИ ——> тш о

и связью в форме дифференциального уравнения (5.109) может быть решена с использованием принципа максимума. Соответствующая функция Гамиль­тона имеет вид:

//=—1—4^(0, Г).

Оптимальный закон изменения температуры обеспечивает для любого ? максимум этой функции с учетом ограничений (5.111):

Т^(^)=атёт^^х[—\У(^)^(С,Т)]. (5.112) г

Сопряженная переменная 'ф удовлетворяет условию

^-^-^ '^

Совместное решение уравнений (5.111), (5.112) и (5.113) . позволяет найти Т*(1) и соответствующее этой функции значение /" критерия /==(.

На втором этапе с учетом уравнения (5.110) стремятся реализовать Т'(1) путем выбора ^. Для этого перепишем (5.110) в форме равенства

-7(0 =^(0-^(0*, Г-).

Полученный закон изменения теплового потока может быть и нереали­зуем. Например, он может содержать б-функции или не удовлетворять тем или иным ограничениям на величину д. Тогда из допустимых ^ выбирают закон ^^, в каком-то смысле ближайший к </, и рассчитывают соответствую­щее ему допустимое решение, а также значение / критерия на этом реше­нии. Очевидно, что на оптимальном решении исходной задачи значение кри­терия /в* удовлетворяет неравенствам /•</о"</. Если в этих неравенствах левая и правая части близки, то </*(<) может быть принят за искомый закон. оптимального изменения теплового потока или за первое приближение к не­му при численном решении исходной задачи.

То обстоятельство, что критерии оптимальности исходной и расширенной задач должны совпадать лишь на множестве допустимых решений О исходной задачи, но вовсе не обязаны совпадать на всем множестве V, дает дополнительные возмож­ности для формирования критерия в расширенной задаче так, чтобы ее решение оказалось допустимым в исходной. На этом основан ряд методов решения задач оптимального управления •[5], [26], [56].

Метод трансформации фазового пространства. Класс задач, в которых часть составляющих вектора управления может

быть заменена соответствующим числом фазовых координат, может быть расширен применением нелинейного преобразова­ния фазового пространства. Подобный метод предложен В. И. Гурманом. При этом число связей в форме дифференци­альных уравнений уменьшают, и множество допустимых реше­ний преобразованной задачи оказывается шире, чем исходной.

Рассмотрим задачу с двумя типами переменных состояния х и 2 и двумя видами управлений и и v. Критерий оптималь­ности / и уравнения связей имеют вид:

г

/ = С /о (х, и, г, О <И ——> тах;. (5.114) о

х=^(х, и, г, 0+М^.г)"; (5.115)

г=Р(х,г}и; (5.116) иеУи; 2<=Кг; х(0)^ха; Р(х,г)^0.

Особенность задачи состоит в том, что в уравнения связей ли­нейно входит неограниченное управление v.

Предположим первоначально, что ^2=0; тогда естественным •способом решения задачи был бы следующий:

1) отбросить условие (5.116), переходя к расширенной за­даче

т /= С !»(х, и, 2)<й——> тах (5.117)

тах о

при х = /I (х, и, г); чеУи; геУг;

2) решить задачу (5.117), считая и и г управляющими воз­действиями;

3) по условию (5.116) найти такую функцию v* (1), которая реализует найденное в п. 1 решение; эта функция может со­держать б-составляющие; условие Р^О позволяет найти и*(1) по известной кусочно-непрерывной функции г*{1).

В общем случае ^^О и v входит в уравнения (5.115) и (5.116), однако можно попытаться сделать замену переменных

У=8(х,г), (5.118)

чтобы скорость изменения переменной у не зависела от и.

Чтобы найти функцию преобразования §, запишем выра­жение для скорости изменения у:

-^•+^! '5•"э'

Подставим в него правые части уравнений ][5.115) и (5.116) и потребуем равенства нулю выражения, стоящего множителем при и:

-^- ^ (х. 2} + -^- Р, (х, г} = 0. (5.120)

Это однородное линейное уравнение с частными производными позволяет найти §(х, г). Одним из решений уравнения (5.120) является первый интеграл уравнения в обыкновенных произ­водных

&——=——й—. (5.121) ^(х,г) Р^х.г) '

Обозначим его через с (х, г). Общим же решением уравнения (5.120) является произвольная непрерывно дифференцируемая функция 9 (с).

После того, как функция § найдена, можно выразить х че­рез у, г и затем подставить в функционал (5.114) и в урав­нения (5.115), (5.116); они преобразуются к виду г

/ = Г Го (У. ". 2, 1)М ——> шах (5.122)

о при условиях

УЧЛУ,и,г,1}; г='Р(у,г)У: ге^; ыеУ„; х(у(0),г(0))=х«. (5.123)

Если функция Р^О в этой преобразованной задаче, то для ее решения может быть использован прием, основанный на пере­воде переменной состояния г в разряд управлений с сокраще­нием на единицу числа дифференциальных связей.

Метод трансформации фазового пространства может быть использован и в том случае, когда управление v входит в по­дынтегральное выражение для / линейно. В этом случае удоб­но увеличить размерность вектора х, введя фазовую перемен­ную хо, скорость изменения которой равна подынтегральному выражению в /. Сама переменная состояния может иметь несколько составляющих. (Такой вариант задачи рассмотрен на примере процесса биосинтеза в следующем разделе). Возможности использования метода малого параметра в зада­чах оптимального управления. Напомним общую схему исполь­зования метода малого параметра для решения системы диф­ференциальных .уравнений

х=!(х,1,е); х(0)='ху. (5.124)

Наряду с системой (5.124) будем рассматривать порождающую систему, полученную из (5.124) приравниванием малого пара­метра е нулю:

2=^(2, <,0); 2(0)=х„. (5.125)

Искомое решение системы (5.125), которую называют возму­щенной, представляют в виде суммы решений порождающей

системы и поправки у : х=г+у. Очевидно, что поправка удов­летворяет дифференциальному уравнению

у=х—г=!(г+у, I, е)-!(г, I, 0); у(0) =0.

Разложив правую часть этих уравнений по «малым» перемен­ным у и е, получим:

• / д} \ / д} \

У=[——]У+[——] е- (5.126) \ дх /о \ де. /о

Здесь (д}/дх)о—матрица производных д^/дх,, а (<3//(3е)о— вектор производных д^/де, которые вычислены при г/=0, е=0

И ^)=2(0.

Если получено решение г(1) порождающего уравнения, то коэффициенты уравнения (5.126) становятся известными функ­циями времени. Его решение ищут в форме разложения по степеням малого параметра е

00

у(1, е)=^ гМОе" , (5.127>

У=1

в котором г/у (0 — неизвестные функции времени. Для их вы­числения разложение (5.127) подставляют в (5.126) и прирав­нивают коэффициенты при одинаковых степенях е, что при­водит к системе

/ д( \ I аг \ У1=[~^\у^+\~^\•'

! д{ \ 1 д2} \ / д2! \ 1 д^ \ у2 = ( ^-)о у- + (^ф12 + (^)о у\ + Ыт)о •

При найденной из первого уравнения функции г/[(0 коэффи­циенты второго уравнения оказываются известными функциями времени. Решив второе уравнение, его решение вместе с у\(1} подставляют в третье, и т. д.

Пуанкаре показал, что сумма г(1)+у(^,&) при е-»-0 стре­мится к искомому решению. Применимость метода малого па­раметра основана на том, что решение возмущенной системы тем меньше отличается от решения порождающей системы, чем меньше е. Таким образом, в окрестности е=0 решение задачи должно непрерывно зависеть от 'е.

Рассмотрим управляемую систему, в которой выбором уп­равления и (I) требуется обеспечить максимум функционала т

/= I }д(х, и, ()М ——> тах (5.128)

о

для объекта, характеризующегося дифференциальными урав­нениями

'х==}(х,и,е,() (5.129) при тех или иных краевых условиях.

Непрерывную зависимость решения этой задачи от пара­метра 8 можно ожидать лишь в том случае, когда управление, обеспечивающее максимум функции Гамильтона Н(х, и, I, •ф,е), составленной для задачи (5.128), (5.129), мало меняется при малом изменении как е, так и фазовой траектории х(1, е), и вектор-функции сопряженных переменных •ф(<, е). Гарантиро­вать такую непрерывность по условиям задачи (5.128), (5.129), как правило, трудно. Очевидно, что для этого необхо­димо, чтобы максимум Я по и для любого I был единственным и его положение непрерывно зависело от х, ^ .и и в окрестнос­ти решения х°(1), ^°(0 порождающей задачи.

Наложим на функции ^о и ^ в задаче (5.128), (5.129) усло­вие непрерывности и непрерывной дифференцируемости повеем аргументам, а /о, кроме того, будем полагать дважды диффе­ренцируемой по х и ^.Отметим, что эти условия гораздо более жесткие, чем в принципе максимума. Оптимальное решение порождающей задачи, полученной из (5.128), (5.129) приравни­ванием е нулю, обозначим через х°(^), и°(1), а соответствующее ему значение функционала (5.128) —через /°.

Решение исходной задачи будем искать в форме разложе­ния в ряд по степеням малого параметра.

х=х°-}-е.х^, й=й°+бМ1.

Разложим правую часть уравнения (5.129) в ряд Тэйлора и от­бросим слагаемые второго порядка малости; получим:

.о+в^=^о, «о, о, ,)+(-^)^+(-1-)^+(^в.

Здесь производные берутся в окрестности х°, и°, е=0 и таким образом являются известными функциями времени. Если

учесть, что х°=}{х°, и°. О, I), получим для х^!) уравнение

^1^\ ^(^\ ^(^\ (5.130) \ дх /о \ ди /о \ де. /о

Аналогично разложим в ряд Тэйлора подынтегральное выра­жение в функционале / и отбросим в нем члены не второго, а третьего порядка малости; получим

(5.131)

Решение задачи о максимуме А/ при условии (5.130) позво­ляет найти поправку к порождающему решению. Эта задача

гораздо проще исходной, так как уравнения (5.130) линейные, а функционал А/ квадратичный. Если функции х°-\-ех\*, и°+ +е.и1* с достаточной точностью удовлетворяют уравнениям (5.129) исходной задачи, это решение может быть принята в качестве искомого. В противном случае его можно вновь уточнить, действуя по той же схеме. ^ Уравнения с малым параметром в форме множителя при про­изводной. Метод малого параметра ,в изложенной выше форме пригоден лишь в случае, когда правая часть уравнения пред­ставляет собой аналитическую функцию х, и и е. Рассмотрим ниже уравнения, имеющие форму

ел:у= ^(х, и). (5.132> Если их привести к форме (5.129)

xv = /v (х, и)/е,

то при е->-0 правая часть этого выражения терпит разрыв, и методы малого параметра в традиционной форме неприме­нимы.

Уравнения (5.132) возникают в случаях, когда часть со­ставляющих вектора состояния х меняется гораздо быстрее остальных. Модуль правой части дифференциального уравне­ния для таких «быстрых» составляющих гораздо больше, чем для «медленных». Порождающее решение в подобных задачах получают после приравнивания нулю функций ^ч(х, и), входя­щих в уравнения (5.132).

Полученные в результате этого конечные соотношения входят в задачу оптимизации наряду с дифференциаль­ными уравнениями для «медленных» составляющих решения. Сложность при этом заключается в том, что решение порожда­ющей задачи может не удовлетворять граничным условиям для «быстрых» переменных. Для того чтобы оно было близко-к решению исходной задачи, нужно, чтобы критерий оптималь­ности интегрально зависел от «быстрых» переменных, а также чтобы порождающее решение было устойчивым для уравнений (5.132). Последнее означает, что при изменении управлений и «медленных» переменных «быстрые» переменные стремятся к своим равновесным значениям, удовлетворяющим уравнениям порождающей системы

/у(х, й)=о. (5.133)

Таким образом, если часть уравнений, характеризующих оптимизируемый процесс, может быть приведена к форме (5.132), то для приближенного решения эти уравнения заменя­ют конечными соотношениями (5.133), решают полученную за­дачу, не обращая внимания на краевые условия для «быстрых» переменных Ху, если в исходной задаче такие условия нало­жены. Полученное решение более простой задачи позволяет вы-

брать хорошее начальное приближение для исходной задачи при ее решении численными методами. Метод прогноза и коррекции в системах оптимального управ­ления. При управлении технологическими процессами объект находится в условиях постоянных возмущений, а параметры мо­дели никогда не бывают известны абсолютно точно. В этих ус­ловиях полезным приемом при создании системы оптимального управления является использование идеи прогноза и коррекции [10]. Будем полагать, что интервал управления [О, Т] разбит на отрезки длиной А, так что время I меняется дискретно, принимая значения О, 1, 2,..., N.

1-й шаг. При начальных значениях коэффициентов модели блок оптимизации рассчитывает оптимальную программу уп­равления на интервале [О, N}, и найденная программа реали­зуется на первом интервале [О, I].

2-й шаг. По имеющейся модели прогнозируют фазовые траектории для рассчитанного оптимального управления и сравнивают их с реальным изменением вектора х. По результа­там сравнения подстраивают коэффициенты модели.

3-й шаг. Для уточненной модели и реальных значений вектора состояния х (1) вновь решают детерминированную за­дачу на интервале 1[1, N], найденное управление реализуют на интервале [1, 2], и т. д.

Соседние файлы в папке Дудников