Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Цирлин, А. М. Основы оптимального управления конспект лекций

.pdf
Скачиваний:
9
Добавлен:
19.10.2023
Размер:
6.17 Mб
Скачать

щ

Рассмотрим два ВОЭМОЕНЫХ варианта оптимальных траекторий при раз ­ личных исходных пунктах ( начальных условиях) ^рисДб.З). движение из начальной точки должно осуществляться по соответствующей парабо­ ла I ее свободный член определится начальными условиями) до встречи с параболой, проходящей через начало координат. В этот момент уп­ равление переключается с одного предельного значения на другое.

 

.Выбирая различные начальные условия, можно построить линию, на

которой будет

происходить

переключение

управления, из какой бы

точ­

ки фазовой плоскости .не начиналась движение

- линию*переключения.

В нашем примере линия переключения будет состоять из отрезков

па­

рабол, проходящих через начало координат (пунктир на рио.хе.з)

 

 

 

проходящих

через

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ниже АОВ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

выше АОВ

 

 

 

 

 

Рассчитаем оптимальные траектории и момент времени переюшчензя

для

конкретных начальных условий

У Н

( - 1 ;

- I ) ; конечная 1-очка

 

 

 

 

 

., к.

 

 

 

 

 

 

 

 

 

координат

 

ОС ( 0 ;

0

).•

 

 

 

 

 

 

 

а)

точка

( - 1 , - I )

лежит ниже линии АОВ, поэтому первый участок

 

 

ffi

а +1

и,

следовательно»

 

 

 

 

 

 

У

=

 

У.п

^

— - — -

 

- первая

парабола

 

 

 

<*

2

 

 

 

2

 

 

 

 

 

 

 

V

Й

 

V Z

 

 

-

вторая

цаоабола".

 

 

 

 

I

2

 

*

 

 

 

 

 

 

 

 

 

"б)

точка

переключення

имеет

координаты

на пересечении двух парабол

 

 

У ,

*

Е - у

 

г

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

*

'

 

 

 

 

 

 

 

в)

момент

 

времени

переключения

 

 

 

 

 

 

 

 

 

 

Л

 

-

« « с

 

 

 

i71

Постоянную

C£ находим

из начальных условий

( £ = О, J<^=-I

откуда

4п

=

- | - ~ 1

'

/

° • + I + °2

Задача,

таким

образом,

полностью

решена.

 

I c2 =-if

 

 

16.7. Условия оптимальности циклического процесса •

А.Аппарат периодического действия .

Вхимической технологии многие процессы проводятся в периоди­ ческом режиме. Этот режим характерен не только для периодических реакторов, но и для аппаратов со стареющим катализатором, с перио­ дической очисткой коксующихся труб и пр. Одна из возможных поста­ новок оптимальных задач для таких процессов выглядит следующим образом.

Требуется обеспечить максимум средней производительности ап­ парата. Для этого нужно выбрать оптимальным образом управляющие

переменные

как функции

времени

и время цикла Т. Будем считать,

что известно постоянное

время

простоя

ТП р между циклами.

Итак,

 

 

 

 

 

 

 

г

 

 

 

 

 

 

 

 

 

о

°

 

(16.8?)

$

=

/ С * ,

^

 

 

 

 

(16.38)

Здесь через

i/t

fa'J

обозначен

мгновенный расход

сырья. Функция J

и параметры

состояния

У

могут

быть

векторными,

поэтому

 

соответствующие произведения

нужно понимать, как скалярные

произ­

ведения векторов.

 

 

 

 

 

 

 

 

Функционал

7~

можно представить

как отношение V

Щ=- •

Обозначим производную

 

по Т на оптимальной решении как < э ^ ^ т ' )

Условие равенства нулю этой производной приводят к уравпениы

 

 

 

 

г

 

 

 

 

 

 

 

(Тб.ЗЭа)

Выпишем функцию

£

для

задачи

о максимуме

_J7J

при условиях

.(16.88)

 

 

 

 

 

 

 

 

 

 

 

 

уС+

<р/+

 

 

< / >

у

=

/ /

+

^

у

 

 

Условия оптимальности

по

<£/

и

- V

совпадают

с

(16.6), (16.6),

(16.7). Производная же

 

по

X вдоль

оптимального

решения

(си. замечание 3 в п.14.2)

равна

 

 

ti/,

^

т у .

Таким образом,

получим условие

для выбора

Т

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(16.40)

Упражнение .

Как изменятся условия оптимальности при введении ограничения

па расход сырья за цикл

 

С^Л

= с?}

о

Бе Аппарат непрерывного Действия

.Обычно принято считать, что оптимальные значения режимных параметров в аппарать* непрерывного действия постоянны.

Однако это совершенно не обязательно.Статическиэ и динамические характеристики аппарата могут быть таковы, что оптимальным режииоц в нем может оказаться режим с периодически изменяющимися параметрами. Поставим задачу определения режима соответствующего «аисимуыу средней продуктивности;

•у)а.У- ф-

J / л С * , и , ^ J ( 1 6 - а д )

'о

г.ри условии

 

 

 

 

 

j/ = J

(Я,

 

с/

€ Vu-

а б Л 2 )

difO)

= * С Г

)

= f

C

 

(16.43).

Уравнения

(16.42)

совпадают по форме с (16.38),

функционал \

(16.41) отличается

от

(16.37)

лишь тем, что время простоя отсут­

ствует. Условие же (16.48) в прежней аадаче не встречалось. Оно соответствует требованию отсутствия при непрерывном ведении

процесса

скачков

фазовых координат. Величина

К

вместе с Т а

UС/)

подлежит определению. Выпишем функцию

/2

дня функционала

2~ =

 

 

 

 

связями (16.42), (16,48)

 

о

 

 

 

 

 

 

 

 

Два последних слагаемых соответствуют равенствам (16.48).

Функция

Гамильтона

 

 

 

 

Условия для сопряженных переменных

 

 

 

Так как в задаче

фиксированы значения фазовых переменных при

i. *

0

и

i = Т,

получим $ * / 7 * / - . / ^ ;

V>/Oj=~^.

Однако

значение

является параметром

задачи. Из условия

а(--

•ляедует, что -J=J& или ^^Oj = 9^(Т) ,

 

i74

Вариация функционала

по Т вдоль оптимально?,-траектории

Аналогично случаю периодически действующего аппарата,получим для выбора Т

Рис. 16.2.

\

\

\

X

Рис.16.3.

 

§ 17. Задачи со связями в форме дифференциальных уравнений.

 

 

Достаточные условия оптимальности ,

 

 

17.1. Условия Кротоваг

 

 

 

 

Конкретизируем достаточные

уоловия

оптимальности,

полученные

в

п.14.6 для задачи со

связями

в канонической форме.-

применительно

к

задаче

о мшссимуме

функционала

 

 

 

 

о

 

 

 

 

 

со

связями

 

 

 

 

 

 

 

vcV^,

 

y e

V*; } m U ^

a w

функция /

в (.17.1)

учитывает

зависимость целевой функции от конеч­

ного состояния процесса. Начальное оостояше для простоты будем

считать фиксированным

и предполагать,

что решение задачи принадлежит

Д.

 

 

 

 

 

 

 

 

достаточным условием

абсолютного маконмума является существо­

вание такой функции

 

 

, что функционал

 

достигает абсолютного максимума на множестве Vy в точке

У*^Х*L/*J

Множество

Vy

представляет

собой прямое_цроизведе-

ние мнсяеств

и

\{д .

Чтобы

записать

функционал JS

В форме

^17.3), нужно

; см.

п.14.6) гарантировать

существование

интеграла

У^Р/Ъ/УффЬ

г л е

УС^-О-

 

каноническая форма записи дяффе-

" ренциального

уравнения.

Это приводит к требованию непрерывности

к дифференцируембсти функции

^

(. yjT~)

для почти всех

Т<?[о,т] .

 

 

 

 

 

 

 

 

17ё

 

 

 

 

 

 

 

 

 

 

 

 

Во всякой ля задаче существует такая функция,

обеспечивающая

"сдвиг" абоситтного максимума

$

внутрь д ,

неизвестно. Но доста­

точные условия этого и не утверждают,

иначе

они были бы и необхо-

дямьии.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Сузим множество возможных функций

^

еще тем, Что будем ис­

кать

^

как функцию

только J(

ъ. "£~

,

это

позволит перейти

к

 

 

конкретным

алгоритмам

ее

 

определения, и введем

обозначение

 

 

 

Тогда выражение Pcfj

с т о

я

и

' е е

П °Д

знаком

интеграла

в (П.З), модно

записать, как

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

При

этом мы считали, что

скалярное

произведение

вектор-функций

 

 

существует. Можно было бы ооой?ись

без этого

предположения,

сразу

введя слагаемое j@Cg для достаточных условий в форме

^ 17 .&J,

как

это

было

сделано

В.Ф.Кротовым £

 

 

Однако

при принятом нами

подходе

ясно,

что переход к форме

(17.5) предполагает

зависимость

 

 

 

 

 

 

и связь в форме дифференциального уравнения,,

функцию,

стоящую под знаком интеграла,в

iS

 

 

 

 

 

 

 

о

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(17.6)

 

 

будем называть функцией

Кротова.

 

 

 

 

 

 

 

 

 

 

для того,

чтобы

 

достигал

абсолютного максимума на

,

 

необходимо

и достаточно,

 

чтобы для каждого

/

было максимально

по

J((£)£ V*:

и

 

И1 е

г

о

подинтегральное

выражение. Если

произ­

вольно задать некоторую функцию /{J(}

 

*fc) и искать

для каждого

i

максимум функции

Кротова

по М и

t/

,

то получившееся решение

 

 

не обязательно будет удовлетворять уравнениям связей. Поэтому

обычный подход к

использованию условий

оптимальности

аналогичен

 

ITT

соответствующему подходу в нелинейном программировании

(см.п.7.7)

и в задачах с дискретно меняющимися переменными

;см.& 10). Именно,

функция

^выбирается так,

чтобы максимум по одним

составляю­

щим решения

был одинаков

для всех

допустимых значений

других

 

составляющих. Для определеннооти

(это совсем не

обязательно)

 

будем считать,

что максимум/^

находят

по

 

 

 

 

выбира­

ют из условия

независимости

 

 

 

 

. Если

это удалось оде-

лать

, то подставив

в

уравнения

связей, найдем У \ \ : ),

кото­

рое

удовлетворяет

связям

и для которого

(как, впрочем,

и для вся­

кого

другого Y(•£))функция

£

максимальна

п о

У .

Если

полученная

функция^ Л.)(9

. то задача

решена;

причем найден

абсолютный

 

максимум

I

на D. Так будет

всегда!

когда множество ^совпадает

о

пространствомХ"«

Если же это не так, то У

и

U . 0

не равны

со­

ответственно У

* п

К *

а функционал

I

{ У ,

Ц°

)

^

T (

X * U . * J

дает верхнюю оценку решения. Чтобы свести задачу с ограничения­

ми на У

к

задаче

без ограничений,

можно,

например,

восполь­

 

зоваться методом штрафных функций, добавив к I

функционал,равный

нулю ащХ&

У* и отрицательный

для остальных

значений

X.

 

 

17.2. Алгоритм

динамического программирования

 

 

 

 

 

Один из возможных методов решения задачи (17.I),^17.2),

основан­

ный на достаточных

условиях, доставляет

динамическое

программиро­

вание £

2

J .

Согласно

этому

подходу функция ^выбирается

так,

чтоОы абсолютный максимум

Q

по i

t

для каждого 4г не зависел от.У

 

Sup

7>Ъс, ч

<е; -

 

с

а

 

 

 

 

 

 

 

 

У&

V*

 

 

 

 

 

 

 

 

 

 

 

(17.7)

 

 

Причем решение

не зависит

от С(4г). так как, если

найдется

функция

'•f^ I удовлетворяющая (17.7)

для некоторой Cj ( \ ) , то

найдется

 

такал функция

\

и для любой

другой

кусочно-непрерывной

и

 

 

ограниченной

 

причем

 

=^-\-{С

- Cj ) . Поэтому удобно

 

считать C(-t)= 0, тогда условие (Г7.7,)примет форму

.вели вспомнить, что

 

 

 

 

 

 

и записать (17.7) в

окрестности

^ -

Т

 

 

видно, что в точке

Т

^^Т)испытывает

скачок.

Интегрируя

последнее равенство

от Т_ до Т +

,

подучим с учетом

того, что

 

Tj

= /?{Х,

V

 

(17.9)

Условие (17.9) является краевым для уравнения в частных производ­

ных (17.8) i Это уравнение

получено

Р.Беллманом

[

2.J-

Уравнение

Беллмана не совсем обычное, в него

органично

входит

операция

нахождения верхней грани

по Ц . Один из способов

решения уравне­

ния (17.8) - переход к дискретной задаче с заменой частных произ­

водных соответствующими разностями. Получающееся

уравнение

близко Л

записанному в п. 9.4.

Так как краевые

условия для

^

заданы в

конце интервала! расчет проводят обычно, двигаясь

от" £ = - Т* к"Ь»0,

при этом одновременно с функцией ^(Xt

"tj вычисляют и

оптичэльное

удравление

 

удовлетворяющее

ограничениям

t(_ £ Vu_

а оаределенябе на множестве *Х(~- V\(

, ~£ С~-

.

 

 

Затем найденное условно-оптимальное управление, будучи подстав­

лено в уравнения связи

 

 

 

 

позволяет

найти 3\(.4)«

Если найденная

траектория

допустима,

то

пара

» U^(^"J является решением. Физически функция

iPfyii)

/?9

представляет собой то максимальное значение функционала I , которое

можно было бы достичь,

отправляясь от

состояния X(-L)

,

как

от

начального. Управление

U

(x,-&J - то

оптимальное

управление,

ко ­

торое необходимо использовать в момент

, если

система

оказа­

лась в состоянии Х(£)

.

Таким образом, в отличие

от

алгоритмов

расчета, вытекающих из необходимых условий, здесь оптимальное уп­

равление

находят не

одновременно с оптимальной траекторией, а

сна~>

чала решается задача

синтеза -

определения управления

для произ­

вольного

допустимого

состояния. И лишь, когда расчет

"поглотит"

в числе

произвольных

и действительное начальное состояние Х.0

,

для него

становится известным решение.

 

 

В целом ряде задач знание

оптимального синтеза

 

 

является целью решения. Например, в задаче о синтезе управляющего устройства*, на входы которого подаются сигналы с датчиков, измеряю­

щих состояние

объекта У

, а выходом является

управление 'U ,

17.3. Системы линейные

относительно

фазовых

координат

Сопоставим

достаточные

и необходимые

условия

оптимальности

для задач оптимизации динамических систем, у которых дифференци­ альные уравнения имеют форму

X =- M(4JX

+ /V{4, *J

(17.10)

Максимизируемый функционал также линеен по J(

начальные

условия фиксированы U€- ^

.

А.

Достаточные

условия

 

Составим

функцию Кротова

 

и попытаемся так выбрать функцию <-f j чтобы Q

не зависела от