Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Васильев Ф.П. Лекции по методам решения экстремальных задач

.pdf
Скачиваний:
16
Добавлен:
25.10.2023
Размер:
14.17 Mб
Скачать

190

ДИНАМ И ЧЕСКО Е ПРОГРАММИРОВАНИЕ.

ПРОБЛЕМА

СИНТЕЗА

[Гл. 4

Тогда последовательность

\ulw\k ( т = 1,

2,

. . . )

является минимизи­

рующей для задачи (9) — (12),

т.

е.

 

 

 

 

 

 

П т 4 (х, [uim]ft) =

/fe =

inf Ik (x,

[игу

=

Bk (x).

 

 

m-+oo

 

 

 

 

 

 

 

 

 

Д о к а з а т е л ь с т в о .

Возьмем произвольное

Аь.(x)

с со­

ответствующей траекторией [-4U из (10). С помощью формулы (21) тогда имеем

 

 

 

 

 

 

N—1

 

 

 

 

 

 

 

 

4

[^i]fc) '

Ik(x > [^irrtlfe) =

^

[ 4

(xiI ^i)

Ri ixlm> Uim)]>

 

 

 

 

 

 

 

i=k

 

 

 

 

 

 

 

 

 

 

 

 

m = 1,

2,

, . .

 

 

 

 

 

 

 

Теперь равенство

\\mlk {x,

[uim]k) — i l

доказывается

так

же, как

и в

 

 

 

ТП-*ОО

= Bk (х)

 

 

 

 

 

 

 

 

 

•теореме 4. Соотношение 4

следует

из

формул

(21)

при

Щ = Щт,

xl = xim> когда гп-+оо.

 

 

 

 

 

 

 

 

 

 

Как видим, функции щт(х)

из теоремы 4 дают приближенное

решение

проблемы синтеза

для

задачи

(5) — (8),

ибо

если в

мо­

мент k объект

находится

в

точке х ^ Х к, то движение

объекта

по

закону

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Х{+1,т =

4

(xim, uim {xim))t

i =

k,

k + 1 ,

. . . ,

N —

1,

 

 

 

 

xkm = x > « * = 1 , 2 , . . .

 

 

 

 

 

 

при больших m доставляет функционалу 4 ( * , tuf]ft) значения, как угодно близкие к оптимальному /*.

6. Резюмируя содержание настоящего параграфа, замети что метод динамического программирования позволяет свести за ­ дачу (5 )— (8) к последовательности, вообще говоря, более про­ стых задач минимизации функций меньшего числа переменных для определения B h(x), uh(x), определить абсолютный минимум функдионала (5) при условиях (6 )— (8), а также решить проблему син­ теза для этой задачи. Этот метод дает значительный выигрыш в объеме вычислений по сравнению с простым перебором всевозмож­ ных допустимых управлений и траекторий, поскольку при вычис­ лении B k (x)yUk(x) достаточно рассмотреть лишь такие управления, которые переводят точку х в точку xh+ i = F k (x, ц ), и дальнейшее движение из точки ,хь,+\ осуществить по оптимальной траек­ тории, отбрасывая все неоптимальные. Указанные достоинства ме­ тода динамического программирования, простота схемы и приме­ нимость к широкому классу задач с фазовыми ограничениями делают этот метод весьма привлекательным, и его широко исполь­ зуют при решении задач типа (5) — (8).

S 2]

 

•Схема Н. Н. Моисеева

 

 

191

Можно показать, что при некоторых ограничениях решение

дискретной задачи (5 )— (8) при измельчении шага

сетки

(точнее,

при

max

|/{+1 1( |- * 0 (N->~oo)) будет близко

в

некотором

0<£<ЛГ—1

 

 

 

 

смысле к решению непрерывной задачи (1) — (4); (см. гл.

9).

Следует, однако, сказать, что аналитическое выражение для

Bh(x),

uu(x)

при всех х ^ Х к в общем случае найти

не

удается,

и на практике приходится ограничиваться приближенным вычисле­ нием В к (х), Uh(x) в некоторых заранее выбранных узловых точках,

используя какие-либо методы

минимизации функций

(например,

методы из гл. 1, 2). Согласно

(13) при вычислении Bh(x) нужно,

знать значения B k+\{Fk {x,u))

при некоторых ы, и здесь возможны

случаи,

когда точка

xk+i — Fk (x,u) не

принадлежит заранее выб­

ранному

множеству

узловых

точек,

а следовательно,

значение

i?£i+i(Xft+i) заранее не вычислено. Разумеется, можно дополнитель­ но вычислить недостающее значение В к+\(х), но это может при­ вести к чрезмерному расширению множества узловых точек, ибо для его вычисления нужны значения ранее вычисленных функций

В к+2 (х),

..., B N(x)

в новых дополнительных точках. На практике

в таких

случаях

недостающее значение Вк+\ (х) получают с по­

мощью интерполяции по значениям В к+\{х) в близлежащих узло­ вых точках, что, естественно, снижает точность метода.

Следует также заметить, что принятый выше способ аппрок­ симации задачи (1) — (4) с помощью разностной задачи (5) — (8) довольно груб, поскольку опирается на простейший метод ломаных Эйлера для интегрирования дифференциальных уравнений и квад­ ратурную формулу прямоугольника. Ниже опишем схему Н. Н. Мо­ исеева, которая не требует интерполяции и оставляет достаточную свободу при выборе способа аппроксимации задачи (1) — (4).

§2. СХЕМА Н. Н. МОИСЕЕВА

1.По-прежнему будем рассматривать задачу (1.1—4). Для приближенного решения этой задачи, как и раньше, разобъем от­

резок taCksCT' на N частей точками t0<ztl< . . . < t N-i<CtN= T .

На множестве G i= G (U ) возьмем некоторую дискретную сетку точек Xij^Gi\ следуя [171], множество всех точек выбранной сетки

будем

называть

шкалой состояния и обозначать

через Я,-,

i = О,

1, ..., N. Шкалы состояний

H i

и H i+ i будем называть соседними.

На двух

соседних

шкалах

H i

и Яг+i

возьмем

точки х ^ Я г- и

у ^ Н {+ 1

и

рассмотрим

вспомогательную

задачу:

минимизировать

функционал

 

 

 

 

 

 

 

 

 

■ *1+1

(х (t), и [t), t) dt (х, у — фиксированы)

 

Jt (х, у, ц) =

j

(1)

192

ДИНАМ И ЧЕСКО Е ПРОГРАММИРОВАНИЕ.

ПРОБЛЕМА

 

СИНТЕЗА

\Гл.

4

при[условиях

 

 

 

 

 

 

 

 

 

 

 

x(t) =

/ (х (t), и (t),t),

ti <

t <

^i+1, *

(<t) =

х,

х (ti+i) =

у,

(2)

 

 

x ( t ) e o ( t ) ,

ft < f <

f , +lt

 

 

 

 

 

(3)

 

u(t)

кусочно-непрерывна и u(t)^V (t) при ^

 

< ti+l,

(4)

i= 0 ,

1,

N— 1. Следуя

[171],

задачу

(1)— (4)

будем

называть

элементарной операцией,

соединяющей точки х н у .

Через Ai(x,y)

обозначим

множество всех управлений

u(t)

из

 

(4),

для которых

соответствующая траектория

x(t) удовлетворяет

всем

условиям

(2) — (3). Положим Мь{х, у)

=

inf J i( x ,y ,u ) ;

если Ai { x , y ) = 0 ,

и£&.(х,у)

то будем считать М{(х, у) =

+ оо по определению.

 

Пусть все точки всех соседних шкал попарно соединены эле­

ментарными операциями.

Если

inf

J, (х, у, и)

достигается на

 

 

 

Д£(*.у)

 

некотором

управлении Ui(t)^Ai(x,y)

и соответствующей траекто­

рии Xi(t),

то величина

 

 

 

 

 

N— 1

 

 

 

 

 

£ Mi (ха г *ч -1./ш ) +

Ф (jcjv./дг), 4 i ,

= *

 

£=0

 

 

 

 

выражает собой значение исходного функционала (1.1) на управ­ лении u(t)=U i(t) и соответствующей траектории x(t,u )= X i{t), h < t ^ t i+u i = 0, 1, ..., А7— 1, x (f0) = * ' при соблюдении .всех огра­ ничений (1.2—4). Поэтому исходную задачу (1.1—4) естественно аппроксимировать задачей отыскания минимума суммы

 

N— 1

Mi (xij., x i+ l,j.+i) + Ф (xN,jN)

 

 

£

 

 

i=0

 

 

 

 

 

 

по всевозможным наборам точек

 

 

 

 

(*o./. = x>*i./„ •••. xn.iN),

xi,i;

(f =

0, 1,

. . . , TV)

при всех х е Я 0..

Такая

аппроксимация

задачи

(1.1—4) имеет

смысл, конечно,

и в

том

случае,

когда

inf

(х, у, и) не дости-

гается при каких-либо х, у, i. Очевидно, приведенная аппроксима-» ция задачи (1.1— 4) более гибкая и лучше приспособлена для приближенного решения этой задачи, чем схема Веллмана, ибо здесь предоставляется свобода в выборе способа реализации эле­ ментарной операции (1) — (4), и, кроме того, рассмотрение лишь таких траекторий, концы! которых лежат в известных точках со­ седних шкал, избавляет нас от необходимости интерполирования. На способах реализации элементарной операции остановимся ниже.

§ 2]

Схема Н.

Н. Моисеева

 

193

 

Описанная аппроксимация

задачи (1.1—4)

имеет

простой

геометрический смысл. А именно траекторию Xi(t) из (2),

на кото­

рой

достигается inf J t { x ,y ,u ),

назовем дугой,

соединяющей

точки х, у, а число М{(х, у) — длиной этой дуги

(t= 0 , 1,

...,

N— 1).

Дуги, последовательно соединяющие пары точек хц.,

 

со­

седних шкал Hi, Hi+l, 1 = 0 , 1, .., N— 1,

назовем

путем,

соединяю­

щим шкалы Н0 и HN, проходящим через точки х0/о, хц1} . . .

,xNjN

и в качестве его длины примем число

 

 

 

 

N— 1

 

 

 

 

£

Mi (Xtj., Xi+ U j.+1) +

Ф (xNjN).

 

 

 

i=

0

 

 

 

 

Тогда наша'задача сведется к отысканию кратчайшего пути, сое­ диняющего шкалы Н0 и HN.

2. Обозначим

 

 

N -

1

 

 

Ck (х) =

inf { £

Mi (х£/;, xi+l,/.+1) + ф(хм,,„)\

 

 

 

1 i =

k

 

 

где нижняя грань берется по всем наборам точек

 

 

(■xkik = х, xk+i,jk+i, . . .

,xNjN), хц. 6 Я £, i = k , k +

1,

. ••, N.

Иначе говоря,

Ck (x)

выражает собой кратчайшее расстояние между

фиксированной точкой x £ H k и шкалой HN.

 

 

Докажем, что функции Ск (х) удовлетворяют следующим ре­

куррентным соотношениям:

 

 

Ck ( x )=

inf

{Mk {x, y) + Ck+l(y)}, k = 0, 1, •..

, N — 1;

 

y^Hu i

 

 

 

(5)

 

 

 

CN (x) = Ф (x),

 

 

аналогичным уравнению (1.13). Справедливость (5)

при k = N — 1.

следует из определения CN- X(x), CN(x). Покажем, (5)

при других

К 0<zCk-<N— 1. Для

этого сначала убедимся в том, что

Ck (х) <

inf

{Mk (х, у) + Ск+, (г/)}, х 6 Нк.

(6)

 

 

У^нк+1

 

 

 

Возьмем произвольное г/<=#й+]. По определению Ск+\(у) для лю­ бого е > 0 найдется путь, соединяющий точку у со шкалой HN, длина которого не превышает Сь+i (г/)+е. Если этот путь «удли­ нить», добавив к нему дугу, соединяющую точки х и у, то получим путь, соединяющий точку x ^ H k со шкалой HN, длина которого не превышает Mh(x, y) + Cft+i(j/ )+ e. Поэтому заведомо Ch(x)<Z

7 Ф. П. Васильев

194

Д ИНАМ И ЧЕ СКО Е ПРОГРАММИРОВАНИЕ. ПРОБЛЕМА

СИНТЕЗА

[Гл.

4

 

у) + С Л+1 (у) + Е .

В силу произвольности

ТОЧКИ

y<=Hk+1

и

величины е > 0 , отсюда имеем неравенство (6).

 

 

 

 

 

Теперь покажем, что в (6) на самом деле

знак

неравенства

можно заменить знаком

равенства. По определению

Ск(х) для

любого е !> 0 найдется путь, соединяющий точку х ^ Н к со шкалой Нк, длина которого не превосходит СЛ(л:)+8. Пусть этот путь про­

ходит

через точку уе ^ Н к+ь Ясно,

что отрезок

этого пути

от уЁ

до HN не меньше Ch+i(ye ), и

поэтому весь путь от х до

HN не

меньше Mh (x, г/е)+ С л + 1 (Ув).

Следовательно,

Мк(х,уе)~|-

+ Cft+1 (Уе)<^,Ск (х) + е . Так как

(/еЕ Я Л+|, то отсюда имеем

inf {Мк (х, у ) +

Ck+l(y)}<£Ck (x) + E

y£Hk+i

 

или в силу произвольности е > 0 —

inf {Mk (х, у) + Cfc+1 (у)} < Ск (х). .

У^нк+1

Сравнивая это неравенство с (6), немедленно получаем требуемые соотношения (5).

3.

Соотношения (5)

могут быть использованы

так же, как

уравнение

Веллмана (1.13).

Опишем порядок работы

с этими со­

отношениями в предположении, что каждая из шкал

состояний

Hi, i = l , 2,

..., N, содержит конечное число pi точек. Заметим, что в

этом

случае в (5) вместо inf можно писать min. Функция CN(x) =

= Ф

(*), хe tfjv нам известна. Для вычисления CN_i(x) с помощью

элементарных операций соединим попарно все точки, шкал Д /v-i и HN. Сравнивая pN- i - p N величин MN-\(x, г/)+Ф (у) при всевозмож­ ных х ^ Н х _ ,, г/еЯлг, найдем

 

 

min [MN- X(x, у) -f Ф (у)] =

Cw- i (х),

 

 

 

 

y£HN

 

 

 

 

 

 

 

а также точку y ^ y N-\{x)^.HN, на которой этот минимум

дости­

гается.

Если Ch+i(x) и у — ук+\{х) при х<=Нк+\ уже

известны, то

для вычисления

Ск {х), x ^ H h соединим элементарными операция­

ми всевозможные

пары

точек из шкал

Нк и Нк+1.

Перебором

pk-Ph+i

величин Мк (х,у) + Ск+\(у) при всех x ^ H k, у ^ Н к+1 найдем

 

 

 

min. [Mk (х, у) + Сш

(у)]

=

Ск(х),

 

 

 

 

 

 

у^нк+1

 

 

 

 

 

 

 

а также

точку

у =

yk (x) £ Hk+1, х ^ Н к, на

которой

этот минимум

достигается, и т. д.

для всех k = N, N

1, . . .

, 1., 0.

На

 

вычисле­

ние всех Ск (х) и у = ук (*)

при x £ H k, k — 0,

1,

.. - , N

1,

понадо-

 

N —1

р; ■pi+i величин. Наконец,

 

 

х' 6 Н0 из

бится перебор

 

находим

условия

С0 (х*) =

£=0

 

 

 

 

 

 

 

 

inf С0 ) . Для этого нужно перебрать еще р0величин.

 

 

*ея„

 

 

 

 

 

 

 

S 2]

Схема Н. Н. Моисеева

 

195

Затем

определяем последовательно точки х* — у0(х*), х* =

ух (х*), ...

... ,х*ы = у ы - i( ^ _ i) . Путь, проходящий через

найденные точки

х*0, х\,

. . . , x*N, будет кратчайшим среди всех путей, соединяющих

крайние шкалы HQ, HN.

 

 

В

самом деле, по определению yk{x), k = 0 , 1,

..., N— 1,

и х* (j Нк,

k — 0,

1, ■•■, N, имеем

 

 

Ck (хр =

Mk (хр x*k+l) + с *+1 (х;+1) ,

k — 0 , 1 , •.. , n

1 .

(7)

Возьмем произвольный путь, соединяющий шкалы Н0 и HN, про­

ходящий через точки х0, х и .... xN, Xi<=Hi

( i = 0,

1,

N). Так как

,v'i+i e % i , то согласно (5) будем иметь

 

 

 

 

 

 

 

 

С* (xk) <

Mk (xk, xk+\) -j- Ck+1 (л-'ft+i)•

 

 

 

Отсюда и из (7)

тогда следует

 

 

 

 

 

 

Mk (xk,

 

 

'Ск (xft) 0

Mk (xk, Xk-\-{) -f-

 

 

+ Ck+i (xa+i) — Ck (xk), k — 0, 1, . . . ,N — 1.

 

 

 

Просуммируем

это неравенство no k от нуля до N— 1.

Получим

 

 

N —1

 

 

 

 

 

 

 

 

 

£

Mk (**. ^ + ,) > Cn ( 4 )

-

с 0 (х-0) <

 

 

 

 

 

г = 0

 

 

 

 

 

 

 

 

 

 

N —1

 

 

 

 

 

 

 

 

 

 

^

^ft+l) ”Ь Одт (Хдг)

С0 (хи) .

 

 

 

Но

 

 

k= 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

С0(хр = inf С0 (х) <

С0 (х0),

 

 

 

 

поэтому

 

 

 

*6 н0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N —1

 

 

 

N — 1

 

 

 

 

 

 

J ]

Mk (*Р ^ +1) +

Ф (хр) < J ] Mk (xkt xk+i) + Ф (xN)

 

&=0

 

 

 

k = 0

 

 

 

 

 

 

для любых

путей, соединяющих шкалы

Н0 и HN. Таким

образом,

путь, проходящий через точки х*, х*, . . .

, хр, в

самом

деле,

крат­

чайший.

 

 

 

 

 

 

 

 

 

 

Если и *

(( )

и х *( / ) , /; < ^ < г ‘£+1, представляют

собой управление

и соответствующую траекторию, на которых приближенно реали­

зуется элементарная операция

(1) — (4)

при х = х\,

у = х*

v то

в качестве приближенного решения исходной задачи

(1.1—4)

мож­

но взять,

управление ц*(£) =

ы’ (^)

и

траекторию х* (/) =

х* (t),

1

(£ = 0 , 1, .... N— 1).

.

 

 

 

 

7*

196

ДИНАМ И ЧЕСКО Е

ПРОГРАММИРОВАНИЕ. ПРОБЛЕМА СИНТЕЗА

[Гл. 4

 

Аналогично доказывается,

что

путь,

проходящий [через точки

 

Xk ~

Х ^

 

1 = Ук (xf) 6 H k+li •• • ixff — УN—1(Xflf—1) б H n f

является

кратчайшим

между

 

точкой

 

и шкалой

HN. Это

означает,

что

функция уи(х) дает

нам

приближенное

решение

проблемы синтеза для задачи

(1.1— 4).

 

 

 

 

Заметим,

что определение кратчайшего

пути между шкалами

 

 

 

 

 

 

 

 

 

 

 

N—1

 

Н 0

и

по

описанной схеме

потребовало

перебора

•pt-+i+

 

 

 

 

 

 

 

 

 

 

 

£=0

 

+ ро величин, в

то

время

как

полный

перебор всех путей, как

нетрудно видеть,

потребовал

бы

сравнения

p0-p i-...■ри

величин.

Таким образом, уже при не слишком больших р* перебор с по­ мощью соотношений (5) по сравнению с полным перебором дает существенную экономию памяти ЭВМ и машинного времени. Такая

экономия

достигается в результате

того,

что при

вычислении

С ь(х ) из

(5) рассматриваются лишь пути, проходящие через все­

возможные точки xetffc и y ^ H h+l

и соединяющие точки y ^ H h+i

со шкалой HN кратчайшим образом, и тем самым все некратчай­

шие пути,

соединяющие у ^ Н к+{

со

шкалой

HN, из

рассмотрения

полностью исключаются.

 

 

 

 

4.

Для получения более точного решения задачи (1.1—4) не

ходимо взять более густую сетку

точек на

шкалах и увеличить

число шкал. Однако при этом число перебираемых величин, даже при использовании описанной выше схемы перебора, катастрофи­ чески быстро растет, и уже при небольших размерностях векто­ ров х и и становится невозможным решить задачу о кратчайшем пути за разумное время с помощью самых лучших современных ЭВМ. В этом случае часто используют прием, известный под на­ званием метода блуждающих трубок [171]. Суть этого приема за ­ ключается в следующем.

Сначала берут небольшое число шкал с небольшим количе­ ством точек на них и по описанной выше схеме поиска находят кратчайший путь 1\, соединяющий крайние шкалы Н0 и HN. Затем уменьшают шаг сетки на каждой шкале, путь U окружают некото­ рой «трубкой» из путей, проходящих вблизи 1\ по точкам новой сетки. Для построения трубки вокруг 1\ на каждой шкале обычно берут небольшие окрестности точки, через которую прохо­ дит 1\, и рассматривают пути, проходящие через выбранные точки. С помощью описанной выше схемы перебора находят кратчайший путь в полученной трубке; все пути вне этой трубки в переборе пока не участвуют. Таким образом получают новый улучшенный путь k, длина которого не превышает длины 1\. Далее, сохраняя прежние шкалы и точки на них, окружают путь 12 новой трубкой и находят следующее приближение /3 и т. д., продолжая процесс

§ 2] Схема Н. Н. Моисеева 197

до тех пор, пока трубка не перестанет «блуждать» и впервые по­ лучится равенство l s — l s+ и После этого измельчают сетку на каж ­ дой шкале, окружают путь ls новой трубкой и продолжают поиск кратчайшего пути описанным приемом блуждающих трубок. Про­ цесс измельчения сетки на шкалах и поиска кратчайшего пути указанным способом повторяют, пока два кратчайших пути, полу­ ченные после двух последовательных измельчений сетки, не совпа­ дут с удовлетворительной точностью. Затем увеличивают число шкал, т. е. сгущают сетку по времени, и повторяют процесс поиска методом блуждающих трубок с постепенным измельчением сетки на шкалах состояний до удовлетворительного совпадения двух по­ следовательных приближений. Попеременно измельчая сетку на шкалах состояния и сетку по времени, поиск с помощью блуждаю­ щих трубок продолжают до получения приближенного решения исходной задачи с достаточной точностью. Изменение шагов сеток на шкалах состояния и по времени должно быть согласованным; например, в случае равномерных сеток эти шаги должны удовлет­ ворять соотношению |Ал:| = о (А^) [169].

Оказывается, метод блуждающих трубок во многих случаях существенно сокращает число переборов, и с его помощью удалось решить многие практически важные задачи, ранее казавшиеся не­ приступными. В то же время следует заметить, что метод блужда­ ющих трубок позволяет определить, вообще говоря, лишь локаль­ но-кратчайший путь между крайними шкалами при фиксирован­ ной сетке, поскольку на каждом шаге в переборе участвуют лишь пути, попавшие в трубку. Другой прием поиска кратчайшего пути

между шкалами описан в работах [143, 145, 240].

 

5.

Успех в применении описанных в этом параграфе метод

приближенного решения задачи (1.1— 4)

во многом

зависит от

умения

строить элементарные операции

(1) — (4). По

существу,

элементарная операция представляет собой экстремальную задачу той же трудности, что и исходная задача. Однако малость отрезка **^ *< A + i позволяет здесь сделать ряд упрощающих предположе­ ний. Прежде всего, если, шаг сетки по времени достаточно мал, то элементарную операцию строят исходя из условий (1), (2), (4), полагая, что дуги траекторий, соединяющих точки соседних шкал, или не нарушают фазовых ограничений (3), или этим нарушением

можно пренебречь.

Далее, вместо минимизации функционала (1)

при условиях

(2),

(4) часто ограничиваются построением какого-

либо допустимого

управления и соответствующей траектории,

удовлетворяющих

условиям (2),

(4),

и в

качестве

длины дуги

Мг(х,у) берут значение функционала

(1)

на полученных управле­

нии и траектории.

 

 

 

 

 

 

Во многих задачах полезно задаться каким-либо семейством

управлений

u ( t ) = u ( t , сь ...,

ст),

зависящих от

параметров

Си Сь ■■■, ст

 

например,

это могут быть алгебраические или

198

ДИНАМ И ЧЕСКО Е ПРОГРАММИРОВАНИЕ. ПРОБЛЕМА СИНТЕЗА

[Гл. 4

тригонометрические многочлены с коэффициентами С\, ..., ст, или кусочно-постоянные функции со значениями сь ст и т. п. Зна­ чения этих параметров затем можно определить из системы п уравнений с т неизвестными

х+1

^■+1

 

j

х (t) dt = J f{x(t), u(t, Cy, c2, . . . ,cm) ,t ) d t = y — x,

(8)

. . .

используя для этого различные методы [19]. Если т > п , то пара­ метры С], ..., ст отсюда будут определяться, вообще говоря, неод­ нозначно, и свободные параметры можно использовать для мини­ мизации функционала (1). Для упрощения системы (8) дифферен­ циальное уравнение (2) часто заменяют более простыми уравне­ ниями

*(*) = f ( x , u (0, 0 . или x(t) = f (

и (0.

или другими более точными разностными уравнениями [171]; здесь возможно использование линеаризованной системы

x{t) = f (х, и (/), t) + (fx {х, и (<), t), х (/) — х).

При решении задачи (1), (2), (4) часто применяется также прин­ цип максимума в сочетании с различными упрощающими приема­ ми, описанными выше. Другие способы построения элементарных операций и примеры решенных конкретных задач см. в работах

[169, 171].

§3. ДИФФЕРЕНЦИАЛЬНОЕ УРАВНЕНИЕ Р. ВЕЛЛМАНА

Вэтом параграфе будет введена функция Веллмана для .ис­ ходной задачи оптимального управления и получено дифференци­ альное уравнение Веллмана, являющееся предельным для уравне­ ния (1.13) при неограниченном измельчении сетки по времени. Ограничимся рассмотрением частного случая задачи (1.1— 4 ): ми­ нимизировать функционал

J(u) =

j f ° ( x , u , t ) d t +

<S(x(T))

(1)

 

и

 

 

при условиях

 

 

 

* = /(*,

и, i ) , t o < t < T ,

x(t0) = x0,

(2)

u(t) кусочно-непрерывна, и (t) 6 V, t0 <Ct К Т ,

(3 )

S 3]

Дифференциальное уравнение Р. Беллмана

199

где моменты t0 ,Т и точка х0 предполагаются известными; множе­ ство V замкнуто и от t не зависит. Будем также предполагать, что функции f°(x,u,t), f(x,u,t), Ф (х) непрерывны по совокупности своих аргументов. Наряду с этой задачей нам понадобиться следую­ щая вспомогательная задача: минимизировать функционал

г

J* (х, Ы) = J

(X(т), и (т), т) dx + Ф (х (Т))

 

(4)

при условиях

 

 

 

 

 

 

 

 

x{x) = f (х (х), и{х),х),

t < X< Т,

х (0 =

х,

 

(5)

и(х) кусочно-непрерывна,

и(т ) е У ,

 

 

 

(6)

где точка х и момент t,

 

 

Т,

фиксированы. Через

А (х, t)

обозначим множество всех управлений и = и ( х ) ,

t^ix<Z.T,

таких,

что: 1) выполнены условия

(6); 2)

соответствующие

траектории

х(х,и) системы (5) определены на всем отрезке kO <C7\

 

Введем функцию

inf

J 1(х,

и) = В (х, t),

называемую функ-

недм)

 

Покажем,

что

при

некоторых

цией Беллмана задачи

(1) — (3).

предположениях функция В (х, t) удовлетворяет дифференциально­

му уравнению с частными производными

специального

вида.

А именно будем предполагать, что: 1) функция B(x,t) непрерывно

дифференцируема по совокупности (х, *); 2)

для всякого

и е У и

всех х, t, t o ^ t c T , найдется ДС>0, ^ + А ^ Г ,

и кусочно-непрерыв­

ное управление а ( т ) е У , t-\-At<^.x<^,T, такие,

что управление

 

В (т) = / “'

 

 

+

 

(7)

 

1 v(x),

t + A t < x < T ,

 

 

принадлежит A(x,t)\ 3) для всех х,

t,

t0^ . t < T ,

нижняя грань

функционала (4)

при условии

(5) — (6)

достигается

хотя бы при

одном управлении

u * (t)e A (x ,i) и соответствующей

траектории

х(т, и*).

 

 

 

 

 

 

Следует сразу же заметить,

что

сделанные

предположения

1)— 3) сильно сужают класс рассматриваемых задач оптимального управления. В частности, функция Беллмана B(x,t) может не быть непрерывно дифференцируемой даже в простейших задачах опти­ мального управления (см. ниже упражнение 7).

Пусть В

(t -f At),

и * ) , t +

At) = J {+At (x (t + At, и ) ; и**),

и " =

и ** (т) б А (х (t +

At,

и *), t +

At),

A f> 0 .

Так как управление

 

 

 

 

 

 

 

и(х)

-

и*(х),

t < £ x ^ t

+

At,

 

 

 

 

 

 

и"(г), t + A t < x < T ,

Соседние файлы в папке книги из ГПНТБ