Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Васильев Ф.П. Лекции по методам решения экстремальных задач

.pdf
Скачиваний:
16
Добавлен:
25.10.2023
Размер:
14.17 Mб
Скачать

220

ДОСТАТОЧНЫЕ УСЛОВИЯ

ОПТИМАЛЬНОСТИ

[Гл. 5

и,

наконец,

 

 

 

^ o W = f o W + « W и inf

г0 (х) = romln +

а ( д

 

х£Хи

 

отличается от r0min на постоянную а(/0). Поэтому в теоремах 1, 2

без ограничения общности можем принять ,Rmin(0 = 0 ,

 

С учетом этого замечания из теорем

1, 2

имеем следующие ус­

ловия для определения функции Кротова:

 

 

 

R (х, и, 0 = (К , (х, t), f (х,

и, t)) + K t (х,

tj +

(x, и, t) > 0,

(13)

(х, и) е

Dt, t0< t < C T ,

 

 

ri(x) = К(х,

Т) - f Фх(л:) > 0 ,

х£Хт,

(14)

r0{ x ) = K ( x , t 0) + <S>0{ x ) > r min,

x e X t„

(15)

причем здесь неравенства превращаются в равенства при x = x * ( t ) ,

u = u * ( t ) в случае теоремы 1

(разумеется,

в (14) и (15) равенства

должны получиться при х = х * ( Т )

и x = x * ( t 0) соответственно), а в

случае теоремы 2 равенства

в (13) — (15)

достигаются в

пределе

при k-*--)-оо в следующем смысле:

 

 

 

J R (Xk (0-

и* (0 , t)dt-*~0, rx (xk (Т)) -> 0,

 

r o (x k

( Q )

omin

( k

o d ) .

 

Задачу (13) — (15)

назовем задачей Коши Кротова.

Эта за ­

дача необычна тем, что, во-первых, здесь имеем дело не с диффе­ ренциальными уравнениями, а с дифференциальными неравен­ ствами с частными производными, во-вторых, эта задача тесно

связана с конкретной допустимой парой

(х* (t), и* (t))

или после­

довательностью допустимых пар (Xh(t),Uh(t)), k = \ , 2,

..., которые

подозреваются на

оптимальность

и

на которых

неравенства

(13) — (15) должны

превратиться

в равенства в указанном выше

смысле. Такие задачи на сегодняшний день почти не исследованы. Заметим также, что удобное для работы конструктивное опи­ сание множеств Dt, Xia, Хт часто отсутствует, что затрудняет прак­

тическое использование задачи Коши — Кротова в столь

общем

виде (13) — (15). Поэтому полезно рассматривать задачу

Коши —

Кротова при некоторых упрощающих предположениях. В

частно­

сти, в соответствии с соотношениями (9) в задаче (13) — (15) мно­ жества Dt, Xto, Хт можно заменить на множества G(t) X K (t) (или

даже En'XV(t)), G(t0), G(T)

соответственно. В ряде случаев функ­

ция K ( x ,t )

может быть найдена из условий

 

inf

[(Kx (x,t), f (х, и,

t)) + Ki(x,t) + P ( x ,u ,t )] = 0,

(16)

uBV-t

§ п

Задачи с закрепленным временем

221

 

х £ Х и

t0< t < T ,

 

 

 

К ( Х , Т ) ^ Ф 1(Х),

х е х т,

(17)

 

К (х, t0) + Ф0 (х) > r0min,

л: 6 Xta,

(18)

где Vt — проекция множества

Dt на пространство Ег\ иногда мно­

жество Xt здесь

можно заменить на

G(t)

(или даже на Е п), мно­

жество Vt — на

V(t). Следует, однако, помнить, что подобные уп­

рощения задачи

(13) — (15) могут не привести к цели,

ибо упро­

щенная задача может не иметь решения, в то время как задача

(13) — (15)

может оказаться разрешимой.

 

 

 

 

 

Знание

функции K(x,t) из

(16), (17) и функции

u ( x ,t ) ^ V t,

на которой достигается

нижняя

грань в (16),

позволяет найти оп­

тимальную

траекторию

задачи

(1 )— (4):

для

этого

сначала

надо

найти точку x0£Xt. из условия r0 (х0) —

inf

г0 (х) ,

затем решить

 

 

 

X&xt0

 

 

 

 

задачу Коши x = f ( x , u ( x , t ) , t ) ,

 

x(t0) — x0. Оптимальность

получающейся траектории x(t)

и управления

u ( t ) = u ( x ( t ) , t )

вы­

текает из теоремы 1. Если же нижняя грань в

(16) или

inf г0(х)

не достигаются, то, зная функцию K(x,t)

из

(16),

(17)

Х^х и

 

и пользу­

ясь теоремой 2, можно построить минимизирующую последова­ тельность для задачи (1 )— (4).

Нетрудно видеть, что изложенный выше подход к задачам оп­ тимального управления тесно связан с динамическим программи­

рованием и является его естественным

обобщением.

А именно

уравнения (16), (17) при замене

на

V[t), Хт на GT превраща­

ются

в уравнения (4.4.5—6), и в

этом

случае функция Кротова

K(x,t)

тождественно совпадает с функцией Веллмана

B.(x,t). По­

вторив рассуждения §4 гл. 4 легко убедиться, что для функции

K(x,t) из

(16),

(17)

справедливы утверждения теорем

4.4.1— 4

для задачи

(4.4.1— 4).

 

что функция Кротова K(x,t)

 

Однако следует сказать,

опреде­

ляется из

более широких условий (13)

— (15), и она может суще­

ствовать даже

тогда,

когда

функция

Веллмана не существует.

Далее^ подход Кротова позволяет установить оптимальность допу­ стимых пар или последовательностей, не решая задачу синтеза, так как при этом подходе проводится более тонкое, чем в динамиче­ ском программировании, индивидуальное исследование каждой до­ пустимой пары или последовательности, подозрительной на опти­ мальность. В то же самое время, когда нужно решать проблему синтеза, связанную с задачей (4.1.1—4), метод Кротова превра­ щается в метод динамического программирования. Такая гибкость

метода Кротова делает его весьма привлекательным.

г

Упражнение. Минимизировать функционал J (и) = j" (и2 — хг) dt

222 ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ |Тл. 5

при

условиях

x — u{t),

х(0) = х ( 7 ) = 0 .

Показать,

что

пара

* * ( 0 = 0 , ы * ( ^ ) = 0 является

оптимальной

при 0 < 7 < ; я .

 

У к а з а н и е .

Функцию Кротова искать в виде К(х,

t) =ф (t)x2.

§

2. ДОСТАТОЧНЫЕ

УСЛОВИЯ ОПТИМАЛЬНОСТИ

ДЛЯ

ЗАДАЧ

 

 

С НЕЗАКРЕПЛЕННЫМ ВРЕМЕНЕМ

 

 

 

Рассмотрим задачу: минимизировать функционал

 

 

 

т

 

 

 

 

 

 

 

 

 

 

J(u,

tQ, Т) = j /о (0,

и (0, 0 dt + Ф0 (х (t0), g + Фх (х (7), 7 )

(1)

 

^0

 

 

 

 

 

 

 

 

 

 

при условиях

 

 

 

 

 

 

 

 

 

 

 

 

x(t)

=

f ( x ( t ) <u(t), t),

t0 < t < T ,

 

 

(2)

 

 

 

x(t)eG (t),

t0 < t < T ,

'

 

(3)

 

u — u ( t)^ V (t), u(t)

кусочно-непрерывна при

/ о ^ ^ 7 ,

(4)

где моменты t°, 7 в отличие от задачи

(1.1—4) неизвестны

п под­

лежат определению из условий

 

 

 

 

 

 

 

 

 

0

€ То,

7 6

,

t0

Т ,

 

 

(5)

то, Ti — заданные множества на числовой оси — о о < ^ < ; + оо. В ча­

стности,

если

/ °= 1, Ф о = Ф 1=

0 , то

придем к задаче быстродей­

ствия.

 

 

пару (x(t), u(t)),

 

 

Как и в §

1,

удовлетворяющую

условиям

(2) — (4),

назовем

допустимой

на отрезке ^о=£г^^7, и множество

всех допустимых

пар на этом

отрезке обозначим через

D[tt, 7].

Объединение множеств D[t0,.T] по всем to, 7, удовлетворяющим ус­

ловиям

(5), обозначим

через D. В пространстве

Е пх Е г введем

множество Dt точек i(x,

и) следующим образом:

(х,

u ) ^ D t, если

существует допустимая

пара (х(т), « ( т ) ) е О , такая,

что x ( t ) — x,

u ( t ) = u

(в точках разрыва управления для определенности примем

u ( t ) = u ( t —0 )). Проекцию множества Dt на пространстве Еп обоз­ начим через Xt, проекцию Dt на Ет— через Vt. Очевидно, Xt^ G (t ), Vt<=V(t), Dt^XtXVt.

Величины

to в т0,

7* 6 ту и пару ’(х* (/),

и* (/)) 6 D j/o, 7*] назовем

оптимальными,

если

 

 

 

 

 

 

 

 

V (a *(0 , й, Т*) =

inf J (и, g

7 )

= 7*,

 

 

где нижняя грань берется по всем

(t), и (t)) 6 D

[ g

7]

при все­

возможных t06 т0, 7 6 ту.

 

 

 

 

 

 

Скажем, что последовательности

 

 

 

 

 

to,k 6 т0,

Тк е тъ

(xk (0, uk (t)) e D [ t 0,k, Tk]

(k =

1,

2,

. . . )

§ 2} Задачи с незакрепленным временем 223

минимизируют функционал J (и, t0,

Т),

если

 

 

 

J { U k ,

t 0k , Tk)->-J*

(As-»-оо).

 

Для

формулировки

достаточных

условий оптимальности, как

и в § 1,

введем функции:

 

 

 

 

 

R (x, и,

t) = (Кх (х , t), / (х,

и, t)) + K t (х, t) + f° (х,

и, t),

г0 (х, t0) =

К (х, t0) + Ф0 (х, t0),

гх (х, Т) = — К (х, Т) +

Фх (х, Т),

где К (х,

t) — кусочно-непрерывная

и

кусочно-гладкая

функция при

х £

^omln ^ ^ ^maxi

^Omin == i^f ^0>

Дпах =

SUP ^

 

 

"to

 

Т,

(предполагаем, что t0mln<CTmax).

и функция R(x{t), t)

переменной t

Если (x(t),

u(t))^D [tQ, Т]

непрерывна и кусочно-гладка при t0^ t ^ . T ,

то, как и в лемме 1.1,

нетрудно убедиться в справедливости представления

 

j (t), g

T) = $R(t), U(0 , t)dt+

ГХ (xсг), т)+

Г0 ( х ( g ,

д .

(6)

 

 

ta

 

 

 

 

 

 

Т е о р е м а

1.

Для того

чтобы

последовательности

 

то,

Th^xi,

(Xk(t),

uh( t ) ) ^ D [ t 0, h,

7V|,

As=l, 2, ...,

минимизировали

функционал J (и,

t0, T), достаточно

существования такой

функции

К(х, t), что:

1)формула (6) верна для любой допустимой пары (x(t),

u(t))^D[t0, Т] при всех /0^то, Т е т i;

 

 

T k

 

 

 

Rmia (t) =

 

R (x, и, t) = 0;

 

2)

Пш

Г R (xk (t), uk (t), t) dt =

0,

inf

 

 

fc-»oo

J

 

 

 

 

 

tx ,u )£ D f

 

 

 

 

 

'oft

 

 

 

 

 

 

 

 

 

 

 

3)

lim rx (xk {Tk), Tk) = rlmin =

inf

inf

rx {x, T),

 

 

 

 

 

k-too

 

 

 

Г£Т| х£Х"р

 

 

 

 

 

 

 

lim r0 (xk (tok),

tok) = romin =

 

inf

inf

rQ(x,

t0).

 

 

 

 

ft-»°°

 

 

 

;0£T0

x £ X ' t 0

 

 

 

 

(Для получения формулировки достаточных

условий

оптимальности

для фиксированных й 6 т0, Т* 6 тъ

(x' (t),

и' (/)) 6 D[t0, Т*] в

этой тео­

реме надо

принять g

=

fj, Tk =

Т*,

xk (t) = л *

(/),

uk (t) =

u*(t),

и

все предельные переходы заменить простыми равенствами.)

 

 

Д о к а з а т е л ь с т в о .

Возьмем

произвольные

 

£0 6 т 0,

Г 6 тх

и

(x(t),

u ( t ) ) e D [ t 0,T].

Согласно формуле

(6) будем иметь

 

 

 

J ( и

(* ) . Ч ,T) — J(u k (t), g ,

Tk) =

j

R {x (t), и (t), t) dt —

 

224 ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ [/Vi. 5

— $ R(xk (0. «ft (0. О dt +

r1 (X {Т), Т) — rx (xk (Tk), Tk) +

*0к

 

+ го(х ( g , д

r0 {xk (to k ) , д ) . i

Так как правая часть этого равенства по условию теоремы имеет

предел при £->оо, то и левая часть имеет предел.

Поэтому

J (u(t),t0,T ) — lim J ( u k (t), g, Tk) =

т

 

 

 

 

f \R(x(t), u(t), t) — Rmin(t)]dt +

 

ft-»0O

 

*0

 

 

 

 

 

 

 

 

 

 

 

 

+ r i (x CO> T Y— rimin + r0 (x (g, g

—/-omln > o,

откуда

J {u (it), g T) > lim J (uk (t), g, Tk)

 

 

 

 

 

 

 

f t - * oo

 

 

 

 

 

при любых f0 Gr0,

T £ tx,

(x(t),

u (t))£ D [t0,T ].

Следовательно,

J* =

in f У (a ,

g Г )

> l im J (uk (i),

g ,

T ft) .

 

 

 

 

ft-»00

 

 

 

 

Однако У (г/А(г1),

g, ТА) > У* при всех

/г — 1, 2, . . .

,

поэтому

 

 

lim J (uk (t), g ,

Г*) =

J\

A

 

 

 

 

ft-*00

 

 

 

 

 

 

 

В теореме

1

множество

Dt часто

заменяют

на G (i)x V (t ),

XtD— на G(t0),

Хт— на

G(T)

(см. замечание к

лемме 1.2). Дей­

ствуя по аналогии с § .4 гл. 4 и § 1 настоящей главы, предлагаем читателю самостоятельно выписать задачу Коши— Кротова, а так­ же рассмотреть вопросы приближенного решения проблемы синте­ за для задачи i(l) — (5).

П р и м е р

1.

Требуется

наибыстрейшим

образом

перевести

точку

х — (х1, х2)

из

начала координат

(0,

0)

в точку (1, 0) при

условии, когда движение точки подчиняется условиям

[236]

 

х1 = -

(х2)2+

и2, . х2 =

и, \ u (t)\ < l,

0 < * < 7 \

Здесь

G (0)

=

{(0,

0)},

G (Г) = {(1,

0)},

G (t) =

Ел при 0< t < T

V (0 =

{ « : « € g ,

|ы |<1},

т0 = {*0 = 0},

т1 =

{ Т : Т > 0 } ;

 

 

 

 

 

 

 

J(u , Т) = Т.

 

 

 

 

 

Построим последовательности: 1) {Tft}, где

Tk — корень уравне­

ния

(Т — 1)3 = 1 2 ( Т '—

1)------,

расположенный

в

пределах

1 < Т < 1 + & - 2 / 3 ( £ =

1,

2 , . . . ) ;

2) {uk (t)},

0 < ^ < Г й, Тде

«ft(0 = + 1

при

Y

< t:

 

+ ~ и ’

т

=

°, 1,

••• I k - l ,

§ 2]

 

 

 

 

 

Задачи

с незакрепленным

временем

 

 

 

 

225

И при

 

 

 

 

 

+

])‘>

“ * ( * ) =

1

ПРИ

 

 

 

 

 

 

 

-|— — <

г! < — +

— ,

m =

0 , 1 , . . . ,

k — 1,

и при

 

k

 

2k

 

k.

 

k

 

 

 

 

 

 

 

 

 

*

 

у - (Tk +

1) <

t <

Tk\

3)

{xk (t)} =

{ ( 4 (t),

x\ (0} — траектории,

соот­

ветствующие

управлению

 

uk (t),

0 -< t -< Tk;

 

4

(0) =

4 (0) = 0,

4 ( 7 4 = 1 ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

_

4 _

 

 

 

 

 

 

 

 

 

_ _ 2 _

 

 

4 ( 7 ’*) =

0,

( 1 a

3 j * <

4 ( 0 <

t,

о < 4 ( 9

<

*

3 .

 

 

 

 

 

 

0 < ^ < 7 1*,

 

k =

l ,

2 , . . .

 

 

 

 

 

 

Покажем,

что

 

1

=

Г*,

где

Т ‘ — оптимальное время.

Для

этого возьмем функцию 7( (х, 9 =

х1.

Тогда

R (х,

и,

t) = (х2)2—

— и8 +

1;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ini

 

inf

R(x, и, t)= 0 ,

 

Г

R {xk {i),

uk {t),

t)dt =

1k

(9 ? d t -

 

 

j

14

*6£t

1U|<1

 

 

 

 

 

J

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

-

j

 

( k

(o i2— i ) ^ =

 

J

i4 (o i2^-^o(yfe

oo);

r0(x,

0) =

0

 

0

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

при

x 6 G (0);

rx (x,

T) =

1

при x £ G

(T ) , T >

 

0.

 

Кроме того,

очевидно, формула

(6)

справедлива для всех до­

пустимых

{x{t),

u (t))^ D [0,

Т], T^zO. В силу теоремы 1

тогда J(u h,

Th) =

ТЙ-И =

Т*

(Т* — оптимальное время). Минимизирующие по­

следовательности Th,

xk (t),

uk (t),

k — l,

2,

...,

для

рассматривае­

мой

задачи построены.

Остается

заметить,

что эта

задача

опти­

мального решения не имеет, т. е. inf/(«, Т) не достигается, и мы имеем дело с так называемым скользящим режимом [63, 142].

Приведем еще одно достаточное условие оптимальности, ка­

сающееся задачи быстродействия.

 

 

 

Т е о р е м а

2.

Пусть

в задаче (1 )— (5): / °= 1,

<p0= O i = 0 ,

ц = { Т : Т ^ и } ,

начальный

момент to закреплен. Пусть имеются

последовательности

Tk& u

(xh(t),

uh{t))^ D [t0, Th] (6 = 1 ,

2, ...),

где Tk- + T * > t 0. Для того чтобы Т*

было оптимальным

временем,

достаточно существования функции К(х, t), такой, что:

(x(t),

1) формула

(6)

верна

для любой допустимой

пары

u(t))^ D [t0, 7] при всех T ^ t Q\

 

 

 

8 Ф. П. Васильев

226 ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ [ Г л . 5

2)

Нш f R(xk (t),

uk (t),

t)dt =

f Rmln(t)dt, Rmin(t)= ini R(x,u,t)

 

k-><x> J

 

 

J

 

(x ,u )e D t

3)

| [Rmln(t) — 1] dt< 0

при любых

T, t0 <CT< 7 ” ;

4)

lim rx (xk (Tk) ,

Tk) = rxmln =

inf

inf

rx {x, T ),

 

k-*oo

 

<0< Г < Г * x £ X T

 

iim rQ(Xfc (ty), t0)

Tqm;n

inf

Гд(х,

tq).

 

fe->oo

 

x£Xf0

 

 

 

(Для получения формулировки достаточного условия оптимально­

сти для

фиксированных T * > t 0,

(х*(0> и* (t))^ D [t0, Т*]

в

этой

теореме

надо принять Th= T * ,

xk ( t ) = x * ( t ) ,

Uk(t)— u*(t)

и

все

предельные переходы заменить простыми равенствами.)

 

 

Д о к а з а т е л ь с т в о . Пусть

выполнены

все условия теоремы,

и пусть тем не менее Т* не является оптимальным временем. Тогда

существуют момент Т и пара

(x(t),

u (t))^ D [t0, Т],

такие,

что

Т<С.Т*. Согласно формуле (6) будем иметь

 

 

 

 

 

 

 

-

 

 

 

 

 

 

г

 

 

 

 

 

 

J{u ,

T ) - J ( u k (t), Tk) =

T

- T

k =

$

R(x (t),

и (t), t ) d t -

 

 

Tk

 

 

 

 

 

 

 

to

 

 

 

 

 

 

 

 

Uh (t) ,t ) d t

+

rx (x (T) , T

) - r x (xk (Tk),

Tk) +

 

 

- J

R (Xk (f),

 

 

 

 

 

 

r0 (x (t0) ,

t0)

r0 (xk (t0), t0).

7'•

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Отсюда при

k

+ oo получим

T — T* =

J Rmin (t) dt +

 

 

 

 

 

 

 

 

 

 

 

 

*0

 

 

 

+

J R{x{t),u(t),

t) dt -j- тX(x (T) , T)

f

-\r rQ(x (tQ), tQ)

/'omln^’

 

to

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

T*

 

 

 

 

 

 

 

 

 

 

 

 

 

 

>

- ]

RmlA t ) d t > T - T \

 

 

 

 

Полученное противоречие доказывает теорему. А

 

 

 

 

П р и м е р 2.

Пусть требуется наибыстрейшим образом переве­

сти точку х =

(хх, х2) из положения

(1, 0)

в начало координат (0,0)

при условии,

когда движение точки подчиняется условиям х х— х2,

х2= и , \u(t) | < 1, 0 ^ < Г .

 

 

 

 

 

 

 

 

 

 

Возьмем

Т* =

2; u * ( t ) = — 1 при 0'==£^И

и м * ( 0 =

+ 1

при

K

f ^ 2 ;

соответствующую траекторию at'* ( 0 =

1—0.5i2 при 0 ^ ^ ^

< 4

и X х*

( 0 = 0 . 5 (t—2 )2

при

1й £/<2; x2* ( t ) = —t при

 

 

и

/

§ 3]

Дискретные

управляемые

системы.

Оценка

погрешности

. 227

x2*(t) =st—2 при

1 ^ ^ 2 .

Указанные

управления

и траектория

легко

находятся

из

принципа

максимума

(см. пример 3.2.2.).

Покажем, что они являются оптимальными. Возьмем функцию

К(х, t ) = x l(t— 1)х2. Тогда

R(x,

и, £)

 

-х2+ /(х=-гг+К *+1 =

= _ ( i _ l )M + l t

r0(x,

0) s= 1

при

x e G (0 ) =

{(l, 0 )}, r,(x,

T ) = 0

при .ie G ( r ) = {(0,

0 )}. Очевидно,

 

 

 

 

 

 

 

inf

M R {x ,

u,

t ) ^ — \t— Y\+l = R

ln(t)=R (x*(t),

 

t),

x € E a |u|<l

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

2

 

 

 

 

 

 

*

 

 

[/?mln (0 —

1 ]^ ----- JU —

 

 

 

 

 

 

T

 

 

 

 

 

 

 

T

 

 

 

 

 

 

при всех Г<С2,

и формула

(6)

верна

для всех допустимых пар.

В силу теоремы 2

момент Т* =

2 и пара t(x*(t), u *(t))^ D [0,

2] оп­

тимальны.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Заметим, что функция Веллмана в этой задаче име'ет разрывы

первой производной как раз на оптимальной траектории [24,

195], в

то время как функция Кротова К(х,

t) является

просто много­

членом.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Упражнения.

1.

Решить проблему синтеза для задачи быстрей­

шего перевода точки х = (х1, х2)

из заданного состояния

(х),,

х2) =

= х 0фО в начало координат при условиях

 

 

 

 

 

а)

х1 =

ха,

х2 — и (t),

| и (*)[< 1 ,

0 < ^ < 7 ’;

 

 

 

б)

хх =

х2,

х'2 =

хх +

u{t),

| и (*)|<1,

0 < / < Г ;

 

 

в)

х1 =

х2 +

их,

х3 =

х1 -(- и2,

|и£(/) |<

1

(t = 1,

2),

0 .< * < 7 \

2.

 

Перевести точку х = (х1, х2,

х8) из начала координат в то

Xi = (а,

0, 0) быстрейшим образом,

если

х1 =

х3, х2 =

х3,

х8 = u(t),.

| и ( 0 1 < К

0 <

t < Т ;

а — const. Показать,

что оптимальное

время

Т* = р

3 2 1а |.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

У к а з а н и е . В задачах 1—2 функцию Кротова искать в виде многочлена первой степени по х с коэффициентами, зависящими от времени.

§ 3. ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ д л я ДИСКРЕТНЫХ УПРАВЛЯЕМЫХ СИСТЕМ. ОЦЕНКА ПОГРЕШНОСТИ

1. Рассмотрим задачу: минимизировать функционал

N

 

1 ([“.]) = £ Pt (xh Щ) + Ф0 (х0) ф- Ф1(xN)

(1)

{=0

 

8*

228

 

ДОСТАТОЧНЫЕ

УСЛОВИЯ

ОПТИМАЛЬНОСТИ

\Гл. 5

при условиях

 

 

 

 

0, 1, 2 , . . . , N - 1,

 

 

 

X{+i — Fi (Xj, U;),

£

(2)

 

 

xt 6 Gi,

щ 6 Vit

£ =

0 , 1 , 2 , .

N,

(3)

где

 

 

 

 

 

 

 

 

 

 

-

x, =

(x[,

Xi, . . . , Xi),

Fi =

(Ft,

. . .

, F i),

щ =

(«i..........,

uri): mho-

жества

GiCZEm, ViCZEr, £ =

0,

1,

. . . , N, заданы; функции F{ (х, и)

определены при (х,

u )^ G iX V {,

£ = 0 , 1,

N,

/ = 0 , 1,

п\ функ­

ции Ф0(х) и ФДх)

определены при х е О 0

и x e G lV соответственно;

£— дискретное время,

£ = 0 ,

>1,

 

N, момент N будем считать из­

вестным;

 

 

 

 

 

 

 

 

 

 

Как мы убедились в §

4.1, к таким задачам приводит разност­

ная

аппроксимация

задачи

оптимального управления с

непрерыв­

ным временем. Задача (1) — (3) имеет также и самостоятельный интерес и возникает при описании управляемых систем с дискрет­

ным временем ([6, 26, 59, 119, 196,

231, 234] и др.).

 

 

 

 

 

Если задать управление [и ,]=

(ц0,

«ь •••,

uN) и начальное усло­

вие х0— а, то из уравнений

(2) однозначно

определяется дискрет­

ная

траектория [хг] = (ха, х и

..., хк).

Пару

([xf],

[цг])

назовем до ­

пустимой, если она удовлетворяет условиям

(2),

(3).

Множество

всех

допустимых

пар обозначим

через D.

Допустимую

пару

( [ * ] ,

[«*]) назовем оптимальной,

если

I ([«Л) = inf / ([«,-]) = !*■ П°~

следовательность

допустимых пар

 

 

 

D

 

 

назо­

([лег,*], [г^,Л),

/г= 1,

2,

...,

вем

оптимальной,

если она

минимизирует

функционал

(1),

т. е.

 

 

П т / ( К Л ) =

/ * .

 

 

 

 

 

 

 

 

k-*oo

 

 

 

 

 

 

 

 

2.В пространстве. Е пх Е г введем множество D, точек (х,

следующим образом:

(х,

u)^ D i,

если существует допустимая пара

([хт ], Ы е й

, такая,

что Xi =

x,

щ = и. Далее,

через Xi обозначим

множество всех

тех x e G i, для

которых существует

хотя бы

одно

и^. Vi такое,

что

(я, u)^D i.

 

 

 

при x ^ X it i — 0,

 

Возьмем

функцию К Д х),

определенную

1, ...,

..., АТи положим

 

 

 

 

 

 

 

 

 

 

 

R t (х, и) = К с+1 (Е; (х,

и)) — Ki {х) +

F°i{x, и),

£

=

0,

1, . . . , N — 1,

Г0(х) = Ко (х) -(- Ф0 (х),

Г2 (X,

и) =

К.И (х) 4-

Фх (х)

-j- F^j (х,

и).

 

 

 

 

 

 

 

 

 

 

 

 

(4)

С помощью э т т

функций значение функционала

(1)

на любой до­

пустимой паре можно представить в виде

 

 

 

 

 

 

 

N —1

 

 

 

 

 

 

 

 

 

 

I ([«Л) =

£

Яг (Xj,

Щ) + Гх (xN, uN) +

rQ(х0).

( 5 )

1=0

§

3]

 

Дискретные управляемые

системы.

Оценка

погрешности

229

В

самом деле,

 

 

 

 

 

 

 

 

 

 

 

 

 

£

 

( * t, “ ;)

=

£

I K i+ i (A'i+i) —

K i

( * ;) ]

+

£

F ?

(x £, u t) =

 

1=0

 

 

 

i=0

 

 

 

 

 

£=0

 

 

 

 

 

 

 

Ко( x o) " T

JV—1

 

 

 

 

 

Гl ( X j V ,

 

 

 

— /^ . W (-*-j v )

 

/ * £ ( - ' - i ,

W ; ) — / ( [ ^ i ] )

 

^ v ) '

/ о ( ^ o ) ,

 

 

 

 

 

 

 

t= 0

 

 

 

 

 

 

 

 

 

что равносильно

(5).

 

 

 

 

 

 

 

 

 

 

 

Т е о р е м а 1. Для оптимальности последовательности допусти­

мых пар

([x£ift], [«г, d ),

k — \, 2,

достаточно существования функ­

ции Ki(x),

i = 0 , 1,

 

N, такой,

что:

 

 

 

 

 

 

 

 

1)

lim Ri(xik,

uik) = R imin=

inf Rt (x, u),

i =

0,

1 , . . . , Л/-— I;

 

 

f t - » o o

 

 

 

 

{ x , u ) £ D ^

 

 

 

 

 

 

 

 

2)

lim /y^fc,

uNk) ' = r lmln=

inf

гх (х,

u)\

 

 

 

 

 

f t - » o o

 

 

 

 

 

( Л , u ) £ D n

 

 

 

 

 

 

 

 

lim r0 (xok) =

r0mln =t inf r0 (x).

 

 

 

 

 

 

 

 

 

k -*o o

 

 

 

 

x £ X 0

 

 

 

 

 

 

 

 

{ Для

получения

формулировки

достаточного

условия оптимально­

сти для

фиксированной пары

([х*],

[«*])££)

здесь

надо

принять

 

 

 

 

Хц,

=

х\,

uik =

и\,

i =

0,

 

, N,

 

 

и все предельные переходы заменить равенствами.)

 

 

 

Д о к а з а т е л ь с т в о .

Возьмем

произвольную допустимую па­

ру ({*,•], [«г]). С помощью формулы (5) имеем

 

 

 

 

 

 

 

 

 

 

N —I

 

 

 

 

 

 

 

 

 

 

^ ([“ (•])

 

^ ([Uift]) =

^ [Ri(Xi,

«;)—

R i ( x ik,

U,-ft)I+

гг (xN,

UN)

 

 

 

 

 

 

i=0

 

 

 

 

 

 

 

 

 

 

 

 

rx (xNk,

uNk) +

r0 (x0) — r0 (x0lft) ,

k = 1,

2, . . .

 

В этом равенстве можно переходить к пределу при k-^-oo, так как правая часть по условию имеет предел. Получим

/ ([££;]) — lim / ([uik]) =

N — I

[Ri (xh щ) Rtmin] +

V

fcM0

i=0

 

 

-f- 1 \ (XjV,

U ]\i) 1 \ min ~T

! o (X a)

r 0 min ^ 0 •

Следовательно,

 

 

 

 

 

/* = inf / ([u£]) >

lim

/([«i,ft]).

 

D

 

k-bOQ

 

Однако / ([«г,*]) > Г ,

k — \, 2, . . .

 

,

поэтому lim /([uift]) = Г .

k - *o a

Соседние файлы в папке книги из ГПНТБ