Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Diplom_SamoylovAL.pdf
Скачиваний:
17
Добавлен:
23.02.2015
Размер:
7.89 Mб
Скачать

Известно, что негладкая функция цены ( , ) (5.4) удовлетворяет краевому условию (5.7) и уравнению Беллмана (5.6), (5.5) в точках дифференцируемости. Согласно теории обобщенных (минимаксных/вязкостных) решений уравнения Га­ мильтона-Якоби [14, 17] справедливо следующее утверждение

Теорема 1. Если в задаче (5.1)–(5.4) выполнены условия 14, то существует и единственно минимаксное/вязкостное решение краевой задачи (5.7) для урав­ нения Беллмана (5.6), (5.5), причем это решение совпадает с функцией цены задачи (5.1)–(5.4).

5.1.6Репрезентативная формула функции цены

Вработе [1] доказана следующая репрезентативная формулы для функции цены. Доказательство утверждения основывается на необходимых условий опти­ мальности — принципе максимума Понтрягина [5] в гамильтоновой форме.

Теорема 2. Пусть в задаче (5.1)–(5.4) выполнены условия 14. Функция цены

( , ) (5.4) задачи (5.1)–(5.2) имеет следующее представление

( , ) =

min ̂( , ),

( , ) = { : ̂( , ) = },

(5.10)

( , )

где ̂(·, ), ̂(·, ) — характеристики (5.8), (5.9) уравнения Беллмана.

5.1.7 Необходимые и достаточные условия оптимальности

Определение 4. Пусть ( , ) Π . Супердифференциалом функции ( , ) на­ зывается множество

 

 

+ ( , ) = {( , ) R × R :

( +

, +

) − ( , ) ≤ + , + (‖ ‖ + | |)

 

 

( + , + ) +1( , )},

14

где > 0, (‖ ‖ + | |)/(‖

‖ + |

|) → 0 при ‖

‖ + |

| → 0,

+1( 0) =

{ R +1 : ‖ − 0‖ ≤ }.

 

 

 

 

 

Классический результат А.Ф. Филиппова [18] о существовании допустимого оптимального управления гласит

Теорема 3. Пусть в задаче (5.1)–(5.4) выполнены условия 14. Для любой начальной точки ( 0, 0) cl Π существует допустимое оптимальное управле­ ние 0(·) ( 0, ).

В работе [1] получены необходимые и достаточные условия оптимальности первого порядка, дополняющие принцип максимума Л.С. Понтрягина [5]

Теорема 4. Пусть в задаче (5.1)–(5.4) выполнены условия 14. Для того что­ бы управление 0(·) ( 0, ) и траектория 0( ) = = 0( ; 0, 0; 0(·)), порождаемая из начальной точки ( 0, 0) cl Π управлением

0(·), были оптимальными для ( 0, 0), т.е.

( 0, 0; 0(·)) = ( 0, 0),

необходимо и достаточно, чтобы существовал такой вектор R , что

(−

 

 

 

0( ) = ( , ),

( , ) = ( , ( , )),

 

 

(

(

)

(

̂)) (

 

̂

 

̂

 

0

 

 

 

,

,

,

, ,

, ))

 

+ ( , ( , ))

 

[ , ].

 

 

 

̂

 

̂

̂

 

 

 

̂

 

 

Здесь (̂( , ), ̂( , ), ̂( , )) – характеристики задачи (5.6), (5.7).

5.1.8 Оптимальный синтез

В качестве допустимых позиционных управлений (обратных связей)

( , ) будем рассматривать произвольные функции cl Π ( , ) →( , ) ,

15

в том числе и разрывные, естественно возникающие при решении многих задач [19, 20].

Напомним [8] определение результата

 

0, 0; ( , ) управления системой (5.1)

с помощью допустимой обратной связи

( , )

из

начального состояния ( ,

).

 

(

 

 

 

 

 

 

)

 

 

 

 

 

 

 

0

0

 

Рассмотрим разбиение Γ отрезка времени [ 0, ]

 

 

 

 

 

 

 

 

 

 

 

 

 

Γ =

,

= 0, 1, . . . ,

}

[ , =

 

],

 

 

 

 

 

 

max

 

−1

 

.

 

 

 

{

 

 

 

 

 

0

 

 

 

diam Γ = 1

 

 

 

|

|

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

≤ ≤

 

 

 

 

 

 

 

 

Определим пошаговое движение (ломаную Эйлера) Γ(·) :

[ 0, ]

→ R

систе­

мы (5.1):

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Γ(·) : [ −1, ] →R ,

 

= 1, . . . , ,

 

 

 

 

 

 

 

 

 

 

 

 

˙Γ( ) = ( , Γ( ), −1),

 

 

 

[ −1, ),

 

 

 

 

 

 

 

 

 

 

−1 = Γ( ) = ( −1, Γ( −1))

= const,

 

[ −1, ).

 

 

 

 

 

Определение

5. Результатом

управления

системой

 

(5.1)

из

состояния

( 0, 0) с помощью обратной связи ( , ) называется величина

 

 

 

 

 

 

 

 

 

(

0

0;

(

,

))

= diam(Γ)→0

 

(

0

,

0;

 

Γ(·))

 

 

 

 

 

 

 

 

 

 

 

,

 

 

 

 

lim sup

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

Определение 6. Допустимая обратная связь 0( , ) называется оптимальным синтезом, если

( 0, 0; 0( , )) = ( 0, 0),

( 0, 0) cl Π .

В работах [1, 21] предложена следующая конструкция оптимального синтеза.

Теорема 5. Если в задаче (5.1)–(5.4) выполняются условия 14, то опти­ мальный синтез 0( , ) : ( , ) → может быть определен следующим обра­ зом:

0( , ) { : ( , , ) = 0, ( , , ) = 0},

( 0, 0) = ( 0( , , *), 0( , , *)) ( , ),

(− ( , , *), *) ∂+ ( , ), ( , , *) = *, 0( , , *) + 0( , , *).

16

5.1.9 Ослабленные предположения

Результаты пп.5.1.95.2.2 получены Т.Б.Токманцевым [22].

В дальнейшем предполагаем, что входные данные задачи (5.1)–(5.2) удовле­

творяют следующим четырем условиям 14.

1. Функции ( , , ) и ( , , ) в (5.1), (5.2) определены и непрерывны на

cl Π × ,

существуют непрерывные по ( , , ) Π × частные производные

 

∂ ( , , )

 

∂ ( , , )

 

 

 

 

 

 

,

, 1, , 1, , ограниченные по норме константой 1 >

 

 

 

0.

 

 

 

 

 

 

 

 

 

Предположение 1 отличается от предположения 1 главы 1 отсутствием требования существования непрерывных частных производных по переменной . Условие может быть заменено на условие подлинейного роста. Полученные резуль­ таты останутся справедливыми, но усложнится доказательство оценок и станут сложнее константы.

2. Терминальная функция платы ( ) в (5.2) определена и непрерывна на

R вместе со своими частными производными , 1, .

Это предположение полностью совпадает с предположением 3.

Рассмотрим полные вектограммы скоростей ( , ) управляемой системы (5.1):

( )

( , ) = { ( , , ), ( , , ) :

}

(5.11)

и представим гамильтониан (5.5) в виде:

( , , ) =

min [ , + ].

(5.12)

( , ) ( , )

3. Для любой точки ( , ) cl Π и вектора R множество

Arg min [ , + ]

( , ) ( , )

состоит из единственного элемента ( 0( , , ), 0( , , )) ( , ).

Предположение 3 является более общим по сравнению с предположением

4. Любая строго выпуклая вектограмма, очевидно, удовлетворяет условию 3. 17

Рис. 5.1. Пример невыпуклого множества (синяя дуга), удовлетворяющего условию 3

На рисунке 5.1 изображен пример невыпуклого множества, удовлетворяющего условию 3.

Предположения 1, 3 позволяют доказать следующие утверждения.

Лемма 1. Функции 0( , , ), 0( , , ) непрерывны по совокупности перемен­ ных.

Лемма 2. Для всех ( , , ) Π × R имеют место следующие соотношения:

0( , , ) = ( , , ), 0( , , ) = ( , , ) − , ( , , ) .

Замечание 1. Вследствие леммы 2 характеристическая система (5.8) задачи Ко­

ши (5.6) имеет вид:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

( , , ),

 

 

 

 

 

 

 

 

 

0

 

 

̂ ̂

 

 

 

 

 

 

̂

 

 

 

 

 

 

 

0

 

(5.13)

 

 

=

 

 

 

 

 

 

+

 

( , , ),

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0( , , )

 

 

 

 

 

 

 

̂

 

 

(

)

 

 

 

 

 

 

=

 

̂ ̂

 

̂

̂

 

̂ ̂

 

 

( , , ),

 

 

 

 

 

0

 

̂

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

̂

 

 

 

 

̂ ̂

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с граничными условиями

̂( , ) = , ̂( , ) = ( ), ̂( , ) = ( ),

R .

(5.14)

18

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]