- •1 РЕФЕРАТ
- •2 НОРМАТИВНЫЕ ССЫЛКИ
- •3 ОБОЗНАЧЕНИЯ И СОКРАЩЕНИЯ
- •4 ВВЕДЕНИЕ
- •5 ОСНОВНАЯ ЧАСТЬ
- •5.1 Постановка задачи
- •5.1.1 Задача оптимального управления
- •5.1.2 Предположения
- •5.1.3 Уравнение Беллмана
- •5.1.4 Классические характеристики уравнения Беллмана
- •5.1.5 Обобщенное решение уравнения Беллмана
- •5.1.6 Репрезентативная формула функции цены
- •5.1.7 Необходимые и достаточные условия оптимальности
- •5.1.8 Оптимальный синтез
- •5.1.9 Ослабленные предположения
- •5.1.10 Свойства гладкости функции цены
- •5.1.11 Супердифференциал функции цены
- •5.2 Анализ поставленной задачи
- •5.2.1 Алгоритм построения аппроксимации функции цены
- •5.2.2 Оценка численной аппроксимации функции цены
- •5.2.3 Алгоритм построения сеточного оптимального синтеза
- •5.3 Результаты работы
- •5.3.1 Основные функции
- •5.3.2 Примеры численного построения функции цены
- •6 ЗАКЛЮЧЕНИЕ
Известно, что негладкая функция цены ( , ) (5.4) удовлетворяет краевому условию (5.7) и уравнению Беллмана (5.6), (5.5) в точках дифференцируемости. Согласно теории обобщенных (минимаксных/вязкостных) решений уравнения Га мильтона-Якоби [14, 17] справедливо следующее утверждение
Теорема 1. Если в задаче (5.1)–(5.4) выполнены условия 1– 4, то существует и единственно минимаксное/вязкостное решение краевой задачи (5.7) для урав нения Беллмана (5.6), (5.5), причем это решение совпадает с функцией цены задачи (5.1)–(5.4).
5.1.6Репрезентативная формула функции цены
Вработе [1] доказана следующая репрезентативная формулы для функции цены. Доказательство утверждения основывается на необходимых условий опти мальности — принципе максимума Понтрягина [5] в гамильтоновой форме.
Теорема 2. Пусть в задаче (5.1)–(5.4) выполнены условия 1– 4. Функция цены
( , ) (5.4) задачи (5.1)–(5.2) имеет следующее представление
( , ) = |
min ̂( , ), |
( , ) = { : ̂( , ) = }, |
(5.10) |
( , )
где ̂(·, ), ̂(·, ) — характеристики (5.8), (5.9) уравнения Беллмана.
5.1.7 Необходимые и достаточные условия оптимальности
Определение 4. Пусть ( , ) Π . Супердифференциалом функции ( , ) на зывается множество
|
|
∂+ ( , ) = {( , ) R × R : |
( + |
, + |
) − ( , ) ≤ + , + (‖ ‖ + | |) |
|
|
( + , + ) +1( , )}, |
14
где > 0, (‖ ‖ + | |)/(‖ |
‖ + | |
|) → 0 при ‖ |
‖ + | |
| → 0, |
+1( 0) = |
{ R +1 : ‖ − 0‖ ≤ }. |
|
|
|
|
|
Классический результат А.Ф. Филиппова [18] о существовании допустимого оптимального управления гласит
Теорема 3. Пусть в задаче (5.1)–(5.4) выполнены условия 1– 4. Для любой начальной точки ( 0, 0) cl Π существует допустимое оптимальное управле ние 0(·) ( 0, ).
В работе [1] получены необходимые и достаточные условия оптимальности первого порядка, дополняющие принцип максимума Л.С. Понтрягина [5]
Теорема 4. Пусть в задаче (5.1)–(5.4) выполнены условия 1– 4. Для того что бы управление 0(·) ( 0, ) и траектория 0( ) = = 0( ; 0, 0; 0(·)), порождаемая из начальной точки ( 0, 0) cl Π управлением
0(·), были оптимальными для ( 0, 0), т.е.
( 0, 0; 0(·)) = ( 0, 0),
необходимо и достаточно, чтобы существовал такой вектор R , что
(− |
|
|
|
0( ) = ( , ), |
( , ) = ( , ( , )), |
|
||||||
|
( |
( |
) |
( |
̂)) ( |
|
̂ |
|
̂ |
|
0 |
|
|
|
|
, |
, |
, |
, , |
, )) |
|
∂+ ( , ( , )) |
|
[ , ]. |
|
|
|
|
̂ |
|
̂ |
̂ |
|
|
|
̂ |
|
|
Здесь (̂( , ), ̂( , ), ̂( , )) – характеристики задачи (5.6), (5.7).
5.1.8 Оптимальный синтез
В качестве допустимых позиционных управлений (обратных связей)
( , ) будем рассматривать произвольные функции cl Π ( , ) →( , ) ,
15
в том числе и разрывные, естественно возникающие при решении многих задач [19, 20].
Напомним [8] определение результата |
|
0, 0; ( , ) управления системой (5.1) |
||||||||||||||||||||||||||||
с помощью допустимой обратной связи |
( , ) |
из |
начального состояния ( , |
). |
||||||||||||||||||||||||||
|
( |
|
|
|
|
|
|
) |
|
|
|
|
|
|
|
0 |
0 |
|
||||||||||||
Рассмотрим разбиение Γ отрезка времени [ 0, ] |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
Γ = |
, |
= 0, 1, . . . , |
} |
[ , = |
|
], |
|
|
|
|
|
|
max |
|
−1 |
− |
|
. |
|
|
||||||||||
|
{ |
|
|
|
|
|
0 |
|
|
|
diam Γ = 1 |
|
|
|
| |
| |
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
≤ ≤ |
|
|
|
|
|
|
|
|
|
Определим пошаговое движение (ломаную Эйлера) Γ(·) : |
[ 0, ] |
→ R |
систе |
|||||||||||||||||||||||||||
мы (5.1): |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Γ(·) : [ −1, ] →R , |
|
= 1, . . . , , |
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
˙Γ( ) = ( , Γ( ), −1), |
|
|
|
[ −1, ), |
|
|
|
|
|
|
|
|
|
|||||||||||||||
|
−1 = Γ( ) = ( −1, Γ( −1)) |
= const, |
|
[ −1, ). |
|
|
|
|
|
|||||||||||||||||||||
Определение |
5. Результатом |
управления |
системой |
|
(5.1) |
из |
состояния |
|||||||||||||||||||||||
( 0, 0) с помощью обратной связи ( , ) называется величина |
|
|
|
|
|
|
|
|||||||||||||||||||||||
|
|
( |
0 |
0; |
( |
, |
)) |
= diam(Γ)→0 |
|
( |
0 |
, |
0; |
|
Γ(·)) |
|
|
|
|
|
|
|
|
|||||||
|
|
|
, |
|
|
|
|
lim sup |
|
|
|
|
|
|
. |
|
|
|
|
|
|
|
|
Определение 6. Допустимая обратная связь 0( , ) называется оптимальным синтезом, если
( 0, 0; 0( , )) = ( 0, 0), |
( 0, 0) cl Π . |
В работах [1, 21] предложена следующая конструкция оптимального синтеза.
Теорема 5. Если в задаче (5.1)–(5.4) выполняются условия 1– 4, то опти мальный синтез 0( , ) : ( , ) → может быть определен следующим обра зом:
0( , ) { : ( , , ) = 0, ( , , ) = 0},
( 0, 0) = ( 0( , , *), 0( , , *)) ( , ),
(− ( , , *), *) ∂+ ( , ), ( , , *) = *, 0( , , *) + 0( , , *).
16
5.1.9 Ослабленные предположения
Результаты пп.5.1.9–5.2.2 получены Т.Б.Токманцевым [22].
В дальнейшем предполагаем, что входные данные задачи (5.1)–(5.2) удовле
творяют следующим четырем условиям ′1– ′4.
′1. Функции ( , , ) и ( , , ) в (5.1), (5.2) определены и непрерывны на
cl Π × , |
существуют непрерывные по ( , , ) Π × частные производные |
|||||||||
|
∂ ( , , ) |
|
∂ ( , , ) |
|
|
|
|
|
||
|
, |
, 1, , 1, , ограниченные по норме константой 1 > |
||||||||
|
∂ |
|
∂ |
|
||||||
0. |
|
|
|
|
|
|
|
|
|
Предположение ′1 отличается от предположения 1 главы 1 отсутствием требования существования непрерывных частных производных по переменной . Условие может быть заменено на условие подлинейного роста. Полученные резуль таты останутся справедливыми, но усложнится доказательство оценок и станут сложнее константы.
′2. Терминальная функция платы ( ) в (5.2) определена и непрерывна на
R вместе со своими частными производными ∂ , 1, .
∂
Это предположение полностью совпадает с предположением 3.
Рассмотрим полные вектограммы скоростей ( , ) управляемой системы (5.1):
( )
( , ) = { ( , , ), ( , , ) :
} |
(5.11) |
и представим гамильтониан (5.5) в виде:
( , , ) = |
min [ , + ]. |
(5.12) |
( , ) ( , )
′3. Для любой точки ( , ) cl Π и вектора R множество
Arg min [ , + ]
( , ) ( , )
состоит из единственного элемента ( 0( , , ), 0( , , )) ( , ).
Предположение ′3 является более общим по сравнению с предположением
4. Любая строго выпуклая вектограмма, очевидно, удовлетворяет условию ′3. 17
Рис. 5.1. Пример невыпуклого множества (синяя дуга), удовлетворяющего условию ′3
На рисунке 5.1 изображен пример невыпуклого множества, удовлетворяющего условию ′3.
Предположения ′1, ′3 позволяют доказать следующие утверждения.
Лемма 1. Функции 0( , , ), 0( , , ) непрерывны по совокупности перемен ных.
Лемма 2. Для всех ( , , ) Π × R имеют место следующие соотношения:
0( , , ) = ( , , ), 0( , , ) = ( , , ) − , ( , , ) .
Замечание 1. Вследствие леммы 2 характеристическая система (5.8) задачи Ко
ши (5.6) имеет вид: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
= |
( , , ), |
|
|
|
|
|
|
|||||
|
|
|
0 |
|
|
̂ ̂ |
|
|
|
|
|
|
|
̂ |
|
|
|
|
|
|
|
0 |
|
(5.13) |
|||
|
|
= |
|
|
|
|
|
|
+ |
|
( , , ), |
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
∂ |
|
|
|
|
|
|
|
|
|
− |
|
|
|
|
|
|
|
|
|||
|
|
|
|
∂ 0( , , ) |
|
|
|
|
|
|
|||
|
̂ |
|
|
( |
) |
|
|
|
|
|
|||
|
= |
|
̂ ̂ |
|
̂ |
̂ |
|
̂ ̂ |
|
||||
|
( , , ), |
|
|
|
|||||||||
|
|
− |
0 |
|
̂ |
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
̂ |
|
|
|
|
̂ ̂ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
с граничными условиями
̂( , ) = , ̂( , ) = ( ), ̂( , ) = ( ), |
R . |
(5.14) |
18