- •1 РЕФЕРАТ
- •2 НОРМАТИВНЫЕ ССЫЛКИ
- •3 ОБОЗНАЧЕНИЯ И СОКРАЩЕНИЯ
- •4 ВВЕДЕНИЕ
- •5 ОСНОВНАЯ ЧАСТЬ
- •5.1 Постановка задачи
- •5.1.1 Задача оптимального управления
- •5.1.2 Предположения
- •5.1.3 Уравнение Беллмана
- •5.1.4 Классические характеристики уравнения Беллмана
- •5.1.5 Обобщенное решение уравнения Беллмана
- •5.1.6 Репрезентативная формула функции цены
- •5.1.7 Необходимые и достаточные условия оптимальности
- •5.1.8 Оптимальный синтез
- •5.1.9 Ослабленные предположения
- •5.1.10 Свойства гладкости функции цены
- •5.1.11 Супердифференциал функции цены
- •5.2 Анализ поставленной задачи
- •5.2.1 Алгоритм построения аппроксимации функции цены
- •5.2.2 Оценка численной аппроксимации функции цены
- •5.2.3 Алгоритм построения сеточного оптимального синтеза
- •5.3 Результаты работы
- •5.3.1 Основные функции
- •5.3.2 Примеры численного построения функции цены
- •6 ЗАКЛЮЧЕНИЕ
Вчастности, при = 0 выполняется 0( ) = ( , 0( ), 0).
Вработе [1] доказано утверждение о виде супердифференциала функции це ны при предположении о дифференцируемости входных данных по переменной
истрогой выпуклости вектограммы. Следующее утверждение сформулировано и доказано при более слабых предположениях.
Теорема 11. Если в задаче (5.1) – (5.4) выполнены условия ′1– ′4, то супердиф ференциал ∂+ ( , ) функции цены ( , ) задачи (5.1)–(5.2) не пуст при всех
( , ) cl Π и имеет вид
∂+ ( , ) = co{(− ( , ( , ), ( , )), ( , )) |
: |
||
( , ) = , |
( ̂, ) = ̂( , ) , |
̂ |
|
̂ |
} |
|
|
̂ |
|
|
( )
где ̂(·, ), ̂(·, ), ̂(·, ) — характеристики (5.8)–(5.9).
5.2 Анализ поставленной задачи
5.2.1Алгоритм построения аппроксимации функции цены
Вдальнейшем будем использовать некоторые обозначения, введенные в гла ве 2. Символ 3( 0) (5.18) обозначает константу Липшица функции ( , ) по переменной , 1 ( 0) имеет вид
|
|
max |
|
{‖ |
|
( |
, , |
)‖ |
, |
| |
|
( |
, , |
)|} |
1 |
( 0) = ( , , ) ( 0) |
× |
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(формула (5.19)), множество ( 0) определено соотношением (5.17). |
||||||||||||||
Рассмотрим разбиение Γ = { , |
= |
|
0, 1, . . . , } отрезка времени [ 0, ] с |
|||||||||||
шагом . В момент |
|
|
|
|
|
|
|
|
|
|
|
|
^ |
|
= 0 рассмотрим компактное связное множество 0 |
||||||||||||||
R в фазовом пространстве. Рассмотрим соответствующие компактные связные |
||||||||||||||
множества 0 = × |
^ |
и ( 0), определенное соотношением (5.16), и его сечение |
||||||||||||
0 |
23
|
|
^ |
^ |
|
|
|
также является |
|||
в момент = обозначим символом . Множество R |
|
|
||||||||
компактным связным множеством. |
|
|
|
|
|
|
|
|
||
Введем параметр |
> 0. Будем говорить, что характеристики 1(·) и 2(·) |
|||||||||
пересекаются в момент |
|
[0, ], когда выполняется условие |
‖ |
1 |
|
|
−̂ |
‖ ̂ |
||
|
|
( ) |
2( ) |
≤ . |
||||||
При практической реализации алгоритма, в случае большого |
количества характе |
|||||||||
|
̂ |
|
|
|
̂ |
|
ристик, возникает проблема определения пересекающихся характеристик. Один
из возможных подходов использует методы вычислительной геометрии — для се
чений характеристик ( ) для каждого момента разбиения применяется метод |
|||||||||||
диаграмм Вороного. |
̂ · |
|
|
|
|
|
|
||||
|
|
|
|
^ |
|
|
|
|
}, = ( 1, . . . , ), с шагом по |
||
|
Зададим на |
равномерную сетку = { |
|||||||||
осям |
|
. Обозначим через |
|
сетку в момент |
= |
|
являются |
||||
|
|
̃ |
. Узлами сетки |
|
|||||||
точки |
, лежащие на характеристиках (·), которые в момент = стартуют |
||||||||||
из |
|
̃ |
|
|
|
|
̃ |
|
|
|
|
|
точки . Для того, чтобы избежать разреживания сеток следует согласовать |
||||||||||
шаги |
|
|
̃ |
|
|
|
|
|
|
|
|
|
|
сеток по фазовому пространству и по времени следующим образом |
≤ 1 ( 0)Δ + .
иподдерживать это соотношение для соседних узлов сеток , пополняя узлы в
по мере надобности.
Начинаем вычисления с конечного момента времени . Численно интегри
руем в обратном времени на отрезке [ |
|
, ] характеристическую систему с |
|||||||||
|
|
|
|
|
−1 |
|
|
|
|
|
|
краевыми условиями ( ) = , |
( ) = ( ), |
( ) = ( ), учитывая |
|||||||||
|
|
оптимальности. Соответствующие идеальные решения (оп |
|||||||||
достаточные условия ̃ |
|
̃ |
̃ |
|
|
̃ |
̃ |
̃ |
|||
обозначим символом |
( ), (( ), ( ) , |
|
|
[ ) 1, ]. |
|
|
|||||
тимали) обозначим символом 0( ), 0( ), 0( ) , а их численные аппроксимации |
|||||||||||
В момент |
|
( |
1 |
|
) |
|
|
|
1 |
|
|
|
|
̃ |
̃− |
̃ |
|
− |
− |
|
и аппроксимацию функ |
||
|
0 |
|
|
|
|
|
|||||
|
времени = |
|
конструируем сетку |
|
|
||||||
ции цены ̃( −1, |
−1) для каждого фиксированного индекса 0 согласно утвер |
||||||||||
|
̃ |
|
|
|
|
|
|
|
|
|
|
24
ждению 7 и аппроксимационной формуле:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
˜ |
|
|
|
0 |
|
|
|
|
min |
|
|
|
|
|
= |
|
|
|
|
|
|
|
|
|
|
|
(5.23) |
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
( , ) = |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
̃ |
|
|
|
|
|
‖̃ |
̃+1 |
|
|
|
|
̃ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
: |
|
|
|
0 |
‖≤ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
‖̃ −̃ |
|
|
|
|
|
{ |
|
|
|
|
|
|
̃ |
|
− |
|
|
̃ |
|
|
̃ |
|
) |
|
} |
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
‖≤ |
˜ |
|
|
|
|
|
|
|
|
|
|
|
|
( |
|
|
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
= |
|
min |
|
|
|
|
( +1, +1) + |
Z |
|
|
|
|
|
, |
( ), |
( ) |
|
, |
|
|
|
||||||||||||||||||||||||
|
|
|
|
|
: |
|
|
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
где = − 1. |
|
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
В |
|
узлах |
|
|
|
|
|
|
|
|
|
сетки |
|
|
−1 |
|
строим |
|
|
оптимальные |
|
|
|
направления |
|||||||||||||||||||||||||
|
|
|
−1 |
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||
( −1 |
, |
−1) (̃ −1, |
−1), где |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
0 |
0 |
|
|
|
|
|
|
|
|
̃ |
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
0 |
= |
0 |
( |
|
|
|
|
0 |
, |
0 |
|
|
), |
|
|
|
0 |
|
|
|
|
|
0 |
( |
|
|
, |
0 |
|
, |
0 |
|
|
), |
|
(5.24) |
|||||||||||
|
1 |
|
−1 |
, |
1 |
|
|
1 |
|
|
|
|
1 |
= |
|
|
|
1 |
|
|
1 |
|
|||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
− |
|
|
|
|
|
− |
|
|
|
|
|
|
−1 |
|
|
− |
|
|
|
|
|||||||||||||||||||
|
|
|
− |
− |
|
|
|
|
|
−̃ |
− |
̃ |
|
|
|
|
− |
|
|
|
|
|
|
− |
|
|
|
|
|
̃ |
|
− |
̃ |
|
|
|
|
|
|||||||||||
|
|
|
0 |
|
= ( |
1 |
): |
|
|
|
( |
1 |
) = ( |
1 |
, 0 ( |
|
|
) = 0 ( |
|
−1 |
). |
||||||||||||||||||||||||||||
|
|
|
1 |
|
|
̃ |
|
|
|
|
|
|
̃ |
|
|
|
|
̃ |
|
|
|
̃ |
|
−1 |
|
|
̃ |
|
|
|
|||||||||||||||||||
|
|
|
̃ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Далее эта процедура рекуррентно повторяется на интервалах [ , +1]. Строятся
сетки , = − 1, . . . , 0 с узлами 0 . Полагаем
̃
0 |
= * |
( ): |
0 |
= ̃( , 0 ) = * . |
(5.25) |
|
̃ |
̃ |
|
̃ |
̃ |
̃ |
|
Если индексов *, удовлетворяющих условию (5.25), находится несколько, то вы бирается любой из них.
Индексом *, согласно (5.25), отмечена точка * , сопутствующая фазовой
̃
0
точке ̃ :
* |
0 |
‖ ≤ |
, |
* |
= |
min |
|
|
, |
|
|
|
‖≤ |
|
|||||
‖̃ |
− ̃ |
|
̃ |
: ‖̃ |
* −̃ |
̃ |
|
||
|
|
|
|
|
|
0 |
|
|
|
которая лежит на ломаной Эйлера ̃(·), аппроксимирующей на отрезке , +1 оп
тималь 0* (·). Соответствующая -компонента характеристики (·) аппроксимиру
̃
ет коэкстремаль 0* (·), причем, согласно достаточным условиям оптимальности, справедливо включение
0* ( ) ∂+ ( , 0* ( )). |
(5.26) |
25
Условия (5.25), (5.26) позволяют вектору 0 |
, построенному в узле 0 |
сетки |
|||||||||||||
обеспечивать близость с суперградиентом |
0 |
( ) |
, а вектору |
0 |
обеспечивать |
||||||||||
* |
̃ |
|
|
|
|
̃ |
|
|
|
||||||
близость с точкой 0* ( ) на оптимали. |
|
|
|
|
|
|
̃ |
|
|
|
|
|
|
||
Узлы сетки , = −1, . . . , 0, в совокупности с , |
являются краевыми |
||||||||||||||
условиями̃для интегрирования характеристической |
системы в обратном времени |
||||||||||||||
|
̃ |
̃ |
|
|
|
|
|
|
|||||||
на интервале [ |
−1 |
, ]. Результатом работы алгоритма |
при каждом = |
|
|
явля |
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ется — совокупность точек сетки ̃ , значения аппроксимации функции цены
̃ , а также оптимальные направления ( , ), определяющие, согласно утвержде нию 5, сеточный оптимальный синтез, т.е.:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
= {(̃ |
, ̃ |
, |
, )}. |
|
|
|
|
|
|
|
|
|
|
|
|
||
Предполагается, что шаг интегрирования |
|
выбран достаточно мелким, что все |
|
|||||||||||||||
построенные ломаные Эйлера ̃(·), ̃(·) содержатся в области ( 0) × ( 0). |
|
|
||||||||||||||||
5.2.2 Оценка численной аппроксимации функции цены |
|
|
|
|
|
|
|
|
||||||||||
Пусть в момент = |
Γ идеальная характеристика |
0(·), 0(·), 0(·) и |
|
|||||||||||||||
времени из одной точки ( 0, 0, 0), где ( , 0) |
|
( (· 0),· 0 |
· |
)( 0), ( |
|
( , 0, 0), 0) |
|
|||||||||||
аппроксимирующая ее численная реализация |
|
( ), ( ), ( ) |
выходят в обратном |
|
||||||||||||||
|
̃ |
̃ |
̃ |
|
( |
|
|
|
|
|
) |
|
|
|||||
∂+ ( , 0), 0 = ( , 0). |
|
|
|
|
|
|
− |
|
|
|
|
|
|
|
||||
Пусть идеальная характеристика ( 0(·), 0(·), 0(·)) |
оптимальна, т.е. |
|
|
|
|
|
|
|||||||||||
(− , 0( ), 0( ) , 0( )) ∂+ , 0( ) , |
[ −1, ]. |
|
|
|
|
|
|
|||||||||||
( |
) |
|
|
|
( |
|
) |
|
|
|
|
|
|
|
|
|
|
|
Справедливо следующее утверждение. |
|
|
|
|
( |
|
|
|
) |
|
|
|
|
|
|
|
|
|
Лемма 3. Отклонение численной реализации |
|
в |
|
|
|
|
|
1 |
|
|
|
|||||||
(·), (·), (·) |
от аппроксимиру |
|
||||||||||||||||
|
( |
· |
|
|
·̃ |
·̃ |
̃ |
|
|
|
|
− |
|
|
|
|
||
|
|
|
|
|
) |
|
момент = |
|
|
|
|
|
|
|||||
емой оптимальной характеристики |
0( ), 0 |
( ), 0( ) |
|
|
|
|
|
Γ |
|
26
удовлетворяет следующим оценкам: |
|
|
|
‖ 0( −1) − ˜( −1)‖ ≤ |
( 1( 0)Δ ) =: 1, |
||
‖ 0( −1) − ˜( −1)‖ ≤ |
2 2( 0) + |
3( 0) (Δ 1( 0)) =: 1, |
|
| 0( −1) − ˜( −1)| ≤ |
( 1( 0)Δ ) =: 1. |
Здесь ( 0), = 1, 3, – константы, определенные из условий на входные дан
ные.
( )
Рассмотрим на отрезке [ −1, ] ломаную Эйлера ̃(·), ̃(·), ̃(·) , которая, согласно алгоритму (5.23)–(5.25), аппроксимирует оптимальную характеристику
( 0(·), 0(·), 0(·)). Отметим, что 0( ) = 0 , 0( ) = ( 0), 0( ) = ( 0).
Лемма 4. Отклонение ломаной Эйлера от аппроксимируемой оптимальной ха рактеристики в момент = −1 Γ имеет вид для = −
|
‖ 0( −1) − ( −1)‖ ≤ 2 + 1 + + ( + ) =: +1, |
|
|||||||||||||
‖ |
0( −1) |
− |
( −1) |
‖ |
̃ |
|
|
|
) + |
( 3( 0) + 1) ( + ) =: +1, |
|||||
|
|
|
|
≤ 1 + (1 + |
|||||||||||
|
|
|
|
0( |
|
1) |
− |
( 1) |
| ≤ |
1̃+ + |
( + ) =: +1. |
|
|||
|
|
|
̃| |
− |
|
|
|
− |
|
|
|
||||
|
Получили систему |
рекуррентных соотношений |
|
||||||||||||
|
|
̃ |
|
|
|
|
|
||||||||
|
|
|
+1 = 2 + 1 + + ( + ), |
(5.27) |
|||||||||||
|
|
|
+1 = 1 |
+ (1 + |
) + ( 3( 0) + 1) ( + ), |
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
+1 = 1 + + ̃( + ) |
|
|
||||||||||
|
|
|
|
|
|||||||||||
с |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
начальными условиями
1 = |
( ( 0)Δ ), |
1 = |
2 ( 0) + |
( 0) (Δ ( 0)), (5.28) |
|
|
1 |
|
2 |
3 |
1 |
|
|
1 = |
( 1( 0)Δ ). |
|
Полученную систему используем для доказательства следующего утвержде
ния.
27