- •1 РЕФЕРАТ
- •2 НОРМАТИВНЫЕ ССЫЛКИ
- •3 ОБОЗНАЧЕНИЯ И СОКРАЩЕНИЯ
- •4 ВВЕДЕНИЕ
- •5 ОСНОВНАЯ ЧАСТЬ
- •5.1 Постановка задачи
- •5.1.1 Задача оптимального управления
- •5.1.2 Предположения
- •5.1.3 Уравнение Беллмана
- •5.1.4 Классические характеристики уравнения Беллмана
- •5.1.5 Обобщенное решение уравнения Беллмана
- •5.1.6 Репрезентативная формула функции цены
- •5.1.7 Необходимые и достаточные условия оптимальности
- •5.1.8 Оптимальный синтез
- •5.1.9 Ослабленные предположения
- •5.1.10 Свойства гладкости функции цены
- •5.1.11 Супердифференциал функции цены
- •5.2 Анализ поставленной задачи
- •5.2.1 Алгоритм построения аппроксимации функции цены
- •5.2.2 Оценка численной аппроксимации функции цены
- •5.2.3 Алгоритм построения сеточного оптимального синтеза
- •5.3 Результаты работы
- •5.3.1 Основные функции
- •5.3.2 Примеры численного построения функции цены
- •6 ЗАКЛЮЧЕНИЕ
′4. Существуют непрерывные по совокупности переменных и ограниченные
вобласти ( , , ) Π × R частные производные
∂ 0( , , )
≤ 2, ∂
∂ 0( , , )
≤ 2, ∂
∂ 0( , , )
≤ 2,
∂ 0( , , )
≤ 2,
∂
1, , 1, .
Из предположения ′4 вытекает условие глобальной липшицевости и условие подлинейного роста правой части системы (5.13) по переменным и . Та ким образом, выполняются условия теоремы о существовании и единственности решений характеристической системы (5.13) с краевыми условиями (5.14) (см., например, работу [9, с.124]), а также условия продолжимости решений на отрезок времени [0, ] (см., например,[23, с.215]).
Замечание 2. Утверждение 1 из работы [14] остается справедливым и при этих предположениях.
5.1.10 Свойства гладкости функции цены
Рассмотрим расширение множества допустимых управлений ( 0, ) – мно жество ( 0, ) обобщенных программных управлений, в качестве которых рас сматриваются измеримые функции (·| ): [ 0, ] → rpm( ) со значениями во множестве регулярных вероятностных борелевских мер на с топологией, инду цированной слабой-* топологией пространства *( ) [24]. Символ *( ) означает пространство, сопряженное к пространству непрерывных функций, определенных на компакте .
19
Обозначим символом множество обобщенных управлений
(·): [0, 1] → rpm( ),
определенных на стандартном отрезке [0, 1]. Будем называть элементы множества
– нормализованными обобщенными управлениями. Известно [24], что на мно жествах ( 0, ), 0 [0, ] можно определить слабую метрическую топологию так, что пространства ( 0, ) будут сепарабельными и компактными. Следова тельно, множество также является метрическим компактом.
Теорема 6. Пусть в задаче (5.1)–(5.4) выполнены условия ′1– ′2. Функция цены
( , ) может быть представлена в виде
( , ) = min ( , , ),
где параметр принимает значения из метрического компакта , функция
( , , ) непрерывна на множестве cl Π × , существуют частные производ
ные ∂ ( , , ), 1, , непрерывные на множестве cl Π × .
∂
Основой численного метода служит представление функции цены задачи (5.1)–(5.4 на базе классических характеристик задачи Коши (5.6), (5.7). По сравнению с ра ботой [1] репрезентативная формулы для функции цены доказана при более сла бых предположениях. Доказательство утверждения основывается на необходимых условий оптимальности — принципе максимума Понтрягина [5] в гамильтоновой форме.
Теорема 7 (Репрезентативная формула функции цены). Пусть в задаче (5.1)–(5.4)
выполнены условия ′1– ′4. Функция цены ( , ) (5.4) задачи имеет следующее представление
( , ) = |
min ̂( , ), |
( , ) = { : ̂( , ) = }, |
(5.15) |
( , )
где ̂(·, ), ̂(·, ) — характеристики (5.8), (5.9) уравнения Беллмана.
20
Для произвольного компактного связного множества 0 cl Π введем в
рассмотрение множество ( 0) cl Π такое, что 0 , и
( |
) = |
|
( , ) |
|
cl Π |
( , ) |
решения (5.8), (5.9), |
|
( , |
) |
|
|
: (5.16) |
|
0 |
|
{ |
|
|
|
| ̂( ·0, ) |
–= 0 |
, ( , ) = }. |
|
0 0 |
|
|
0 |
|
|
|
|
|
|
|
̂ |
|
̂ |
|
|
|
|
|
|
Вследствие условий ′1, ′4 пучок траекторий системы (5.13) будет компакт ным связным множеством [25]. Следовательно, множество ( 0) будем связным компактом.
Определим компактное множество ( 0) R :
|
|
|
( 0) = { = ( , ) R : ( , ( , )) ( 0)}. |
|
|
|
(5.17) |
|||||||||||||||||||||||||||||||||||||||||||||
( 0) = |
( 0) + |
|
|
|
|
. |
|
|
̂ |
|
|
|
|
|
|
|
: |
|
|
̂ |
|
. |
|
|
|
|
0 |
|
|
( |
|
|
0 |
+1 |
) |
|||||||||||||||||
|
, где |
= |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
( ) + |
||||||||||||||||||||||||||||||
Введем параметр > 0 |
|
Рассмотрим множества ( ) = |
|
и |
||||||||||||||||||||||||||||||||||||||||||||||||
|
( |
|
|
|
) |
|
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|
} |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
{ R |
|
|
‖ ‖ ≤ |
|
|
|
|
|
|
|
|
|
· |
|
|
|
|
|
|
|
|
|||||||||||||||||||
Определим на множестве ( ) |
× |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||
|
|
|
( ) функцию ( ) – модуль непрерыв |
|||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
∂ |
0( , , ) |
|
|
|
∂ 0( , , ) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
ности для функций 0(·), 0(·), |
|
, |
|
, |
1, , 1, . |
|
|
|
||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||
|
|
∂ |
|
|
|
|
∂ |
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||
Введем следующие константы |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
max |
|
|
|
|
|
|
|
|
, , |
)‖ |
, |
|
|
|
|
|
|
(5.18) |
|||||||||||||||||||
|
|
|
|
3( |
0) = |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
( , , ) ( 0)× ‖ |
|
|
|
|
|
|
( |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
max |
|
|
|
|
|
|
|
|
( |
, , |
|
|
, |
|
|
, , |
)|} |
, |
|
|
|
(5.19) |
|||||||||||||||||
|
2 ( |
|
1 ( |
|
0) = ( , , ) ( 0)× {‖ |
|
|
|
|
|
|
|
|
|
)‖ | |
( |
|
|
|
|
|
|
} |
|
||||||||||||||||||||||||||||
|
|
0) = ( , , ) ( 0)× , 1,..., { |
|
|
|
∂ |
|
|
|
|
|
|
|
|
|
|
|
∂ |
|
|
|
(5.20) |
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
∂ ( , , ) |
|
∂ ( , , ) |
|
|
|
|
|||||||||||||||||||||||||
|
|
|
|
max |
|
|
|
|
max |
max |
|
|
|
|
|
|
|
|
|
|
, |
|
. |
|
|
|
|
|
|
|
|
, |
(5.21) |
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||
|
|
|
|
|
|
|
|
( |
|
0) = |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
( ) |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
( , ) |
|
( 0) ‖ |
|
|
|
|
|
|
|
|
‖ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Справедливо следующее утверждение.
Теорема 8. При выполнении условий ′1 – ′4 функция цены ( , ) задачи (5.1)–(5.4)
непрерывна по совокупности переменных, и для любой компактной области 0 cl Π и любого > 0 существуют такие константы3( 0) > 0, 1( 0) > 0, 2( 0) > 0, что имеет место оценка
| ( ′, ′) − ( ′′, ′′)| ≤ 3( 0)‖ ′ − ′′‖ + 1( 0)| ′′ − ′| + 2( 0) (| ′′ − ′|)
21
для любых ( ′, ′), ( ′′, ′′) ( 0) Π .
5.1.11 Супердифференциал функции цены
Введем моменты времени *, , такие, что 0 ≤ * ≤ ≤ . Пусть 0[ , *](·| ): [ , ] rpm( ) — сужение функции 0(·| ): [ *, ] → rpm( ).
Введем символ 0( , ) = { : ( , ) = ( , , )}. Зафиксируем 0 =
0( | ) 0( , ). Рассмотрим траекторию 0(·): [ , ] → R системы (5.1), стар тующую из точки ( , ) и порождаемую обобщенным программным управлением
0(·): [ , ] → rpm( ), 0( ) = 0( ), = ( ; ) = + ( − ), [0, 1], [ , ]
и сужение обобщенного управления 0(·): [ , ] → rpm( ) на отрезок [ + , ],
> 0, < − :
0[ + , ]( ) = 0[ + , ]( ),
( )
= ( + ) + − ( + ) , [0, 1].
Согласно принципу оптимальности [1, 5], справедливо следующее
Теорема 9. Для нормализованного управления 0[ + , ]( ): [0, 1] → rpm( )
справедливо включение
0[ + , ](·) 0( + , 0( + )) |
(5.22) |
Обозначим через 0(·): [ , ] |
→ R — решение характеристической систе |
|
мы (5.8), (5.9) |
|
̂( , ) = . |
0(·) = ̂(·, ): = 0( ), |
Аналогично результатам работы [1, лемма II.7, теорема II.8], в силу принципа максимума Понтрягина и принципа оптимальности, имеем следующее
Теорема 10. Справедливо следующее соотношение
0( + ) = ( + , 0( + ), 0[ + , ]).
22