Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
14
Добавлен:
16.04.2015
Размер:
123.96 Кб
Скачать

Лекция 27. Методы спуска на основе первой вариации функционала.

Рассмотрим следующую задачу оптимального управления:

x = f

¡T

( )¢

 

(0) 2

 

0

½

Rn;

(1)

 

t; x; u t

;

x

 

M

 

 

I(u) = Zt0

¡

 

¢

 

 

 

 

 

(2)

' t; xt

; u(t)

dt + g(xT ) ¡! min:

Здесь, как и ранее, u 2 D, D класс кусочно-непрерывных íà T0, вектор-функций, u(t) 2 U, t 2 T0 = [t0; T ], t0; T фиксированы.

Сформулируем следующие условия на параметры задачи (1), (2).

À. Вектор-функция f(t; x; u) и функция '(t; x; u) определены и непрерывны по

совокупности своих аргументов на T0£-£U вместе с частными производными @f=@x, @'=@x; функция g(x) непрерывна в множестве - и имеет непрерывную производную @g=@x; множество U компактно в пространстве Rr; - область в Rn.

Á. Дополнительно к условиям A предположим, что существует и непрерывна производная @f=@u; U выпуклое множество.

Для функционала (2) было получено следующее представление приращения:

¢I(u; ¢u) = ±I(u; ¢u) + o(u; ¹);

ãäå

¹ = max (k¢ufkL) :

x02M0

(3)

(4)

В зависимости от условий A и и вида вариации управления вариацию ±I(u; ¢u) представим либо в виде неклассической вариации

èëè

±I(u; ¢u) = ¡ Z0T

ª¤(t; xtuf(t; xt; u(t))dt

(5)

±I(u; ¢u) = Z0T W (t; xt; u~(t)) dt;

(6)

либо в виде классической вариации

 

 

 

±I(u0; "±u) = ¡"-G(u0); u ¡ u0® + o("):

(7)

При этом в случае игольчатой вариации ¢u = ¢u", а в случае классической вариации ¢u = "±u. При этом величина ¹ имеет порядок ".

Будем говорить, что функция !(®) является строго положительной при ® > 0,

åñëè

!(®) = inff!(±) : ± ¸ ®g > 0; ® > 0:

 

Предполагаем далее, что при всяком допустимом управлении u = u(t) и допустимой вариации ¢u = ¢u(t) возможно построение однопараметрического семейства вариаций, обозначаемого через ¢"u, такого, что:

à) ¢"u является¯ допустимой вариацией при " 2 [0; "^], "^ > 0, ïðè ýòîì

¢"u¯"=^"= ¢"^u = ¢u;

115

¢I(u1; ¢"¹u) < 0:

á)

вариация

±I(u; ¢u)

ïðè ¢u

=

¢"u удовлетворяет неравенству

 

 

¯(u)

¡

¢

D

 

 

±I(u; ¢"u) · ¡"! ¯(u) , " 2 [0; "^], ãäå ! строго положительная функция,

 

à

 

некоторый функционал на

 

или его подмножестве;

â)

величина ¹, определенная равенством (4), имеет порядок малости не меньше ",

 

а следовательно, остаточный член o(u; ¹) в приращении (3) более высокого по-

 

рядка малости, чем ".

 

 

 

Функционал ¯(u) введем следующим образом:

u~2D¡¡

 

¡

¢

(8)

¯(u) = sup

±(u; u~

 

u) :

Будем говорить, что управление u0 = u0(t) есть стационарное управление, если выполняется равенство ¯(u0) = 0.

В силу доказательства необходимых условий оптимальности в задаче управления

пучком оптимальные управления являются стационарными, а стационарные управ-

ления удовлетворяют необходимым условиям оптимальности.

 

Из равенства (3) и условий a) в) для приращения функционала при вариации

управления ¢"u имеем

 

¢I(u; ¢"u) · ¡"!¡¯(u)¢ + o(u; "):

(9)

Будем предполагать, что величина o(u; ") имеет равномерно по u 2 D более вы-

сокий порядок малости, чем ".

Построим следующий алгоритм определения стационарных управлений. Пусть u1 = u1(t) допустимое управление. Фиксируем некоторое "^ > 0 и вычислим ¯(u1).

Допустим, что

 

 

 

(10)

¯(u1) = ¡±I(u1; ¢u) = ¡±I(u1; u^ ¡ u) > 0;

ãäå ¢u вариация, на которой достигается супремум¯ (8). По вариации ¢u построим однопараметрическое семейство вариаций ¢"u¯"=^"= ¢u,удовлетворяющее условиям a) в). Очевидно, что тогда из этих условий вытекает существование "¹ 2 [0; "^], такого,

÷òî

(11)

Более того, найдем такое "0, ÷òî

¢I(u1; ¢"0 u) = min ¢I(u1; ¢"u):

(12)

"¹2[0;"^]

 

При этом из неравенства (11) следует, что

 

¢I(u1; ¢"0 u) < 0:

(13)

Возьмем теперь в качестве следующего управления

 

u2(t) = u1(t) + ¢"0 u(t):

(14)

Учитывая (13), имеем I(u2) < I(u1).

Для управления u2 можно повторить те же построения, что и для управления u1. В случае, если ¯(u2) = 0, полагаем u3 = u2. Следовательно, повторяя этот процесс,

116

мы получим последовательность управлений

 

u1; u2; : : : ; uk; : : : ;

(15)

такую, что

I(u1) ¸ I(u2) ¸ : : : ¸ I(uk) ¸ : : : :

(16)

 

Последовательность управлений, для которой имеют место неравенства (16), будем называть невозрастающей последовательностью для функционала (2).

Рассмотрим поведение функции ¯(u) на этой последовательности.

Теорема 1 Пусть функционал (2) ограничен снизу и пусть построена последовательность управлений (15) по указанному ранее алгоритму. Тогда ¯(uj) ¡¡¡! 1.

j!1

Доказательство Предположим, что теорема неверна. Тогда существуют ¯0 > 0 и подпоследовательность управлений fujg последовательности (15), на которой выпол-

няется неравенство

¯(uj) ¸ ¯0

> 0:

(17)

 

Пронумеруем эту подпоследовательность заново: считаем в дальнейшем j = 1; 2; : : :.

По построению каждому управлению uj соответствует однопараметрическое семей-

ство вариаций ¢u"uj, удовлетворяющих условиям a) в). Поэтому согласно (9) для приращения функционала имеем

¢I(uj; ¢"uj) · ¡"!¡¯(uj)¢ + o(uj; ");

(18)

причем, так как o(u; ") íà (9) более высокого порядка малости, чем ", равномерно по управлениям u 2 D, то существует "~ 2 [0; "^], такое, что

jo(uj; ")j ·

1

"!¡¯(uj)¢

(19)

2

для всякого uj из указанной подпоследовательности при " 2 [0; "~].

Выпишем с учетом неравенств (17) è (19) следующую цепочку неравенств:

min ¢I(u

; ¢

u

)

·

min ¢I(u

; ¢

u

)

·

 

 

 

 

 

" [0;"^]

j

"

j

 

" [0;"~]

 

j

"

 

j

 

 

 

 

 

 

2

 

 

 

 

 

2

 

 

¡ (

 

j)¢i · ¡2

 

 

 

 

 

 

 

 

· "2[0;"~] h¡

2

 

(

0)

0

 

 

 

 

 

 

min

"

! ¯ u

 

 

 

"~

! ¯

 

< :

 

 

 

 

 

 

 

 

 

 

 

Это означает, что для произвольного j = 1; 2; : : : имеем

"~

I(uj+1) ¡ I(uj) · ¡2!(¯0);

или, суммируя по j îò l äî k, получаем

¡k"~

I(uk+1) · I(u1) + 2 !(¯0):

Отсюда следует, что I(uk) ¡¡¡! ¡1, но это противоречит ограниченности снизу

k!1

функционала I(u).

117

Замечание 1 Отметим, что при доказательстве теоремы существенно предположение о том, что величина o(u; ") из соотношения (9) имеет более высокий

порядок малости, чем ", равномерно по u 2 D. Однако на самом деле используется только равномерность по управлениям из последовательности fujg. Вопросы,

связанные с возможностью построения такой последовательности, на которой o(uj; ")=" ¡¡!0 равномерно по uj, рассмотрены, например, в работах [].

"!0

Выбор вариации ¢u,способ построения по ней однопараметрического семейства ва-

риаций ¢"u и алгоритм минимизации в одномерном направлении (по ") определяют

тот или иной метод спуска. В каждой конкретной задаче он обусловлен, например, ресурсами ЭВМ, простотой вычислительных схем и, естественно, тем результатом, который ожидается, и за какое время.

118

Соседние файлы в папке Лекции по ТУ