Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ТУ - лекции Овсянникова / 27.Методы спуска

.pdf
Скачиваний:
19
Добавлен:
16.04.2015
Размер:
163.73 Кб
Скачать

Лекция 27. Методы спуска на основе первой вариации функционала.

Рассмотрим следующую задачу оптимального управления:

x = f t; x; u(t) ;

x(0) 2 M0 Rn;

(1)

Z T

 

 

 

(2)

I(u) = ' t; xt; u(t)

dt + g(xT ) ! min:

t0

 

 

Здесь, как и ранее, u 2 D, D класс кусочно-непрерывных на T0, векторфункций, u(t) 2 U, t 2 T0 = [t0; T ], t0; T фиксированы.

Сформулируем следующие условия на параметры задачи (1), (2).

А. Вектор-функция f(t; x; u) и функция '(t; x; u) определены и непрерывны по совокупности своих аргументов на T0 U вместе с частными производными @f=@x, @'=@x; функция g(x) непрерывна в множестве и имеет непрерывную производную @g=@x; множество U компактно в пространстве Rr; область в Rn.

99

Б. Дополнительно к условиям A предположим, что существует и непрерывна производная @f=@u; U выпуклое множество.

Для функционала (2) было получено следующее представление приращения:

I(u; u) = I(u; u) + o(u; );

(3)

где

 

 

 

 

 

 

(4)

= max (

k

 

f

kL

) :

x0

M0

u

 

 

 

2

 

 

 

 

 

 

В зависимости от условий A и

и вида вариации управления вариацию

I(u; u) представим либо в виде неклассической вариации

 

I(u; u) = Z0 T (t; xt) uf(t; xt; u(t))dt

(5)

или в виде классической вариации

 

 

 

 

 

 

I(u0; " u) = " G(u0); u u0 + o("):

(6)

100

При этом в случае игольчатой вариации u = u", а в случае классической вариации u = " u. При этом величина имеет порядок ".

Будем говорить, что функция !( ) является строго положительной при> 0, если

!( ) = inff!( ) : g > 0; > 0:

Предполагаем далее, что при всяком допустимом управлении u = u(t) и допустимой вариации u = u(t) возможно построение однопараметрического семейства вариаций, обозначаемого через "u, такого, что:

а) "u является допустимой вариацией при " 2 [0; "^], "^ > 0, при этом

"u "=^"= "^u = u;

б) вариация

I(u; u) при u = "u удовлетворяет неравенству

I(u; "u) "! (u) , " 2 [0; "^], где ! строго положительная функция, а (u) некоторый функционал на D или его подмножестве;

101

в) величина , определенная равенством (4), имеет порядок малости не меньше ", а следовательно, остаточный член o(u; ) в приращении (3) более высокого порядка малости, чем ".

Функционал (u) введем следующим образом:

 

(u) = u~2D (u; u u) :

(7)

sup

~

 

Будем говорить, что управление u0 = u0(t) есть стационарное управление, если выполняется равенство (u0) = 0.

В силу доказательства необходимых условий оптимальности, оптимальные управления являются стационарными, а стационарные управления удовлетворяют необходимым условиям оптимальности.

Из равенства (3) и условий a)–в) для приращения функционала при вариации управления "u имеем

I(u; "u) "! (u) + o(u; "):

(8)

102

Будем предполагать, что величина o(u; ") имеет равномерно по u 2 D более высокий порядок малости, чем ".

Построим следующий алгоритм определения стационарных управлений. Пусть u1 = u1(t) допустимое управление. Фиксируем некоторое "^ > 0 и вычислим (u1). Допустим, что

(u1) = I(u1; u) = I(u1; u^ u) > 0;

(9)

где u вариация, на которой достигается супремум (7). По вариации u

построим однопараметрическое семейство вариаций "u "=^"= u, удовлетворяющее условиям a)–в). Очевидно, что тогда из этих условий вытекает существование " 2 [0; "^], такого, что

I(u1; "u) < 0:

(10)

Более того, найдем такое "0, что

 

I(u1; "0u) = min I(u1; "u):

(11)

"2[0;"^]

 

103

При этом из неравенства (10) следует, что

I(u1; "0u) < 0:

(12)

Возьмем теперь в качестве следующего управления

u2(t) = u1(t) + "0u(t):

(13)

Учитывая (12), имеем I(u2) < I(u1).

Для управления u2 можно повторить те же построения, что и для управления u1. В случае, если (u2) = 0, полагаем u3 = u2. Следовательно, повторяя этот процесс, мы получим последовательность управлений

u1; u2; : : : ; uk; : : : ;

(14)

такую, что

I(u1) I(u2) : : : I(uk) : : : :

(15)

104

Последовательность управлений, для которой имеют место неравенства (15), будем называть невозрастающей последовательностью для функционала (2).

Рассмотрим поведение функции (u) на этой последовательности.

Теорема 1 Пусть функционал (2) ограничен снизу и пусть построена последовательность управлений (14) по указанному ранее алгоритму. Тогда

(uj) ! 0.

j!1

Доказательство Предположим, что теорема неверна. Тогда существуют0 > 0 и подпоследовательность управлений fujg последовательности (14), на которой выполняется неравенство

(uj) 0 > 0:

(16)

105

Пронумеруем эту подпоследовательность заново: считаем в дальнейшем j = 1; 2; : : :. По построению каждому управлению uj соответствует однопараметрическое семейство вариаций u"uj, удовлетворяющих условиям a)–в). Поэтому согласно (8) для приращения функционала имеем

I(uj; "uj) "! (uj) + o(uj; ");

(17)

причем, так как o(u; ") на (8) более высокого порядка малости, чем ", равномерно по управлениям u 2 D, то существует "~ 2 [0; "^], такое, что

jo(uj; ")j

1

"! (uj)

(18)

2

для всякого uj из указанной подпоследовательности при " 2 [0; "~]. Выпишем с учетом неравенств (16) и (18) следующую цепочку нера-

венств:

min I(uj; "uj) min I(uj; "uj)

"2[0;"^]

"2[0;"~]

 

 

! (uj) i

"~

 

"

 

"2[0;"~] h 2

2!( 0) < 0:

 

min

 

 

 

 

 

 

106

Это означает, что для произвольного j = 1; 2; : : : имеем

"~

I(uj+1) I(uj) 2!( 0);

или, суммируя по j от l до k, получаем

k"~

I(uk+1) I(u1) + 2 !( 0):

Отсюда следует, что I(uk) ! 1, но это противоречит ограниченности

k!1

снизу функционала I(u).

Замечание 1 Отметим, что при доказательстве теоремы существенно предположение о том, что величина o(u; ") из соотношения (8) имеет более высокий порядок малости, чем ", равномерно по u 2 D. Однако на самом деле используется только равномерность по управлениям из последовательности fujg.

107

Выбор вариации u,способ построения по ней однопараметрического семейства вариаций "u и алгоритм минимизации в одномерном направлении (по ") определяют тот или иной метод спуска. В каждой конкретной задаче он обусловлен, например, ресурсами ЭВМ, простотой вычислительных схем и, естественно, тем результатом, который ожидается, и за какое время.

108