Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

ТУ - лекции Овсянникова / 27.Методы спуска

.pdf

Скачиваний:

Добавлен:

16.04.2015

Размер:

163.73 Кб

Скачать

☆

Лекция 27. Методы спуска на основе первой вариации функционала.

Рассмотрим следующую задачу оптимального управления:

x = f t; x; u(t) ;	x(0) 2 M0 Rn;	(1)
Z T
		(2)
I(u) = ' t; xt; u(t)	dt + g(xT ) ! min:	(2)
t0

Здесь, как и ранее, u 2 D, D класс кусочно-непрерывных на T0, векторфункций, u(t) 2 U, t 2 T0 = [t0; T ], t0; T фиксированы.

Сформулируем следующие условия на параметры задачи (1), (2).

А. Вектор-функция f(t; x; u) и функция '(t; x; u) определены и непрерывны по совокупности своих аргументов на T0 U вместе с частными производными @f=@x, @'=@x; функция g(x) непрерывна в множестве и имеет непрерывную производную @g=@x; множество U компактно в пространстве Rr; область в Rn.

Б. Дополнительно к условиям A предположим, что существует и непрерывна производная @f=@u; U выпуклое множество.

Для функционала (2) было получено следующее представление приращения:

I(u; u) = I(u; u) + o(u; );							(3)
где							(4)
= max (		k		f	kL	) :
x0	M0	k	u		kL
	2
В зависимости от условий A и	и вида вариации управления вариацию
I(u; u) представим либо в виде неклассической вариации
I(u; u) = Z0 T (t; xt) uf(t; xt; u(t))dt							(5)
или в виде классической вариации
I(u0; " u) = " G(u0); u u0 + o("):							(6)

100

При этом в случае игольчатой вариации u = u", а в случае классической вариации u = " u. При этом величина имеет порядок ".

Будем говорить, что функция !( ) является строго положительной при> 0, если

!( ) = inff!( ) : g > 0; > 0:

Предполагаем далее, что при всяком допустимом управлении u = u(t) и допустимой вариации u = u(t) возможно построение однопараметрического семейства вариаций, обозначаемого через "u, такого, что:

а) "u является допустимой вариацией при " 2 [0; "^], "^ > 0, при этом

"u "=^"= "^u = u;
б) вариация	I(u; u) при u = "u удовлетворяет неравенству

I(u; "u) "! (u) , " 2 [0; "^], где ! строго положительная функция, а (u) некоторый функционал на D или его подмножестве;

101

в) величина , определенная равенством (4), имеет порядок малости не меньше ", а следовательно, остаточный член o(u; ) в приращении (3) более высокого порядка малости, чем ".

Функционал (u) введем следующим образом:
(u) = u~2D (u; u u) :		(7)
sup	~

Будем говорить, что управление u0 = u0(t) есть стационарное управление, если выполняется равенство (u0) = 0.

В силу доказательства необходимых условий оптимальности, оптимальные управления являются стационарными, а стационарные управления удовлетворяют необходимым условиям оптимальности.

Из равенства (3) и условий a)–в) для приращения функционала при вариации управления "u имеем

I(u; "u) "! (u) + o(u; "):

(8)

102

Будем предполагать, что величина o(u; ") имеет равномерно по u 2 D более высокий порядок малости, чем ".

Построим следующий алгоритм определения стационарных управлений. Пусть u1 = u1(t) допустимое управление. Фиксируем некоторое "^ > 0 и вычислим (u1). Допустим, что

(u1) = I(u1; u) = I(u1; u^ u) > 0;

(9)

где u вариация, на которой достигается супремум (7). По вариации u

построим однопараметрическое семейство вариаций "u "=^"= u, удовлетворяющее условиям a)–в). Очевидно, что тогда из этих условий вытекает существование " 2 [0; "^], такого, что

I(u1; "u) < 0:	(10)
Более того, найдем такое "0, что
I(u1; "0u) = min I(u1; "u):	(11)
"2[0;"^]

103

При этом из неравенства (10) следует, что

I(u1; "0u) < 0:

(12)

Возьмем теперь в качестве следующего управления

u2(t) = u1(t) + "0u(t):

(13)

Учитывая (12), имеем I(u2) < I(u1).

Для управления u2 можно повторить те же построения, что и для управления u1. В случае, если (u2) = 0, полагаем u3 = u2. Следовательно, повторяя этот процесс, мы получим последовательность управлений

u1; u2; : : : ; uk; : : : ;

(14)

такую, что

I(u1) I(u2) : : : I(uk) : : : :

(15)

104

Последовательность управлений, для которой имеют место неравенства (15), будем называть невозрастающей последовательностью для функционала (2).

Рассмотрим поведение функции (u) на этой последовательности.

Теорема 1 Пусть функционал (2) ограничен снизу и пусть построена последовательность управлений (14) по указанному ранее алгоритму. Тогда

(uj) ! 0.

j!1

Доказательство Предположим, что теорема неверна. Тогда существуют0 > 0 и подпоследовательность управлений fujg последовательности (14), на которой выполняется неравенство

(uj) 0 > 0:

(16)

105

Пронумеруем эту подпоследовательность заново: считаем в дальнейшем j = 1; 2; : : :. По построению каждому управлению uj соответствует однопараметрическое семейство вариаций u"uj, удовлетворяющих условиям a)–в). Поэтому согласно (8) для приращения функционала имеем

I(uj; "uj) "! (uj) + o(uj; ");

(17)

причем, так как o(u; ") на (8) более высокого порядка малости, чем ", равномерно по управлениям u 2 D, то существует "~ 2 [0; "^], такое, что

jo(uj; ")j	1	"! (uj)	(18)
	2

для всякого uj из указанной подпоследовательности при " 2 [0; "~]. Выпишем с учетом неравенств (16) и (18) следующую цепочку нера-

венств:

min I(uj; "uj) min I(uj; "uj)

"2[0;"^]	"2[0;"~]	! (uj) i	"~
	"
	"2[0;"~] h 2		2!( 0) < 0:
	min

106

Это означает, что для произвольного j = 1; 2; : : : имеем

I(uj+1) I(uj) 2!( 0);

или, суммируя по j от l до k, получаем

k"~

I(uk+1) I(u1) + 2 !( 0):

Отсюда следует, что I(uk) ! 1, но это противоречит ограниченности

k!1

снизу функционала I(u).

Замечание 1 Отметим, что при доказательстве теоремы существенно предположение о том, что величина o(u; ") из соотношения (8) имеет более высокий порядок малости, чем ", равномерно по u 2 D. Однако на самом деле используется только равномерность по управлениям из последовательности fujg.

107

Выбор вариации u,способ построения по ней однопараметрического семейства вариаций "u и алгоритм минимизации в одномерном направлении (по ") определяют тот или иной метод спуска. В каждой конкретной задаче он обусловлен, например, ресурсами ЭВМ, простотой вычислительных схем и, естественно, тем результатом, который ожидается, и за какое время.

108

Соседние файлы в папке ТУ - лекции Овсянникова

#
16.04.2015150.85 Кб1618.Лемма о приращении.Ур-е в вариациях.pdf
#
16.04.2015154.37 Кб2219.Исследование приращения функционала.pdf
#
16.04.2015150.57 Кб3520.Игольчатая вариация.Принцип максимума Понтрягина.pdf
#
16.04.2015134.76 Кб1621.Линеаризованный принцип максимума.pdf
#
16.04.2015137 Кб2122.Вариационное исчисление.Условие сильного минимума.pdf
#
16.04.2015163.73 Кб1927.Методы спуска.pdf
#
16.04.2015128.04 Кб2028.Градиентный метод оптимизации.pdf
#
16.04.201542.3 Кб1729.Методы последовательного приближения.pdf
#
16.04.2015228.3 Кб1630.Управление пучком траекторий.pdf
#
16.04.2015169.4 Кб1731.Линейная траспортировка пучков.Программное управление.Задачи синтеза.pdf
#
16.04.2015147.96 Кб1632.Управление пучком траекторий в линейном случае.pdf