Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
15
Добавлен:
16.04.2015
Размер:
145.23 Кб
Скачать

Лекция 29. Методы последовательного приближения на основе принципа максимума.

В главе 3 для функционала (6.2) [Ссылка из книги где впервые упомянут функ-

ционал I = R T '(t; xt; u(t))dt + g(xT )] был получен принцип максимума в качестве

t0

необходимого уcловия оптимальности. Используем его для построения последовательных приближений в пространстве управлений. В данном разделе предполагаем, что управления u = u(t) 2 D L2(0; T ); u(t) 2 U; t 2 [0; T ] и выполнены условия А § 5.1.[Ссылка] Рассмотрим задачу минимизации функционала (6.2). Опишем один из возможных способов построения последовательности приближений uk. Пусть на k-м шаге итерационного пропесса получено управление uk = uk(t). Определим управление uk из условия максимума

k( ) = arg u2U

 

t

;

k(

t; x

k)

 

(1)

u t

max H

 

t; x

 

 

; u ;

 

здесь H = f '. Функции

k(t; x) и k(t; x) определяются на указанном пучке

траекторий из уравнений

dt =

 

@x

!

 

@x

 

+

d

 

@f t; x(t); u(t)

 

 

 

@' t; x(t); u(t)

 

!

;(2)

при конечных условиях

 

 

 

 

 

@x

 

 

 

 

 

T; x(T )

=

 

 

 

;

(3)

 

 

 

 

 

@g x(T )

 

 

 

 

Введем функционалы

 

 

 

 

 

 

 

 

 

 

 

Qk(u) = Z0 T hH t; xt;

k(t; xt); u(t) H t; xt;

k(t; xt); uk(t)idt

(4)

и

 

 

1

 

 

 

 

 

 

 

 

 

(uk) =

sup Qk(u)

 

 

 

 

(5)

 

 

 

 

 

 

 

 

 

T u2D

 

 

 

 

 

Управление uk, очевидно, доставляет максимум функционалу (4) и, следовательно(uk) = T1 Qk(uk). Рассмотрим функцию

!k(t) = hH t; xt; k(t; xt); uk(t) H t; xt; k(t; xt); uk(t)i

(6)

Величина

T Z0

T

 

(uk) = T Qk(uk) =

(7)

!k(t)dt

 

1

 

1

 

 

 

есть среднее значение функции !k(t) на отрезке T0 = [0; T ]: Определим однопараметрическое семейство измеримых подмножеств Tk(") отрезка T0, удовлетворяющих условиям:

1.

Tk(") T0; " 2 [0; T ]; mesTk(") = ";

2.

1

RTk(") !k(t)dt (uk); " 2 (0; T ];

"

122

и таких, что управления uk(t; ") образуемые

по правилу

 

uk(t; ") =

(uk(t); t

T0

2 Tk(");

(8)

 

uk

(t); t

Tk(");

 

 

 

2

n

 

являются допустимыми управлениями при " 2 [0; T ]. Если (uk) = 0, то uk - стационарное управление. Если же (uk) > 0; то построим однопараметрическое семейство управлений (8). Параметр " затем выбирается из условия I(uk(t; ")) < I(uk). Выберем "k, например, в соответствии с методом наискорейшего спуска

I(uk(t; "k)) = min I(uk(t; "))

(9)

"2[0;T ]

 

и положим uk+1 = uk(t; "k): Построенная таким образом последовательность управлений uk является невозрастающей последовательностью, а однопараметрическое семейство вариаций

4"uk = uk(t; ") uk(t); " 2 [0; T ]

(10)

управления uk удовлетворяет условиям а) в) § 6.1. Действительно, для приращения функционала имеем (см. § 3.3)

4I(uk; 4"uk) = I(uk; 4"uk) + o(uk; ");

(11)

где

 

 

I(uk; 4"uk) = Z

!k(t)dt " (uk)

(12)

Tk(")

удовлетворяет условию б). Условия а), в)[ссылка на условия]выполняются по построению. При этом в качестве допустимой вариации 4u по которой строится однопараметрическое семейство вариаций (10), рассматривается вектор-функция

4uk = 4"ukj"=T = uk(t) uk(t):

При условии, что o(uk; ") имеет более высокий порядок малости, чем ", равномерно по всем uk; k = 1; 2; : : : по теореме 6.1 [Ссылка] следует (uk) ! 0, при k ! 1 Вопросы построения рассмотренных выше множеств Tk(") подробно рассмотрены в работах [25; 70; 96; 112]. Отметим, что возможны и другие способы направленного улучшения неоптимального управления на основе принципа максимума [15, 16, 24, 32, 52, 53, 73, 91, 93, 114]. Рассмотрим следующую процедуру улучшения управления uk(t). Для функции (6) по построению имеем !k(t) 0; t 2 T0. В случае, если !k(t) = 0 при почти всех t 2 T0 управление uk(t) является стационарным управлением. Выделим точку k 2 T0, такую, что !k( k) > 0. Предполагаем, что k - точка непрерывности управлений uk(t) и uk(t). Построим по точке k множество Tk("):

T

(") = [

k

"

k

;

 

+ "

T k

]; "

2

[0; T ]:

(13)

T

 

T

k

 

 

 

k

 

 

 

Управления uk(t; ") построим по формуле (8). Так как при достаточно малых "

I(uk; "uk) = !k( k)" + 0(uk; ");

(14)

где !k( k) > 0, то уменьшение значения функционала I(u) гарантировано и рассмот-

123

ренная схема улучшения управления является корректной. Отметим, что в качествеk можно брать, например, точку максимума функции (6) на T0 [96]. Отметим, что в случае, если управление входит в правую часть уравнения (6.1) [ссылка]линейно, а ограничения имеют вид типа juij 1; i = 1; r, то из принципа максимума следует вид оптимального управления. А именно оптимальные управления есть кусочнопостоянные вектор-функции. Учитывая это, оптимальное управление можно искать сразу в этом классе функций и задачу поиска оптимального управления рассматривать как задачу параметрической оптимизации, используя выражения для производных функционала по точкам переключения (см. § 3.7) [15, 16, 79, 80, 84, 85]. Следует также отметить, что построение методов последовательных приближений может быть основано на рассмотрении уравнений с частными производными, с использованием которых были получены формулы для полного приращения минимизируемого функционала и его вариации.

124

Соседние файлы в папке Лекции по ТУ