Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
14
Добавлен:
16.04.2015
Размер:
95.48 Кб
Скачать
из условия максимума

Лекция 29. Методы последовательного приближения на основе принципа максимума.

В главе 3 для функционала (6.2) [Ссылка из книги где впервые упомянут функ-

необходимогоRt0уcловияt оптимальности. Используем его для построения последова-

ционал I =

T '(t; x ; u(t))dt + g(xT )] был получен принцип максимума в качестве

тельных приближений в пространстве управлений. В данном разделе предполагаем, что управления u = u(t) 2 D ½ L2(0; T ); u(t) 2 U; t 2 [0; T ] и выполнены условия А Ÿ

5.1.[Ссылка] Рассмотрим задачу минимизации функционала (6.2). Опишем один из возможных способов построения последовательности приближений uk. Пусть на k

шаге итерационного пропесса получено управление uk = uk(t). Определим управление u¹k

u t

) = arg

max H

¡

t; x

; Ã

(t; x

); u ;

(1)

¹k(

u2U

t

k

k

¢

 

здесь H = äf ¡ '. Функции Ãk(t; x) è ¸k(t; x) определяются на указанном пучке траекторий из уравнений

 

dt = ¡ Ã

¡

@x

¢

!

¤

ª +

Ã

¡

@x

¢!

;

 

(2)

 

dª

 

 

@f t; x(t); u(t)

 

 

 

 

 

 

 

@' t; x(t); u(t)

 

 

 

 

 

при конечных условиях

 

ª¡T; x(T )¢ = ¡³

 

¡@x

¢

´¤;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(3)

 

 

 

 

 

 

 

 

 

 

 

 

@g x(T )

 

 

 

 

 

 

Введем функционалы

h

 

³

 

 

 

 

 

 

´

³

 

 

 

 

 

´i

 

Qk(u) = Z0T

 

 

 

 

 

 

 

 

 

 

 

 

(4)

 

H t; xt; Ãk(t; xt); u(t) ¡ H

t; xt; Ãk(t; xt); uk(t)

dt

è

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

¯(uk) =

 

sup Qk(u)

 

 

 

 

 

(5)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

T u2D

 

 

 

 

 

 

 

 

Управление u¹k, очевидно, доставляет максимум функционалу (4) и, следовательно

¯(uk) =

1

 

Qkuk). Рассмотрим функцию

 

 

 

 

 

 

 

 

 

T

!k(t) = hH³t; xtÃk(t; xt); u¹k(t)´ ¡ H³t; xt; Ãk(t; xt); uk(t)´i

 

Величина

(6)

1

 

1

Z0

T

 

 

 

 

 

 

 

 

 

 

 

(7)

 

 

 

¯(uk) =

 

Qk(u¹k) =

 

!k(t)dt

 

 

 

T

T

есть среднее значение функции !k(t) на отрезке T0 = [0; T ]: Определим однопара-

метрическое семейство измеримых подмножеств Tk(") отрезка T0, удовлетворяющих условиям:

1.

Tk(") ½ T0; " 2 [0; T ]; mesTk(") = ";

2.

1

RTk(") !k(t)dt ¸ ¯(uk); " 2 (0; T ];

 

"

122

и таких, что управления uk(t; ") образуемые по правилу

uk(t; ") =

u¹k(t); t

Tk(");

(8)

(uk(t); t

2

T0

2 Tk(");

 

 

 

n

 

являются допустимыми управлениями при " 2 [0; T ]. Åñëè ¯(uk) = 0, òî uk - стацио- нарное управление. Если же ¯(uk) > 0; то построим однопараметрическое семейство управлений (8). Параметр " затем выбирается из условия I(uk(t; ")) < I(uk). Выберем "k, например, в соответствии с методом наискорейшего спуска

I(uk(t; "k)) = min I(uk(t; "))

(9)

"2[0;T ]

 

и положим uk+1 = uk(t; "k): Построенная таким образом последовательность управлений uk является невозрастающей последовательностью, а однопараметрическое се-

мейство вариаций

4"uk = uk(t; ") ¡ uk(t); " 2 [0; T ]

(10)

 

управления uk удовлетворяет условиям а) в) Ÿ 6.1. Действительно, для приращения функционала имеем (см. Ÿ 3.3)

4I(uk; 4"uk) = ±I(uk; 4"uk) + o(uk; ");

ãäå

Z

±I(uk; 4"uk) = ¡

!k(t)dt · ¡"¯(uk)

 

Tk(")

(11)

(12)

удовлетворяет условию б). Условия а), в)[ссылка на условия]выполняются по построению. При этом в качестве допустимой вариации 4u по которой строится однопара-

метрическое семейство вариаций (10), рассматривается вектор-функция

4u¹k = 4"ukj"=T = u¹k(t) ¡ uk(t):

При условии, что o(uk; ") имеет более высокий порядок малости, чем ", равномерно по всем uk; k = 1; 2; : : : по теореме 6.1 [Ссылка] следует ¯(uk) ! 0, ïðè k ! 1 Вопросы построения рассмотренных выше множеств Tk(") подробно рассмотрены в работах [25; 70; 96; 112]. Отметим, что возможны и другие способы направленного улучшения

неоптимального управления на основе принципа максимума [15, 16, 24, 32, 52, 53, 73, 91, 93, 114]. Рассмотрим следующую процедуру улучшения управления uk(t). Äëÿ

функции (6) по построению имеем !k(t) ¸ 0; t 2 T0. В случае, если !k(t) = 0 при почти всех t 2 T0 управление uk(t) является стационарным управлением. Выделим точку µk 2 T0, такую, что !k(µk) > 0. Предполагаем, что µk - точка непрерывности управлений uk(t) è u¹k(t). Построим по точке µk множество Tk("):

T

(") = [µ

k ¡

"

µk

; µ

 

+ "

T ¡ µk

]; "

2

[0; T ]:

(13)

 

 

 

k

 

 

T

k

 

T

 

 

Управления uk(t; ") построим по формуле (8). Так как при достаточно малых "

±I(uk; ±"uk) = ¡!k(µk)" + 0(uk; ");

(14)

ãäå !k(µk) > 0, то уменьшение значения функционала I(u) гарантировано и рассмот-

123

ренная схема улучшения управления является корректной. Отметим, что в качестве µk можно брать, например, точку максимума функции (6) íà T0 [96]. Отметим, что

в случае, если управление входит в правую часть уравнения (6.1) [ссылка]линейно, а ограничения имеют вид типа juij · 1; i = 1; r, то из принципа максимума следу-

ет вид оптимального управления. А именно оптимальные управления есть кусочнопостоянные вектор-функции. Учитывая это, оптимальное управление можно искать сразу в этом классе функций и задачу поиска оптимального управления рассматривать как задачу параметрической оптимизации, используя выражения для производных функционала по точкам переключения (см. Ÿ 3.7) [15, 16, 79, 80, 84, 85]. Следует также отметить, что построение методов последовательных приближений может быть основано на рассмотрении уравнений с частными производными, с использованием которых были получены формулы для полного приращения минимизируемого функционала и его вариации.

124

Соседние файлы в папке Лекции по ТУ