Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ТУ - лекции Овсянникова / 29.Методы последовательного приближения

.pdf
Скачиваний:
18
Добавлен:
16.04.2015
Размер:
42.3 Кб
Скачать

Лекция 29. Методы последовательного приближения на основе принципа максимума.

Ранее для функционала I

=

 

T φ(t, xt, u(t))dt + g(xT ) был получен

 

 

 

t0

принцип максимума в качестве

необходимого уcловия оптимальности. Ис-

 

 

пользуем его для построения последовательных приближений в пространстве управлений. Будем предполагать, что управления u = u(t) D L2(0, T ), u(t) U, t [0, T ] и выполнены необходимые для этого условия Рассмотрим задачу минимизации для этого функционала. Опишем один из возможных способов построения последовательности приближений uk. Пусть на k-м шаге итерационного процесса получено управление uk = uk(t).

Определим управление uk из условия максимума

k), u),

 

uk(t) = arg u U

(

t

k

(t, x

(1)

max H

 

t, x

, ψ

 

 

118

здесь H = ψ f. Функция ψk(t, x) определяется из уравнений

 

d

 

 

∂f t, x(t), u(t)

 

 

 

 

 

= (

 

)

 

 

 

(

 

 

 

 

)

 

dt

 

∂x

 

при конечных условиях

 

 

)

(

 

 

 

 

)

 

(

 

 

 

x(T )

 

 

T, x(T ) =

∂g(∂x

)

 

,

Введем функционалы

 

 

 

 

 

 

 

 

 

 

 

Qk(u) = 0 T [H(t, xt, ψk(t, xt), u(t)) − H(t, xt, ψk(t, xt), uk(t))] dt

и

 

 

 

1

 

 

 

 

 

 

 

 

 

 

β(u

) =

sup Q (u)

 

 

 

 

 

 

 

 

 

 

 

k

 

 

T u D

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(2)

(3)

(4)

(5)

119

Управление uk, очевидно, доставляет максимум функционалу (4) и, следовательно β(uk) = T1 Qk(uk). Рассмотрим функцию

ωk(t) = [H(t, xtψk(t, xt), uk(t)) − H(t, xt, ψk(t, xt), uk(t))]

(6)

Величина

1

 

1

0

T

 

 

 

(7)

β(uk) =

Qk(uk) =

ωk(t)dt

 

 

T

T

есть среднее значение функции ωk(t) на отрезке T0 = [0; T ]. Определим однопараметрическое семейство измеримых подмножеств Tk(ε) отрезка T0, удовлетворяющих условиям:

1.

Tk(ε) T0, ε [0, T ], mesTk(ε) = ε;

2.

1

Tk(ε) ωk(t)dt ≥ β(uk), ε (0, T ],

ε

120

и таких, что управления uk(t, ε) образуемые по правилу

 

uk(t, ε) =

uk(t), t

Tk(ε),

(8)

{ uk(t), t

 

T0 Tk(ε),

 

 

 

\

 

являются допустимыми управлениями при ε [0, T ]. Если β(uk) = 0,

то uk - стационарное управление. Если же β(uk) > 0, то построим однопараметрическое семейство управлений (8). Параметр ε затем выбирается из условия I(uk(t, ε)) < I(uk). Выберем εk, например, в соответствии с методом наискорейшего спуска

I(uk(t, εk)) = min I(uk(t, ε))

(9)

ε [0,T ]

 

и положим uk+1 = uk(t, εk). Построенная таким образом последовательность управлений uk является невозрастающей последовательностью, а однопараметрическое семейство вариаций

εuk = uk(t, ε) − uk(t), ε [0, T ]

(10)

121

управления uk удовлетворяет условиям а) в). Действительно, для приращения функционала имеем

I(uk, εuk) = δI(uk, εuk) + o(uk, ε),

(11)

где

 

 

δI(uk, εuk) =

ωk(t)dt ≤ −εβ(uk)

(12)

Tk(ε)

удовлетворяет условию б). Условия а), в) выполняются по построению. При этом в качестве допустимой вариации u по которой строится однопараметрическое семейство вариаций (10), рассматривается вектор-функция

uk = εuk|ε=T = uk(t) − uk(t).

При условии, что o(uk, ε) имеет более высокий порядок малости, чем ε, равномерно по всем uk, k = 1, 2, . . . следует β(uk) 0, при k → ∞

122

Отметим, что возможны и другие способы направленного улучшения неоптимального управления на основе принципа максимума. Рассмотрим следующую процедуру улучшения управления uk(t). Для функции (6) по построению имеем ωk(t) 0, t T0. В случае, если ωk(t) = 0 при почти всех t T0 управление uk(t) является стационарным управлением. Выделим точку θk T0, такую, что ωk(θk) > 0. Предполагаем, что θk - точка непрерывности управлений uk(t) и uk(t). Построим по точке θk множество

Tk(ε):

T

(ε) = [θ

k

ε

θk

, θ

 

+ ε

T − θk

], ε

 

[0, T ].

(13)

T

 

T

k

 

 

 

k

 

 

 

Управления uk(t, ε) построим по формуле (8). Так как при достаточно

малых ε

(14)

δI(uk, δεuk) = −ωk(θk)ε + 0(uk, ε),

где ωk(θk) > 0, то уменьшение значения функционала I(u) гарантировано и рассмотренная схема улучшения управления является корректной.

123

Отметим, что в качестве θk можно брать, например, точку максимума функции (6) на T0. Отметим, что в случае, если управление входит в правую часть уравнения линейно, а ограничения имеют вид типа |ui| ≤

1, i = 1, r, то из принципа максимума следует вид оптимального управления. А именно оптимальные управления есть кусочно-постоянные векторфункции. Учитывая это, оптимальное управление можно искать сразу в этом классе функций и задачу поиска оптимального управления рассматривать как задачу параметрической оптимизации, используя выражения для производных функционала по точкам переключения. Следует также отметить, что построение методов последовательных приближений может быть основано на рассмотрении уравнений с частными производными, с использованием которых были получены формулы для полного приращения минимизируемого функционала и его вариации.

124