Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

28 исправленная

.pdf

Скачиваний:

Добавлен:

16.04.2015

Размер:

56.83 Кб

Скачать

☆

Лекция 28. Градиентный метод оптимизации.

Исследуем задачу минимизации (1)-(2) лекции 27. При этом будем предполагать, что управление u = u(t) D L22(0, T ), u(t) U, t [0, T ], U — выпуклое компактное множество в пространстве Rr. Будем также считать, что выполнены условия A,

Б лекции 27.

Пусть u D и ∆u = ∆u(t) — допустимая вариация управления u. Рассмотрим управление u˜ = u + ε∆u. В силу выпуклости множества U управление u˜ D при

ε [0, 1]. Для приращения функционала в данном случае имеем
			∆I(u, ε∆u) = εδI(u, ε∆u) + o(u, ε),														(1)
где
	δI(u, ε∆u) = ε −G(u), ∆u = −ε ∫0 T l (t, u)∆u(t) dt,																(2)
						∂H t, x			, Ψ(t, x			), u(t)
				l (t, u) =		(		t			t			)			(3)
				l (t, u) =		(				∂u,				)			(3)
						H = Ψ f − φ,											(4)
а функция Ψ(t, x) удовлетворяет на траекториях системы (??) уравнению
	dΨ			∂f t, x(t), u(t)							∂φ t, x(t), u(t)
	dΨ			∂f t, x(t), u(t)							∂φ t, x(t), u(t)
		= −	(	(		)	)		Ψ + (			(			)	) ,	(5)
	dt	= −	(	(	∂x	)	)		Ψ + (			(		∂x	)	) ,	(5)
при конечном условии
										∂g x(T )
				Ψ(T, x(T )) = −(						(∂x		)	) .				(6)

Функционал −G(u), определяемый в (2), и вектор-функцию −l(t, u) называют градиентом функционала I(u). Вектор-функцию l(t, u) будем называть антиградиентом функционала I(u). Формулы (1)–(4) позволяют строить различные градиентные методы минимизации в рассматриваемой задаче [24, 80, 113].

Метод условного градиента. Определим функционал
β(u) = sup G(u), u˜ − u .	(7)
u~ D

Построим невозрастающую последовательность управлений (1)–(4) с учетом определения (7) для β(u). Пусть uk D и u¯k определяются из условия

sup G(uk), u = G(uk), u¯k .				(8)
u D
Очевидно, что β(uk) = G(uk), u¯k − uk . Полагаем
				(9)
uk+1 = uk + ε∆uk,			∆uk = u¯k − uk.	(9)
Выберем εk из условия				(10)
I(uk+1) = inf		I(uk + ε∆uk).		(10)
	" [0;1]

Отметим, что существуют разные способы выбора величины εk. Так, например, воз-

119

можно априорное задание величины εk из условий [?]

		∑
		∞
0 ≤ ε ≤ 1, k = 0, 1, . . . ,	klim εk = 0,	εk = +∞.
	→∞	k=1

Примером может служить гармонический ряд

εk = k .

Построение последовательности приближений по правилу (8)–(10) называют методом условного градиента.

Рассмотрим теперь метод проекции градиента. Пусть H — гильбертово пространство. Под проекцией точки u H на множество V H понимается точка w H, такая, что

u − w H = inf u − w H .

v V

Если V — выпуклое замкнутое множество в H, то всякая точка u H имеет единственную проекцию на это множество [?].

Пусть uk D, а	u¯k = PD				l(t, uk)	(11)

есть проекция антиградиента	l(t, uk)	на	D	.	Заменив в формуле (9) u¯k на (11), получим
					(	)

последовательность управлений {uk}, соответствующую методу проекции градиента. Величина εk, как и в предыдущем случае, может выбираться разными способами.

Этот метод удобен, когда имеется явная формула для проекции градиентна (антиградиента). Так, в задачах управления ограничения на множество U часто имеют

вид		{u = (u1, . . . , ur) : αi ≤ ui ≤ βi}.				(12)
В этом случае	U =	{u = (u1, . . . , ur) : αi ≤ ui ≤ βi}.				(12)
			α ,	l t, u ) < α ,
	u¯ki	=	li(i t, uk),	αi(i ≤ lki(t, uk)i	≤ βi,	(13)
			βi,	li(t, uk) ≥ βi.
Отметим, что в	рассмотренных случаях построено однопараметрическое семей-
Отметим, что в

ство вариаций ∆"u = ε∆uk,удовлетворяющее условиям a)–в) из предыдущей лекции. При этом в последнем случае в качестве функционала β(u) следует взять

∫ T ( )

β(u) = l (t, u)PD l(t, u) dt, (14)

а функцию ω(α) следует положить равной α в обоих случаях. Поведение функционала β(uk) при k −→ ∞ определяется теоремой 1 лекции 27.

Возможны, как уже говорилось, и другие методы построения минимизирующей последовательности на основе градиента. Так, полезными и эффективными в задачах управления оказываются овражные методики и методы, использующие специальные весовые функции [?, ?].

Таким образом, общие схемы построения минимизирующих последовательностей на основе градиента для задач управления сохраняются.

Обсудим вычислительный аспект спуска по антиградиенту. Одна из основных

120

трудностей здесь — вычисление антиградиента l(t, u). Представим интеграл (3) в виде

N	(	)
∑i	(	)	(15)
l(t, u)	S	t, x(t, x0i, u) ,	(15)
=1

()

где S t, x(t, x0i, u) — подынтегральная функция (3), вычисленная в момент t в точке

x(t) траектории системы (??) при управлении u = u(t), исходящей из точки x .

( ) 0

Для вычисления S t, x(t, x0i, u) нужно

1.проинтегрировать систему (??) от 0 до T при управлении u(t) с начальными условиями x(0) = x0i, i = 1, N;

2.проинтегрировать в обратном порядке от T до 0 уравнение (5) при условии на правом конце (6).

При этом возможны два подхода к интегрированию вспомогательного уравнения (5). А именно: можно интегрировать уравнение (5), предварительно “запомнив” решения прямой системы, либо интегрировать в обратном порядке прямую (??) и вспомогательную (5) системы уравнений вместе. Первый способ используется обычно при достаточной памяти ЭВМ, второй — когда этого нет либо ЭВМ имеет большое быстродействие.

Отметим, что так как все вычисления проводятся с некоторой погрешностью, то в результате построения последовательности {uj} при некотором j = k можно получить управление, такое, что

β(uk) ≥ ε,˜ ε˜ > 0, ∆I(uk, ∆"uk ) ≥ 0, ε [0, ε¯].

Здесь ε˜ —константа, характеризующая точность вычиcлений. Следовательно, стационарная точка функционала ищется с точностью, определенной точностью вычислений. В этом случае, а также тогда, когда уменьшение функционала I(u) при j ≥ k происходит меньше, чем на ε′ (где ε′ —достаточно малое число, определяемое той точностью, с которой ищется минимум функционала I(u)), управление uk будем называть “почти стационарным”. Таким образом, при машинной реализации указанных алгоритмов мы находим “почти стационарное управление”. Очевидно, что при решении практических задач не обязательно отыскание точного минимума (10), важно лишь, чтобы происходило существенное уменьшение функционала I(u). В связи с этим выделяется направление предполагаемого существенного уменьшения функционала I(u).

121

Соседние файлы в папке Лекции по ТУ

#
16.04.2015102.71 Кб1624.pdf
#
16.04.2015119.43 Кб1625.pdf
#
16.04.201597.47 Кб1726.pdf
#
16.04.201559.98 Кб1727 исправленная.pdf
#
16.04.2015123.96 Кб1627.pdf
#
16.04.201556.83 Кб1628 исправленная.pdf
#
16.04.2015115.77 Кб1728.pdf
#
16.04.2015145.23 Кб1729 исправленная.pdf
#
16.04.201595.48 Кб1629.pdf
#
16.04.2015290.64 Кб1730 исправленная.pdf
#
16.04.2015115.24 Кб1932.pdf