Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Opt_book_1

.pdf
Скачиваний:
110
Добавлен:
03.06.2015
Размер:
1.2 Mб
Скачать

2.2. ВЫПУКЛЫЕ ФУНКЦИИ

71

Доказательство. Согласно лемме 2.2.1 функция Ã(®), имеющая вид (2.2.23), является неубывающей и ограниченной снизу на множестве A+. Поэтому существует предел Ã(®) при ® # 0, который и есть f0(x0; s). Справедливость неравенства f0(x0; s) · Ã(®) следует опять же из-за монотонности функции Ã(®). ¥

Замечание 2. Если функция f(x) дифференцируема в точке x0, то, как известно из анализа, ее производная по любому направлению s 2 Rn существует и имеет место формула:

f0(x0; s) = hfx(x0); si;

(2.2.25)

где fx(x0) градиент функции f(x) в точке x0.

Рассмотрим вопрос о поведении производной по направлению f0(x0; s), как функции второго аргумента s. Напомним, функция f(x) называется положительно однородной, если f(¸x) = ¸f(x) для ¸ > 0. Выпуклые положительно однородные функции удовлетворяют условию:

¡ ¡ ¢¢ ¡ ¢

f(x1 + x2) = f 2 12 x1 + 12 x2 = 2f 12 x1 + 12 x2 ·

·f(x1) + f(x2);

из которого, полагая в частности, x1 = 0n, x2 = x, получаем: f(x) · f(0n) + f(x) или f(0n) ¸ 0. Для замкнутых выпуклых положительно однородных функций обязательно f(0n) = 0, поскольку в этом случае справедливо и противоположное неравенство.

f(0n) ·

lim f(¸x) = lim ¸f(x) = f(x) lim ¸ = 0:

¸ 0

¸

0

¸

0

 

#

#

 

#

 

Теорема 2.2.14. Пусть f(x) выпуклая функция на выпуклом множестве X µ Rn и пусть x0 2 riX. Тогда f0(x0; s) есть положительно однородная функция от второго аргумента s на множестве LinX.

Доказательство. Положительная однородность функции f0(x0; s) по s следует непосредственно из определения (2.2.24), так как

f0(x0

; ¸s) = lim

f(x0 + ®¸s) ¡ f(x0)

= ¸ lim

f(x0 + ®¸s) ¡ f(x0)

= ¸f0(x0; s):

®

(®¸)

 

®#0

®#0

 

Далее, в силу выпуклости функции f(x) для ¸1 ¸ 0, ¸2 ¸ 0, ¸1 + ¸2 = 1 и s1LinX, s2 2 Lin выполняется

f(x0+®(¸1s1+¸2s2))¡f(x0) =

= f(¸1(x0+®s1)+¸2(x®0+®s2))¡(¸1+¸2)f(x0) ·

®

·¸1 f(x0+®s1)¡f(x0) + ¸2 f(x0 = ¸1f0(x0; s1) + ¸2f0(x0; s2):

®®+®s2)¡f(x0

Отсюда после перехода к пределу по ® # 0 получаем

f0(x0; ¸1s1 + ¸2s2) · ¸1f0(x0; s1) + ¸2f0(x0; s2):

Таким образом f0(x0; s) выпукла по s. ¥

По теореме 2.2.13 выпуклая функция имеет производные по направлениям во всех точках, принадлежащих относительной внутренности множества своего определения, но, вообще говоря, может

72

ГЛАВА 2. НАЧАЛЬНЫЕ СВЕДЕНИЯ ИЗ ВЫПУКЛОГО АНАЛИЗА

не иметь в этих точках частных производных и, следовательно, градиента. Однако можно ввести понятие субградиента, которое заменяет в некотором смысле понятие градиента.

Определение 2.2.7. Пусть f(x) функция, определенная на множестве X µ Rn. Тогда вектор a 2 Rn называется субградиентом функции f(x) в точке x0 2 X, если

f(x) ¡ f(x0) ¸ ha; x ¡ x0i 8x 2 X:

(2.2.26)

Множество всех субградиентов функции f(x) в точке x0 называется ее субдифференциалом в x0 и обозначается @Xf(x0). Если множество X совпадает со всем пространством Rn, то будем просто писать @f(x0).

Здесь понятия субградиента и субдифференциала введены для произвольной функции f(x) и произвольного множества X. Однако наиболее содержательны они для выпуклых функций и выпуклых множеств. Действительно, если выпуклая функция f(x) дифференцируема в точке x0, то согласно теореме 2.2.8 имеет место неравенство

f(x) ¡ f(x0) ¸ hfx(x0); x ¡ x0i x 2 X:

(2.2.27)

Таким образом, градиент всегда является и субградиентом выпуклой функции. Покажем, что на самом деле даже негладкие выпуклые функции обладают субградиентами во всех относительно внутренних точках множества X.

Теорема 2.2.15. Пусть f(x) функция, определенная на выпуклом множестве X µ Rn и точка x0 2 riX. Тогда:

1.Если f(x) выпуклая функция на X, то @Xf(x0) 6= ; и @Xf(x0) является выпуклым замкнутым множеством;

2.Если @Xf(x) 6= ; для всех x 2 X, то f(x) выпуклая функция на X.

Доказательство. Докажем сначала первое утверждение. Пусть f(x) выпуклая функция на X. Рассмотрим ее надграфик epi f, которое является выпуклым множеством и возьмем точку [x0; f(x0)] 2 epi f. Понятно, что [x0; f(x0)] 2= ri(epi f). Тогда по теореме 2.1.15 точка [x0; f(x0)]

собственно отделима от epi f, т.е. существуют [a; ®] 2 Rn+1, не равные нулевому вектору в совокупности, и такие, что

h[a; ®]; [x; ¹]i ¸ h[a; ®]; [x0; f(x0)]i

(2.2.28)

для всех [x; ¹] 2 epi f. Кроме того, можно указать такое [¹x; ¹] 2 epi f, что

 

h[a; ®]; x; ¹]i > h[a; ®]; [x0; f(x0)]i:

(2.2.29)

Если ® = 0, то a =6 0n и неравенства (2.2.29) и (2.2.28) переходят в соответственно ha; x¹i > ha; x0i

и

ha; xi ¸ ha; x0i 8 x 2 X:

Но это означает, что точка x0 2 riX собственно отделима от X, что быть не может.

Предположим теперь, что ® 6= 0. Тогда обязательно ® > 0, так как, если ® < 0, то, устремляя ¹ ! +1, приходим к нарушению неравенства (2.2.28). Положим, не умаляя общности, ® = 1. Неравенство (2.2.28) в этом случае перепишется как

ha; xi + ¹ ¸ ha; x0i + f(x0) 8 x 2 X; 8 ¹ ¸ f(x):

2.2. ВЫПУКЛЫЕ ФУНКЦИИ

73

В частности, беря ¹ = f(x), получаем

f(x) ¡ f(x0) ¸ h¡a; x ¡ x0i 8 x 2 X:

Откуда следует, что ¡a 2 @Xf(x0). Таким образом, субдифференциал @Xf(x0) содержит по крайней мере вектор ¡a и, стало быть, не является пустым множеством. Его замкнутость и выпуклость следует непосредственно из определения 2.2.7 субдифференциала.

Докажем теперь второе утверждение. Пусть точки x1 2 X, x2 2 X произвольны и пусть 0 ·

¸ · 1. Положим x = ¸x1 + (1 ¡ ¸)x2. Так как x 2 X и @Xf(x) 6= ;, то существует a 2 @Xf(x), для которого

f(x1) ¡ f(x) ¸ ha; x1 ¡ xi; f(x2) ¡ f(x) ¸ ha; x2 ¡ xi:

Умножим первое неравенство на ¸, второе на 1 ¡ ¸, и сложим

¸f(x1) + (1 ¡ ¸)f(x2) ¡ f(x) ¸ ¸ha; x1 ¡ xi + (1 ¡ ¸)ha; x2 ¡ xi = = ¸ha; x1 ¡ ¸x1 ¡ (1 ¡ ¸)x2i+

+ (1 ¡ ¸)ha; x2 ¡ ¸x1 ¡ (1 ¡ ¸)x2i =

= ¸(1 ¡ ¸)ha; x1 ¡ x2i ¡ ¸(1 ¡ ¸)ha; x1 ¡ x2i = 0:

Таким образом,

f (¸x1 + (1 ¡ ¸)x2) · ¸f(x1) + (1 ¡ ¸)f(x2):

Следовательно, f(x) выпуклая функция на X. ¥

Можно дополнительно показать, что в случае, когда выпуклое множество X обладает непустой внутренностью, субдифференциал @Xf(x) выпуклой функции f(x) в любой точке x 2 intX оказывается ограниченным множеством.

Теорема 2.2.16. Пусть f(x) выпуклая функция на выпуклом множестве X µ Rn и пусть x0 2 intX. Тогда @Xf(x0) выпуклое компактное множество.

Доказательство. Замкнутость и выпуклость f(x) следует из предыдущей теоремы. Поэтому остается доказать только ограниченность @Xf(x0). Пусть a 2 @Xf(x0) и пусть a =6 0n. Так как x0 2 intX, то можно указать " > 0 такое, что ¢"(x0) = x0 + "B µ X, где B единичный шар в Rn с центром в нуле. Обозначим f¤ = maxx2¢" (x0). Из непрерывности выпуклой функции f(x) на ¢"(x0) следует, что максимум достигается и f¤ · +1.

Согласно определению субградиента для любого x 2 X выполняется неравенство ha; x ¡ x0i · f(x) ¡ f(x0). В частности, беря x = x0 + "kak¡1a 2 ¢"(x0), получаем

f(x0 + "kak¡1a) ¡ f(x0) · ha; x ¡ x0i = "kak:

Отсюда, поскольку f(x0 + "kak¡1a) · f¤ получаем: kak · "¡1(f¤ ¡ f(x0)) < +1, что в силу произвольности субградиента a означает ограниченность @Xf(x0). ¥

Если взять выпуклую функцию f(x) = jxj, определенную на действительной прямой R, то для нее субдифференциал @f(0) совпадает с отрезком [¡1; 1]. Во всех остальных точках R данная функция дифференцируема.

В относительно граничных точках множества X субдифференциал может быть пустым. Приведем пример такой функции

p

f(x) = ¡ 1 ¡ x2; X = [¡1; 1] ½ R:

74

ГЛАВА 2. НАЧАЛЬНЫЕ СВЕДЕНИЯ ИЗ ВЫПУКЛОГО АНАЛИЗА

В точках §1 касательные к графику выпуклой функции f(x) принимают вертикальное положение. Можно привести также пример выпуклой функции, у которой субдифференциал в граничных точках множества X не пуст. Пусть ±(xjX) индикаторная функция непустого выпуклого замкнутого множества X µ Rn и пусть x0 2 X. Согласно определению, вектор a 2 Rn будет субградиентом

±(xjX) в точке x0, если

ha; x ¡ x0i · ±(xjX) ¡ ±(x0jX) = 0 8 x 2 X:

(2.2.30)

О векторе a, удовлетворяющем неравенству (2.2.30), говорят как о нормали к множеству X в точке x0. Совокупность всех нормалей в точке x0 2 X образует конус, называемый нормальным конусом к X в этой точке и обозначаемый N(x0jX). Таким образом, субдифференциал индикаторной функции множества X в граничной точке x0 2 X совпадает с нормальным конусом N(x0jX) к X в этой точке.

Рассмотрим теперь связь между производными выпуклой функции по направлениям и ее субградиентами.

Теорема 2.2.17. Пусть f(x) выпуклая функция на выпуклом множестве X µ Rn. Пусть, кроме того, x0 2 riX. Тогда:

1.

имеет место следующая формула для субдифференциала:

 

 

 

@Xf(x0) = ©a 2 Rn : ha; si · f0(x0; s)

8 s 2 LinX; s 6= 0nª;

(2.2.31)

2.

для любого ненулевого s 2 LinX

 

 

 

 

 

 

 

f0(x ; s) =

a

 

max

a; s

:

(2.2.32)

 

0

2

@Xf(x0)h

i

 

 

 

 

 

 

 

 

Доказательство. Убедимся сначала в справедливости формулы (2.2.31). Обозначим, через Y правую часть (2.2.31) и пусть a 2 Y . Беря любые x 2 X, получаем, что s = x ¡ x0 2 LinX. Поэтому согласно неравенству из утверждения теоремы 2.2.13

f(x) ¡ f(x0) = f(x0 + s) ¡ f(x0) = Ã(1) ¸ f0(x0; s) ¸ ha; si = ha; x ¡ x0i:

Отсюда делаем вывод, что a 2 @Xf(x0).

С другой стороны, пусть a 2 @Xf(x0). Тогда, поскольку x0 2 riX, то для любого s 2 LinX и достаточно малого ® > 0 точка x = x0 + ®s 2 X. Следовательно, в силу определения субградиента,

f(x0 + ®s) ¡ f(x0) = f(x) ¡ f(x0) =¸ ha; x ¡ x0i = ®ha; si:

Деля данное неравенство на ® > 0 и переходя к пределу при ® # 0, приходим с учетом определения (2.2.24) производной по направлению к неравенству: ha; si · f0(x0; s). Таким образом, s 2 Y .

Докажем теперь равенство (2.2.32). Поскольку для субдифференциала имеет место представление (2.2.31), то для этого достаточно показать, что найдется по крайней мере один элемент a 2 @Xf(x0), для которого

ha; si ¸ f0(x0; s) 8 s 2 LinX:

(2.2.33)

Пусть s 22 LinX и s =6 0n. Введем в рассмотрение в пространстве Rn+1 два множества:

n o

Y1 = [x; ¹] 2 Rn+1 : x 2 X; ¹ > f(x) ;

2.2. ВЫПУКЛЫЕ ФУНКЦИИ

75

n

Y2 = [x; ¹] 2 Rn+1 : x = x(®)

o

2 X2; ¹ = g(x(®)) :

Первое из этих множеств является незамкнутым надграфиком функции f(x), а второе луч, выпущенный их точки [x0; f(x0)] в направлении [s; f0(x0; s)]. Множества Y1 и Y2 не пересекаются, тем более не пересекаются их относительные внутренности. Поэтому по теореме 2.1.16 они могут быть

собственно отделимы. Это означает, что найдется вектор [a; b]

2

R

n+1

, обе компоненты которого

a 2 Rn и b 2 R не равны нулю в совокупности, и такой, что

 

 

 

h[a; b]; [x1; ¹1]i ¸ h[a; b]; [x2; ¹2]i 8[x1; ¹1] 2 Y1;

8[x2; ¹2] 2 Y2;

(2.2.34)

при этом можно указать [¹x1; ¹1] 2 Y1 и [¹x2; ¹2] 2 Y2, для которых неравенство (2.2.34) строгое. Так как величина ¹ в множестве Y1 может принимать бесконечно большие значения, то вто-

рая компонента b в векторе [a; b] обязательно должна быть неотрицательной, чтобы не привести к

нарушению (2.2.34). Если b = 0, то a =6 0n и неравенство (2.2.34) переходит в

ha; x1i ¸ ha; x2i 8 x1 2 X; 8 x2 2 X2 = ©x 2 Rn : x = x0 + ®s; ® ¸ 0ª;

причем для некоторых x¹1 2 X и x¹2 2 X2 это неравенство строгое. Выполнение этих двух неравенств означает собственную отделимость множеств X и X2. Последнее на основании теоремы 2.1.16 невозможно, поскольку из предположений x0 2 riX и s 2 LinX следует, что относительные внутренности множеств X и X2 пересекаются. Поэтому обязательно b > 0 и можно положить b = 1.

Тогда неравенство (2.2.34) с учетом вида множеств Y1 и Y2 принимает вид:

ha; xi + ¹ ¸ ha; x0 + ®si + f(x0) + ®f0(x0; s)

(2.2.35)

для всех x 2 X, ¹ > f(x) и ® ¸ 0. В силу непрерывности данное неравенство сохраняется и для ¹ = f(x), т.е. имеем

f(x) + ha; xi ¸ f(x0) + ®f0(x0; s) + ha; x0 + ®si; 8 x 2 X; 8 ® ¸ 0:

(2.2.36)

Полагая в (2.2.36) ® = 0, приходим к неравенству

f(x) ¡ f(x0) ¸ h¡a; x ¡ x0i 8 x 2 X;

на основании которого заключаем, что ¡a 2 @Xf(x0). Но, если в (2.2.36) взять x = x0 и ® > 0, то получаем h¡a; si ¸ f0(x0; s), т.е. данный вектор ¡a 2 @Xf(x0) удовлетворяет условию (2.2.33). Таким образом, равенство (2.2.32) действительно имеет место. ¥

Замечание 3. Формулу (2.2.32) можно рассматривать как обобщение формулы (2.2.25) на случай негладких выпуклых функций.

Определение 2.2.7 субдифференциала по существу нелокальное, так как основано на нелокальном определении (2.2.26) субградиента (требуется знать вид функции f(x) на всем множестве X). Однако, как следует из теоремы 2.2.17, оно становится локальным в случае выпуклой функции f(x). Тогда субдифференциал в точке x0 полностью определяется поведением f(x) в некоторой окрестности этой точки.

Как уже отмечалось, в случае, когда выпуклая функция дифференцируема, ее градиент является субградиентом и следовательно содержится в субдифференциале. Следующее утверждение показывает, что на самом деле для дифференцируемых функций субдифференциал состоит только из одного элемента, а именно, градиента.

Теорема 2.2.18. Пусть f(x) выпуклая функция на выпуклом множестве X µ Rn и пусть x0 2 intX. Тогда:

76

ГЛАВА 2. НАЧАЛЬНЫЕ СВЕДЕНИЯ ИЗ ВЫПУКЛОГО АНАЛИЗА

1.если f(x) дифференцируема в x0, то субдифференциал в точке x0 состоит только из градиента функции f(x) в этой точке, т.е. @Xf(x0) = ffx(x0)g;

2.если субдифференциал в точке x0 состоит из единственного вектора a, то f(x) дифференцируема в x0 и fx(x0) = a.

Доказательство. Так как функция f(x) дифференцируема в точке, то, согласно (2.2.27), fx(x0) 2 @Xf(x0). Кроме того, из x0 2 intX вытекает, что производная f0(x0; s) определена для любого направления s 2 Rn и опять же в силу дифференцируемости f(x) для нее справедливо представление f0(x0; s) = hfx(x0); si.

Предположим теперь, что a 2 @Xf(x0). Тогда на основании формулы (2.2.31) для любого s 2 Rn должно выполняться неравенство: ha; si · f0(x0; s) = hfx(x0); si. Отсюда, полагая s = a ¡ fx(x0),

получаем: ha¡fx(x0); si = ka¡fx(x0)k2 · 0, что возможно только, когда a = fx(x0). Таким образом, субдифференциал состоит из единственного элемента, а именно, градиента fx(x0).

Докажем теперь второе утверждение теоремы. Пусть B = fx 2 Rn : kxk · 1g единичный шар с центром в начале координат и пусть U®(x0) = x0 + ®B Поскольку x0 2 intX, можно указать 0 < ®¹ · 1 такое, что U®¹(x0) ½ intX µ X. Введем в рассмотрение функцию

Á(®; s) = f(x0 + ®s) ¡ f(x0) ¡ ha; si;

®

определенную при s 2 B и 0 < ® · ®¹. Так как a единственный элемент в @Xf(x0), то в силу равенства (2.2.32): ha; si = f0(x0; s) для любого ненулевого s. Поэтому, как следует из теоремы 2.2.24, Á(®; s) ¸ 0 и при фиксированном s существует предел функции Á(®; s) при ® ! +0, равный нулю. Более того, поскольку x0 + ®s 2 intX для s 2 B и 0 < ® · ®¹, функция Á(®; s) непрерывна по s на компактном множестве B. В этом случае сходимость относительно ® является равномерной по s. Таким образом, для любого " > 0 можно указать 0 < ®^ · ®¹ такое, что 0 · Á(®; s) · " для 0 · ® · ®^ и всех s 2 B.

Если взять s 2 B такое, что ksk · ®^2 и положить ¯ = ®^¡1ksk, h = ®^ksk¡1s, то 0 < ¯ · ®^ и khk = ®^ · 1. Поэтому 0 · Á(¯; h) · ". Данное неравенство можно переписать как

0 · f(x0 + s) ¡ f(x0) ¡ ha; si · ®":^ ksk

Отсюда следует существование предела

lim f(x0 + s) ¡ f(x0) ¡ ha; si = 0:

s!s ksk

означающего дифференцируемость функции f(x) в точке x0. При этом существует и градиент fx(x0), причем fx(x0) = a. ¥

В общем случае, когда выпуклая функция f(x) не дифференцируема, точкам из X может сопоставляться целое множество субградиентов, т.е. субдифферециальное отображение x ! @Xf(x) ½ Rn. Данное отображение, аргументами которого являются точки x 2 X, а значениями множества @Xf(x), относится к так называемым точечно-множественным отображением, причем выпуклозначным точечно-множественным отображением, поскольку @Xf(x) есть выпуклое множество для любого x 2 X. Субдифференциальное отображение для выпуклых функций обладает рядом весьма интересных свойств.

Определение 2.2.8. Пусть x 2 X µ Rn. Точечно-множественное отображение x ! F (x) ½ Rn, определенное на X, называется:

2.2. ВЫПУКЛЫЕ ФУНКЦИИ

77

1.замкнутым, если из условий xk 2 X, yk 2 F (xk) и xk ! x 2 X, yk ! y 2 Rn, следует, что y 2 F (x);

2.монотонным, если для всех x1 2 X, x2 2 X и a1 2 F (x1), a2 2 F (x2) выполняется неравенство: ha2 ¡ a1; x2 ¡ x1i ¸ 0;

3.локально ограниченным, если из условий xk 2 X, yk 2 Y и xk ! x 2 X следует, что последовательность fykg ограничена.

Теорема 2.2.19. Пусть f(x) выпуклая функция, определенной на открытом выпуклом множестве X µ Rn. Тогда субдифференциальное отображение x ! @Xf(x) является замкнутым, монотонным и локально ограниченным.

Доказательство. Покажем сначала, что субдифференциальное отображение замкнуто. Предположим, что xk 2 X, ak 2 @X(xk), xk ! x 2 X и ak ! a. Имеем для всех k · 1:

f(y) ¡ f(xk) ¸ hak; y ¡ xki 8y 2 X:

(2.2.37)

Отсюда, так как выпуклая функция непрерывна в точке x, после перехода к пределу приходим к неравенству f(y) ¡ f(x) ¸ ha; y ¡ xi, справедливому для всех y 2 X. Следовательно, @Xf(x) замкнутое отображение.

Пусть теперь x1 2 X, x2 2 X и a1 2 @Xf(x1), a22 2 @Xf(x2). Тогда согласно определению субградиента

f(x1) ¡ f(x2) ¸ ha2; x1 ¡ x2i; f(x2) ¡ f(x1) ¸ ha1; x2 ¡ x1i:

Складывая эти два неравенства, получаем: ha2 ¡ a1; x2 ¡ x1i ¸ 0, что означает монотонность отоб-

ражения @Xf(x).

Докажем наконец локальную ограниченность субдифференциального отображения. Возьмем последовательность точек kxkk из X такую, что xk ! x. Пусть ak 2 @Xf(xk) выбраны произвольным образом. Тогда для этих xk и ak выполняется (2.2.37). Предположим, что последовательность fakg не ограничена. Тогда найдется такая подпоследовательность faks g, что kaks k ! 1. Будем считать, не умаляя общности, что для самой последовательности kakk выполняется: kakk ! 1 и, кроме того, ak=kakk ! a¹. Понятно, что ka¹k = 1. Если разделить неравенства (2.2.37) на kakk, то после перехода к пределу получим: ha;¹ y ¡ xi · 0 для всех y 2 X. Но множество X открытое, и следовательно точка y = x + ®a¹ 2 X для достаточно малых положительных ®. Подставляя эту точку в предыдущее неравенство, приходим к выводу, что a¹ = 0n. Мы пришли к противоречию и, стало быть, последовательность fakg ограничена. ¥

Нетрудно видеть, что если g(x) выпуклая функция и @Xg(x0) ее субдифференциал в точке x0 2 X, то у функции f(x) = ®g(x), где ® > 0, которая также выпукла, субдифферениал в этой точке равен @Xf(x0) = ®@Xg(x0). Но и такие операции, как сложение двух выпуклых функций или взятие максимума от нескольких выпуклых функций, также сохраняют их выпуклость. Выясним, как можно вычислить субдифференциал результирующей функции при этих операциях, зная субдифференциалы исходных функций. Начнем с операции сложения двух функций.

Теорема 2.2.20. ( Моро-Рокафеллара). Пусть f1(x) и f2(x) выпуклые функции, определенные соответственно на множествах X1 и X2, и пусть X0 = riX1 \riX2 =6 ;. Тогда в любой точке x0 2 X0 субдифференциал функции f(x) = f1(x) + f2(x) относительно множества X = X1 \ X2 существует и равен

@Xf(x0) = @X1 f1(x0) + @X2 f2(x0):

(2.2.38)

78

ГЛАВА 2. НАЧАЛЬНЫЕ СВЕДЕНИЯ ИЗ ВЫПУКЛОГО АНАЛИЗА

Доказательство. Так как x0 2 riX1 и x2 2 riX2, то по теореме 2.2.15 существуют субдифференциалы @X1 f1(x0) и @X2 f2(x0). Пусть a1 2 @X1 f1(x0), a2 2 @X2 f2(x0) и a = a1 + a2. Тогда

ha1; x ¡ x0i · f1(x) ¡ f1(x0)

8 x 2 X1;

ha2; x ¡ x0i · f2(x) ¡ f2(x0)

8 x 2 X2:

Складывая эти два неравенства, получаем для x 2 X

ha; x ¡ x0i · f(x) ¡ f(x0):

Таким образом, a 2 @Xf(x0) и, следовательно, @X1 f1(x0) + @X2 f2(x0) µ @Xf(x0).

Докажем обратное включение. С целью упрощения записи предположим, что x0 = 0n и f1(0n) = f2(0n) = 0. Этого несложно добиться, проведя сдвиг координат и добавив соответствующие константы к функциям f1(x) и f2(x). Пусть a 2 @Xf(0n). Согласно определению субградиента и с учетом сделанных предположений ha; xi · f1(x) + f2(x) для всех x 2 X. Перепишем это неравенство в виде

f1(x) ¡ ha; xi ¸ ¡f2(x) 8 x 2 X

(2.2.39)

и введем в рассмотрение два множества

Y1 = ©[x; ¹] 2 X1 £ R : ¹ > f1(x) ¡ ha; xiª; Y2 = ©[x; ¹] 2 X2 £ R : ¹ < f2(x)ª:

Из выпуклости функций f1(x) и f2(x) и линейности функции ha; xi следует, что оба эти множества выпуклые. В силу (2.2.39) они непересекающиеся. По теореме 2.1.16 их можно собственно отделить

друг от друга, т.е. найдется ненулевой вектор [b; ¯] 2 Rn+1 такой, что

h[b; ¯; [x1; ¹1]i ¸ h[b; ¯]; [x2; ¹2]i 8 [x1; ¹1] 2 Y1; [x2; ¹2] 2 Y2;

(2.2.40)

причем для некоторых [¹x1; ¹1] и [¹x2; ¹2] неравенство строгое.

Из-за того, что ¹1 в множестве Y1 принимает бесконечно большие значения, вторая компонента ¯ у вектора [b; ¯] не может быть отрицательной, чтобы не нарушалось неравенство (2.2.40). Она не может равняться нулю, так как иначе вектор b 2 Rn ненулевой и в силу 2.2.40 выполняется неравенство hb; x1i ¸ hb; x2i для всех x1 2 X1 и x2 2 X2, причем для некоторых [¹x1] и x¹2] неравенство строгое. Это означает, что выпуклые множества X1 и X2 можно собственно отделить. Но это противоречит утверждению теоремы 2.1.16, поскольку согласно сделанным предположениям относительные внутренности множеств X1 и X2 пересекаются. Поэтому обязательно ¯ > 0 и можно взять ¯ = 1.

Если теперь в (2.2.40) положить ¹1 = f1(x1), ¹2 = ¡f2(x2), то это неравенство примет вид

f(x1) + hb ¡ a; x1i ¸ hb; x2i ¡ f2(x2) 8 x1 2 X1; x2 2 X2:

(2.2.41)

Беря в (2.2.41) x2 = x0 = 0n, получаем f(x1) ¸ ha ¡ b; x1i для всех x1

2 X1, что означает:

a ¡ b 2 @X1 f1(0n). С другой стороны, беря в (2.2.41) x1 = x0 = 0n, приходим к неравенству hb; x2i · f(x2), справедливому для всех x2 2 X2. Поэтому b 2 @X2 f2(0n) и, стало быть, a = (a ¡ b) + b 2 @X1 f1(0n) + @X2 f2(0n). Сопоставляя данное включение с полученным ранее противоположным включением, убеждаемся в справедливости (2.2.38). ¥

Замечание 4. Как показывает анализ доказательства, результат теоремы сохраняется и для точек x0 2 X1 \ X2. Важно только, чтобы в этих точках существовали субдифференциалы

@X1 f1(x0) и @X2 f2(x0).

2.2. ВЫПУКЛЫЕ ФУНКЦИИ

79

Рассмотрим теперь вопрос о вычислении субдифференциала функции, представимого в виде поточечного максимума нескольких выпуклых функций на множестве X, т.е. функции вида

f(x) = max fi(x):

1·i·m

Как следует из теоремы 2.2.2, функция f(x) также выпукла на X.

Теорема 2.2.21. Пусть fi(x) выпуклые функции на открытом выпуклом множестве X µ Rn для всех i 2 [1 : m] и пусть x0 2 X. Тогда

@Xf(x0) = convY (x0); Y (x) = [i2I(x)@Xfi(x);

(2.2.42)

где I(x) = fi 2 [1 : m] : fi(x) = f(x)g.

Доказательство. Прежде всего отметим, что отображение Y (x), входящее в выражение (2.2.42), является очевидно точечно-множественным. Кроме того, согласно теореме 2.2.16 все субдифференциалы @Xfi(x), i 2 I(x) компактные множества, поэтому и множество Y (x) компактно для любого x 2 X.

Обратимся к точке x0 2 X. Всегда можно указать " > 0 такое, что для всех x 2 ¢"(x0) выполняется включение: I(x) µ I(x0). Действительно, если это не так, то найдется последовательность точек xk ! x0, для которой существуют индексы ik 2 I(xk) такие, что ik 2= I(x0). Так как общее число индексов конечно, то, не умаляя общности, можно считать, что все ik равны одному и

¹

тому же индексу i. Но тогда f(xk) = f¹(xk) и, переходя к пределу при k ! 1, получаем в силу

i

¹

непрерывности выпуклой функции f¹(x) равенство: f¹(x0) = f(x0). Следовательно, i 2 I(x0), что

i i

противоречит сделанному предположению.

Покажем, что из этого свойства индексного множества I(x) вытекает замкнутость отображе-

ния Y (x) в точке x0, т.е. из xk 2 X, xk ! x0 2 X и ak 2 Y (xk), ak ! a следует, что a 2 Y (x0). В

самом деле, тогда ak 2 @Xfik (xk), где ik 2 I(xk) µ I(x0) для xk достаточно близких к x0¹. Опять же, без ограничения общности, можно считать, что индекс ik здесь один и тот же, равный i. Иначе

следует просто взять соответствующую подпоследовательность. Имеем

f¹(x) ¡ f¹(xk) ¸ hak; x ¡ xki 8 x 2 X:

i i

Отсюда после перехода к пределу при k ! 1 получаем, что

f¹(x) ¡ f¹(x0) ¸ ha; x ¡ x0i 8 x 2 X:

i i

¹

Поэтому a 2 @Xf¹i(x0) и, поскольку i 2 I(x0), приходим к выводу, что a 2 Y (x0).

Принадлежность a 2 Y (x0) означает принадлежность a некоторому судифференциалу @Xfi(x0), где i 2 I(x0). Но тогда, учитывая неравенство fi(x) · f(x), получаем:

f(x) ¡ f(x0) ¸ fi(x) ¡ fi(x0) ¸ ha; x ¡ x0) 8 x 2 X:

Таким образом, a 2 @Xf(x0) и, стало быть, Y (x0) µ @Xf(x0). Более того, поскольку @Xf(x0) выпуклое множество, convY (x0) µ @Xf(x0), причем в силу того, что все субдифференцилы @Xfi(x0), i 2 I(x0, являются компактными множествами, множество convY (x0) также компактно. Отметим, что в силу произвольности точки x0 2 X можно утверждать также, что convY (x) µ @Xf(x).

Покажем, что на самом деле имеет место равенство convY (x0) = @Xf(x0). От противного, пусть это не так. Тогда найдется субградиент a 2 @Xf(x0) такой, что a 2= convY (x0). В этом случае по теореме 2.1.14 точка a может быть сильно отделена от множества convY (x0), т.е. можно указать ненулевой вектор b 2 Rn такой, что hb; ai > hb; yi для всех y 2 convY (x0).

80

ГЛАВА 2. НАЧАЛЬНЫЕ СВЕДЕНИЯ ИЗ ВЫПУКЛОГО АНАЛИЗА

Пусть последовательность kg такова, что ®k # 0. Пусть, кроме того, xk = x0 + ®kb. В силу того, что множество X открытое, xk 2 X для достаточно больших k. Так как Y (xk) µ @Xf(xk), а отображение @Xf(x) согласно теореме 2.2.19 локально ограниченное, то найдутся yk 2 Y (xk) такие, что последовательность fykg ограничена. Пусть без потери общности yk ! y¹. Из замкнутости отображения Y (x) следует, что y¹ 2 Y (x0) и, стало быть, y¹ 2 @Xf(x0). Но отображение @Xf(x) опять же на основании теоремы 2.2.19 монотонное, поэтому hyk ¡a; xk ¡x0i ¸ 0. Переходя здесь к пределу, получаем: hy¹ ¡ a; bi ¸ 0. Мы пришли к противоречию. Таким образом, вектора a 2 @X(x0) такого, что a 2= convY (x0) не существует и, следовательно, справедлива формула (2.2.42). ¥

Условный субдифференциал. Пусть f(x) функция, определенная на Rn, и пусть X ½ Rnнепустое множество. Под условным субдифференциалом функции f(x) в точке x0 2 X понимают следующее множество

@Xf(x0) = ©a 2 Rn : f(x) ¡ f(x0) ¸ ha; x ¡ x0i 8 x 2 Xª:

Таким образом, понятие условного субдифференциала совпадает с обычным понятием субдифференциала, если считать функцию f(x), определенной только на множестве X.

В случае, когда функция f(x) выпукла на Rn и X выпуклое множество, следующая функция

g(x) = f(x) + ±(xjX);

(2.2.43)

также будет выпуклой функцией на Rn, причем ее эффективная область совпадает с множеством X. Для функции (2.2.43) применима теорема Моро-Рокафеллара и согласно вышесказанному получаем, что

@g(x) = @f(x) + (xjX) 8 x 2 X:

Условный субдифференциал функции f(x) в точке x0 2 X совпадает с субдифференциалом функции g(x) в этой точке, т.е. справедливо следующее представление для условного субдифференциала:

@Xf(x0) = @f(x) + N(x0jX);

(2.2.44)

где N(x0jX) нормальный конус к множеству X в точке x0. Формула позволяет достаточно просто вычислять условные субдифференциалы для разных множеств X.

Если точка x0 принадлежит внутренности множества X, то, поскольку в этом случае N(x0jX) = f0ng, условный субдифференциал @Xf(x0) совпадает с обычным субдифференциалом @f(x0).

2.2.4. Сопряженные и полярные функции

Сопряженные и полярные функции являются весьма удобным средством получения разного рода оценок в методах оптимизации. Поэтому дадим определение таких функций и рассмотрим их основные свойства. Начнем с понятия сопряженной функции.

Определение 2.2.9. Пусть f(x) функция, определенная на множестве X µ Rn, и пусть y 2 Rn. Функция fX¤ (y), задаваемая условием

f¤

(y) = sup [ x; y

i ¡

f(x)] ;

(2.2.45)

X

h

 

 

x2X

 

 

 

называется сопряженной функцией к функции f(x) на множестве X.

В тех случаях, когда множество X в определении (2.2.9) совпадает со всем пространством Rn, будем писать просто f¤(y) вместо fR¤n (y).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]