Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Opt_book_1

.pdf
Скачиваний:
110
Добавлен:
03.06.2015
Размер:
1.2 Mб
Скачать

2.2. ВЫПУКЛЫЕ ФУНКЦИИ

91

Определение функции, полярной к калибру, можно переписать в виде

 

f0(y) = sup hx; yi;

(2.2.82)

x2X1

 

где X1 = fx 2 Rn : f(x) = 1g. Поэтому для выполнения включения y 2 C1 необходимо и достаточно, чтобы hx; yi · 1 для всех x 2 X1. Так как множество C есть выпуклая оболочка множества X1, это неравенство должно выполняться и для всех x 2 C. Таким образом,

C1 = fy 2 Rn : hx; yi · 1 8x 2 Cg

и, согласно (2.2.69), множество C1 есть не что иное, как поляра C0 множества C. Отсюда делаем вывод, что

f0(y) = °(yjC0):

(2.2.83)

Кроме того, вновь используя тот факт, что C есть выпуклая оболочка множества X1, из (2.2.82)

получаем

f0(y) = sup hx; yi = suphx; yi = ±¤(yjC):

x2X1 x2C

Отсюда и из (2.2.83) приходим к равенству °(yjC0) = ±¤(yjC).

Аналогичная двойственная связь имеет место и для калибровочной функции множества C. В силу (2.2.67) и (2.2.70), калибровочная функция множества C является одновременно опорной

функцией поляры C0 множества C, т.е.

 

°(yjC) = ±¤(yjC0):

(2.2.84)

Воспользуемся этим свойством применительно к калибровочной функции °(yjC) и найдем поляру C00 к множеству C0. Имеем на основании (2.2.69) и (2.2.84):

C00 =

fx 2 Rn : hx; yi · 1 8y 2 C0g = fx 2 Rn : ±¤(xjC0) · 1g =

=

fx 2 Rn : °(xjC) · 1g:

Таким образом, C2 = C00 = C.

Важным частным случаев калибров являются нормы в векторном пространстве. Фактически норма есть симметричный и положительный всюду, кроме начала координат, калибр. Возьмем в качестве f(x) p-ю гельдеровскую норму, задаваемую формулой (2.2.59) при p > 1. Проводя соответствующие вычисления, получаем, что

f(x) = kxkp;

f0(y) = kykp¤;

где p¡1 + p¡¤ 1 = 1 при p > 1 и p¤ = +1, если p = 1. Неравенство Минковского-Малера переходит в неравенство Гельдера

hx; yi · kxkpkykp¤:

Для полярных функций также имеет место результат, аналогичный утверждению 2.2.11 для сопряженных функций.

Утверждение 2.2.12. Пусть неотрицательная функция f(x) и функция f1(x) таковы, что f(x) ¸ f1(x) = f(x+) для любых x 2 Rn. Тогда если y 2 Rn+, то f10(y) = f0(y).

Доказательство. Так как функция f(x) является неотрицательной на Rn, то функция f1(x) = f(x+) также неотрицательна на Rn. Поэтому из неравенства f(x) ¸ f1(x), в силу определения (2.2.78) полярной функции, получаем, что f10(y) ¸ f0(y).

92

 

ГЛАВА 2. НАЧАЛЬНЫЕ СВЕДЕНИЯ ИЗ ВЫПУКЛОГО АНАЛИЗА

Покажем, что обратное

неравенство f0(y)

·

f0(y) также имеет место. Действительно, посколь-

n

1

 

 

 

 

 

 

 

ку, по предположению, y 2 R+, то

 

 

 

 

 

 

 

 

 

f0

(y) = sup

hx; yi

= sup

hx; yi

sup

hx+; yi

= sup

hx; yi

sup

hx; yi

= f0(y):

1

x6=0 f1(x)

x6=0 f(x+)

· x6=0 f1(x)

x2R+n nf0g f1(x)

· x6=0

f(x)

 

Сравнивая эти два неравенства, приходим к выводу, что f10(y) = f0(y).

¥

 

Пусть y 2 R+n и p ¸ 1. Тогда с помощью утверждения 2.2.11 получаем

 

 

 

 

 

 

 

f(x) = kx+kp;

 

f0(y) = kykp¤:

 

 

(2.2.85)

2.2.5. Рецессивные конусы и функции

Выпуклые замкнутые неограниченные множества X µ Rn обладают замечательным свойством, характеризующим их поведение "на бесконечности". Дело в том, что какую бы точку x 2 X ни взять, всегда можно указать луч

ls = fx 2 Rn : x = ¸s; ¸ ¸ 0g;

задаваемым ненулевым направлением s 2 Rn, таким, что x + ls 2 X, т.е. этот луч, выпущенный из точки x, полностью принадлежит множеству X. Более того, беря другую точку x1 2 X и выпуская их нее тот же самый луч ls, опять получаем, что он не выходит за пределы множества X (см. рис.

***). Дадим строгое обоснование этих фактов.

Утверждение 2.2.13. Пусть X выпуклое замкнутое неограниченное множество и пусть x произвольная точка из X. Тогда найдется по крайней мере один луч ls такой, что x + ls 2 X.

Доказательство. Так как X неограниченное множество, то можно указать последовательность точек fxkg такую, что xk 2 X и kxkk ! 1 при k ! 1. Возьмем, задаваемые точками xk, единичные направления

sk =

xk ¡ x

:

kxk ¡ xk

 

 

Так как все sk принадлежат единичной сфере, то у последовательности fskg существуют предельные точки. Не умаляя общности, считаем, что на последовательность fskg является сходящейся. Пусть

s¹ = limk!1 sk.

Убедимся, что x + ls¹ 2 X. Действительно, возьмем произвольную точку y 2 x + ls¹. Ее можно записать как y = x + ¸s¹ для некоторого ¸ ¸ 0. Но тогда точки yk = x + ¸sk принадлежат лучам, выпущенным из точки x и проходящим через точки xk. Более того, для достаточно больших номеров k они принадлежат отрезкам, соединяющим точку x и точки xk. Следовательно в силу выпуклости множества X эти точки yk также принадлежат X. Так как множество X замкнуто, то предельная точка y¹ = limk!1 = x+¸s¹ принадлежит X. Отсюда, в силу фактической произвольности ¸, делаем вывод, что x + ss¹ 2 X. ¥

Утверждение 2.2.14. Пусть X выпуклое замкнутое неограниченное множество и пусть x+ ls 2 X для некоторой точки x 2 X и некоторого ненулевого луча ls. Тогда y + ls 2 X для любой другой точки y 2 X.

2.2. ВЫПУКЛЫЕ ФУНКЦИИ

93

Доказательство. Возьмем произвольное ¸ ¸ 0 и покажем, что y + ¸s 2 X. Пусть ck > 0 для всех k ¸ 1 и ck ! 1. Рассмотрим точки xk = x + ck¸s. Так как x + ls 2 X, то xk 2 X. Если взять

точки

µ1 ¡ c1k y + c1k xk;

yk =

то в силу выпуклости множества X все они принадлежат X. Но yk можно представить в виде

1

1

 

yk = µ1 ¡

 

y +

 

x + ¸s;

c ¡ k

ck

из которого видно, что yk ! y + ¸s при k ! 1. Так как yk 2 X и множество X замкнуто, отсюда делаем вывод, что y + ¸s 2 X. Поскольку ¸ взято произвольным, это означает, что y + ls 2 X. ¥

Определение 2.2.11. Ненулевое направление s 2 Rn называется рецессивным относительно выпуклого множества X, если x + ls 2 X для всех точек x 2 X.

Совокупность всех рецессивных относительно выпуклого множества X направлений, пополненная началом координат, называется рецессивным конусом X. Будем его обозначать как Krec(X). Из определения следует, что он состоит из таких векторов s 2 Rn, для которых выполняется включение: X + s ½ X.

Рецессивный конус Krec(X) для любого выпуклого множества X является непустым, так как всегда содержит, по крайней мере, начало координат. Однако, если множество X ограничено, то он состоит только из нулевого элемента. Если же множество X неограничено, то рецессивный конус может оказаться гораздо более "богаче". Как следует из утверждений 2.2.13 и 2.2.14, в случае замкнутых выпуклых неограниченных множеств рецессивный конус обязательно содержит ненулевые элементы.

Убедимся, что Krec(X) конус является выпуклым конусом. Действительно, пусть s1 2 Krec(X), s2 2 Krec(X) и 0 · ¸ · 1. Обозначая s¸ = ¸s1 + (1 ¡ ¸)s2, имеем

X + s¸ =

¸(X + s1) + (1 ¡ ¸)(X + s2) ½

½

¸X + (1 ¡ ¸)X = X:

Таким образом, для "промежуточного"направления s¸ выполняется включение: X + s¸ ½ X, что означает принадлежность данного направления рецессивному конусу. Подчеркнем, что здесь мы воспользовались дистрибутивным законом (2.1.2):

(¸1 + ¸2)X = ¸1X + ¸2X; ¸1 ¸ 0; ¸2 ¸ 0;

справедливым для выпуклых множеств X и неотрицательных чисел ¸1 и ¸2. Его выполнение фактически эквивалентно выпуклости множества X.

Можно также показать, что рецессивный конус Krec(X) замкнут, если замкнуто выпуклое множество X.

В качестве примера выпуклого множества и его рецессивного конуса рассмотрим множество

n o

X = x 2 R2++ : x1x2 ¸ 1 ;

У которого Krec(X) = R2+.

Пусть теперь X множество решений системы линейных неравенств, т.е.

X = ©x 2 Rn : Ax + b · 0mª; A 2 Rm£n; b 2 Rm:

94 ГЛАВА 2. НАЧАЛЬНЫЕ СВЕДЕНИЯ ИЗ ВЫПУКЛОГО АНАЛИЗА

Его рецессивный конус совпадает с множеством решений соответствующей однородной системы

Krec(X) = ©x 2 Rn : Ax · 0mª:

Возьмем теперь выпуклую функцию f(x) на Rn. Ее надграфик, как выпуклое множество в Rn+1, имеет рецессивный конус. Согласно вышесказанному,

s = [y; ¹] 2 Krec(epi f)

тогда и только тогда, когда

[x; ¯] + [y; ¹] = [x + y; ¯ + ¹] 2 epi f

для любого [x; ¯] 2 epi f. Но это означает, что ¯ +¹ ¸ f(x+y) или, в силу произвольности ¯ ¸ f(x),

f(x + y) · f(x) + ¹:

(2.2.86)

Данное неравенство должно выполняться для любого x 2 Rn.

Из (2.2.86) видно, что если при данном y неравенство (2.2.86) имеет место при некотором конечном значении ¹, то оно обязательно будет выполняться и при всех больших значениях вплоть до бесконечности. Таким образом, Krec(epi f) представляет из себя надграфик некоторой функции, зависящей от y. Данная функция носит название рецессивной функции функции f(x) и обозначается (f0+)(y). Так как ее надграфик есть выпуклый конус, то рецессивная функция выпукла и положительно однородна, т.е. (f0+)(¸y) = ¸(f0+)(y) для любого ¸ ¸ 0.

Опять же в силу того, что рецессивная функция определяется через рецессивный конус надграфика функции f(x), наряду с (2.2.86) должно выполняется неравенство

f(x + ¸y) · f(x) + ¸¹; 8 x 2 Rn;

8 ¸ ¸ 0:

(2.2.87)

Отсюда следует, что

 

 

f(x + ¸y) ¡ f(x)

 

 

 

 

 

¹

¸

sup

x

2 R

n

:

(2.2.88)

 

 

¸>0

¸

8

 

 

Но рецессивный конус надграфика не должен зависть от выбора конкретной точки [x; f(x)] 2 epi f, поэтому в (2.2.87) можно взять произвольную точку x 2 Rn и зафиксировать ее. Тогда на основании (2.2.88) получаем, что

(f0+)(y) = sup f(x + ¸y) ¡ f(x):

¸>0 ¸

Но функция

Ã(¸) = f(x + ¸y) ¡ f(x);

¸

как было установлено ранее, является неубывающей по ¸ для любых x 2 Rn, y 2 Rn и ¸ > 0. Поэтому

(f0+)(y) = lim f(x + ¸y) ¡ f(x):

¸!1 ¸

Данная формула справедлива для любого x 2 Rn. Беря теперь x = 0n и заменяя ¸ на 1, получаем,

что

 

 

¸ f( y )

 

 

 

 

(f0+)(y) =

lim

¸#0

f(0

n

) =

 

 

 

¸

 

 

 

=

lim¸#0

¸f£(¸y ) =¡lim¸#0(¤)(y);

(2.2.89)

2.2. ВЫПУКЛЫЕ ФУНКЦИИ

95

где () операция умножения выпуклой функции f на положительную константу ¸ справа. Равенство (2.2.89) проясняет, в частности, смысл принятого обозначения для рецессивной функции.

Если ненулевой вектор y 2 Rn такой, что (f0+)(y) · 0, то задаваемое им направление называется рецессивным направлением выпуклой функции f(x). Совокупность всех таких направлений, как можно проверить, образует конус в Rn, который обозначим Krec(f). Данный конус называется рецессивным конусом функции f(x), его не следует путать с рецессивным конусом надграфика

функции f(x), который принадлежит пространству Rn+1. Рецессивный конус функции f(x) является одновременно рецессивным конусом всех непустых множеств подуровня f(x).

В качестве простейшего примера рассмотрим выпуклую функцию f(x) = ex. У нее, как нетрудно видеть, (f0+)(y) = ±(yjR¡) и Krec(f) = R¡.

Рассмотрим теперь выпуклую квадратичную функцию

 

f(x) = hx; Axi + hb; xi + c;

(2.2.90)

где A симметричная положительно полуопределенная матрица порядка n, b 22 Rn и c 2 R. Для данной функции, применяя формулу (2.2.89), получаем

¸#0

·¸h

 

i

 

h

 

i

 

¸ ½

+1; Ay 6= 0n:

(f0+)(y) = lim

1

 

y; Ay

 

+

 

b; y

 

+ ¸c

=

hb; yi; Ay = 0n;

 

 

 

 

 

Таким образом, рецессивная функция принимает конечные значения только тогда, когда y принадлежит нуль-пространству матрицы A. Рецессивный конус Krec(f) также принадлежит этому подпространству и определяется формулой:

Krec(f) = ©y 2 Rn : Ay = 0n; hb; yi · 0ª:

Если матрица A положительно определена, то рецессивная функция квадратичной функции (2.2.90) принимает следующий вид

(f0+)(y) = ±(yjf0ng);

(2.2.91)

т.е. совпадает с индикаторной функцией нуля. Выпуклая функция f(x), для которой выполняется равенство (2.2.91), называется кофинитной функцией.

Рецессивные функции существуют и у выпуклых функций f(x), у которых эффективная область domf (множество X µ Rn, на котором она задана) не совпадает со всем пространством. Если эффективная область ограничена, то такая выпуклая функция всегда является кофинитной.

2.2.6. Обобщения выпуклых функций

Выпуклые функции, как было выяснено, обладают многими полезными свойствами. Например, множества подуровня у выпуклых функций выпуклы. Если выпуклая функция, определенная на всем пространстве Rn, дифференцируема, то равенство нулю градиента функции в некоторой точке гарантирует, что эта точка является точкой минимума функции f(x) на Rn. Но и другие функции, не будучи выпуклыми, также могут обладать какими-то свойствами (одним или несколькими), присущими выпуклым функциям. Это приводит к понятию обобщения выпуклых функций. Ниже мы рассмотрим некоторые из таких простейших обобщений выпуклых функций.

Квазивыпуклые и псевдовыпуклые функции. Дадим сначала определение квазивыпуклой функции. Пусть X µ Rn выпуклое множество.

96

ГЛАВА 2. НАЧАЛЬНЫЕ СВЕДЕНИЯ ИЗ ВЫПУКЛОГО АНАЛИЗА

 

Определение 2.2.12. Функция f(x) называется квазивыпуклой на X, если для любых x1 2 X,

x2 2 X и 0 · ¸ · 1 справедливо неравенство

 

 

f (¸x1 + (1 ¡ ¸)x2) · max ff(x1); f(x2)g :

(2.2.92)

Если неравенство (2.2.92) выполняется как строгое для всех x1 =6 x2 и 0 < ¸ < 1, то такая функция называется строго квазивыпуклой.

Аналогично с выпуклыми функциями, функция f(x) называется квазивогнутой, если функция ¡f(x) квазивыпукла. О функции, которая одновременно является квазивыпуклой и квазивогнутой, говорят как о квазилинейной функции.

Имеет место следующее утверждение, фактически эквивалентное определению квазивыпуклой функции.

Утверждение 2.2.15. Функция f(x) квазивыпукла на выпуклом множестве X µ Rn тогда и только тогда, когда для любого ¯ 2 R множество подуровня

L¯ = fx 2 X : f(x) · ¯g

выпукло.

Доказательство. Необходимость. Предположим, что f(x) квазивыпуклая функция на X. Предположим также, что для некоторого ¯ множество L¯ непустое. Возьмем две точки x1 2 L¯ и x2 2 L¯, для них выполняется f(x1) · ¯, f(x2) · ¯. Тогда для произвольного 0 · ¸ · 1 на основании (2.2.92) получаем

f (¸x1 + (1 ¡ ¸)x2) · max ff(x1); f(x2)g · ¯:

Отсюда делаем вывод, что точка x¸ = ¸x1 +(1¡¸)x2 принадлежит множеству L¯ и, следовательно, множество L¯ выпуклое.

Достаточность. Пусть теперь множество L¯ выпуклое для любого ¯ и пусть x1 2 Rn и x2 2 Xдве любые точки, причем считаем для определенности, что f(x1) · f(x2). Беря ¯ = f(x2), в силу выпуклости множества L¯ заключаем, что весь отрезок, соединяющий точки x1 и x2, принадлежит этому множеству. Но это может быть в том и только в том случае, когда для любого 0 · ¸ · 1 справедливо неравенство

f (¸x1 + (1 ¡ ¸)x2) · ¯ = maxff(x1); f(x2)g:

Таким образом, согласно (2.2.92) функция f(x) квазивыпуклая. ¥

Нетрудно видеть, что выпуклая функция является одновременно и квазивыпуклой функцией. Но обратное неверно. На рис. *** приведен пример квазивыпуклой функции, которая очевидно не выпукла. Из других примеров квазивыпуклых и квазивогнутых функций укажем следующие:

1.функция f(x) = ln x квазивыпукла (и квазивогнута, т.е. квазилинейна) на X = R++;

2.функция f(x) = x1x2 квазивогнута на X = R2+;

3.дробно-линейная функция

aT x + b

 

n

 

 

f(x) =

 

;

a; c 2 R

; b; d;

(2.2.93)

cT x + d

2.2. ВЫПУКЛЫЕ ФУНКЦИИ

 

 

 

 

 

 

 

 

 

97

квазивыпукла на множестве X = fx 2 Rn : cT x + d > 0g. Действительно, чтобы убедиться в

этом, рассмотрим множество подуровня

 

 

 

 

 

 

 

 

 

 

 

 

x)

·

¯

g

=

 

 

 

 

L¯ = fx 2 Xn: f(T

 

T

 

T

 

ª0 ;

=

©x

2 Rn

: cT x + d > 0; (a ¯c)T·x + b ¯d

=

©

x

R

: c x + d > 0; a x + b ¯(c x + d) =

 

 

2

 

 

 

 

 

¡

 

¡

· ª

которое, будучи пересечением двух полупространств (открытого и замкнутого), выпукло. Аналогичным образом получаем, что и множество надуровня

U¯ = fx 2 X : f(x) ¸ ¯g ;

также является выпуклым. Поэтому дробно-линейная функция (2.2.93) оказывается не только квазивыпуклой, но и квазивогнутой на X, следовательно, квазилинейной.

Предположим дополнительно, что f(x) дифференцируемая на Rn функция. Можно показать, что f(x) будет квазидифференцируемой на выпуклом множестве X µ Rn функцией в том и только в том случае, когда она удовлетворяет следующему свойству:

hfx(x1); x2 ¡ x1i · 0;

если f(x2) · f(x1); x1 2 X; x2 2 X:

(2.2.94)

Геометрически данное свойство означает, что градиент fx(x1), если он ненулевой, должен определять опорную гиперплоскость к множеству подуровня fx : f(x) · f(x1)g.

Как и для выпуклых функций, операция взятия поточечного максимума

f(x) = maxff1(x); : : : ; fm(x)g

от квазивыпуклых функций f1(x), : : :, fm(x) снова приводит к квазивыпуклой функции. Кроме того, суперпозиция f(x) = g(h(x)) двух квазивыпуклых функций g(y) и h(x), из которых функция g(y) является неубывающей на R, опять дает квазивыпуклую функцию.

Далее рассмотрим функции, которые обладают свойством, обратным в некотором смысле по отношению к свойству (2.2.94) и которые являются другим обобщением выпуклых функций. При этом считаем, что f(x) дифференцируемая на Rn функция. Согласно критерию выпуклости 2.2.8 данная функция f(x) выпукла тогда и только тогда, когда

f(x2) ¸ f(x1) + hfx(x1); x2 ¡ x1i

для любых x1 2 Rn, x2 2 Rn. Отсюда, сразу вытекает, что

f(x2) ¸ f(x1);

если hfx(x1); x2 ¡ x1i ¸ 0:

(2.2.95)

Свойство (2.2.95) служит основой для введения понятия псевдовыпуклой функции.

Определение 2.2.13. Пусть f(x) дифференцируемая на Rn функция. Тогда f(x) называется псевдовыпуклой на Rn функцией, если из условия hfx(x1); x2 ¡ x1i ¸ 0 следует, что f(x2) ¸ f(x1).

Непосредственно из определения псевдовыпуклой функции следует важный результат.

Утверждение 2.2.16. Пусть f(x) псевдовыпуклая на Rn функция. Тогда для того, чтобы x¤ была точкой минимума f(x) на Rn необходимо и достаточно, чтобы fx(x¤) = 0n.

98

ГЛАВА 2. НАЧАЛЬНЫЕ СВЕДЕНИЯ ИЗ ВЫПУКЛОГО АНАЛИЗА

Доказательство. Необходимость. Предположим, что x¤ есть точка минимума функции f(x) на Rn. Тогда она является и точкой локального минимума f(x) на Rn. Так как функция f(x) дифференцируема, то из необходимых условий следует, что fx(x¤) = 0n.

Достаточность. Если fx(x¤) = 0n, то hfx(x¤); x ¡ x¤i = 0 для любого x 2 Rn. Поэтому в силу определения псевдовыпуклой функции f(x) ¸ f(x¤) для всех x 2 Rn. Отсюда делаем вывод, что функция f(x) достигает в точке x¤ своего минимума на Rn. ¥

Любая выпуклая дифференцируемая на Rn функция является одновременно и псевдовыпуклой функцией. Обратное разумеется неверно. На рис. приведен пример псевдовыпуклой, функции, которая не выпукла. Можно показать, что псевдовыпуклая функция всегда квазивыпукла. Однако, как демонстрирует пример функции ***, данная квазивыпуклая функция не псевдовыпукла. Дифференцируемая квазивыпуклая функция f(x) не обладают свойством, что точка x¤ обязательно является ее минимумом на Rn, если fx(x¤) = 0n.

Возрастающие выпуклые вдоль лучей функции. Еще одно обобщение выпуклых функций можно получить, используя следующее их свойство, а именно, любая выпуклая функция является поточечным максимумом аффинных функций, которые не превосходят данную выпуклую функцию. Убедимся в этом. Для простоты предположим, что выпуклая функция f(x) определена на всем пространстве Rn.

Пусть l(x) обозначает обычную линейную функцию на Rn:

n

 

Xi

 

l(x) = hl; xi = lixi;

(2.2.96)

=1

 

где l 2 Rn. Пусть, кроме того, g(x) = l(x) + c есть аффинные функции на Rn, т.е. всевозможные сдвиги линейных функций на константу c 2 R.

Обозначим через L(f) совокупность аффинных функций g(x) = hl; xi + c, значения которых не превышают значения функции f(x), т.е. множество

L(f) = ©g(x) = hl; xi + c : g(x) · f(x) 8 x 2 Rnª:

 

Тогда

 

f(x) = max g(x); x 2 Rn:

(2.2.97)

g2L(f)

Чтобы убедиться в равенстве (2.2.97), обратимся к надграфику epi f функции f(x), которое является выпуклым замкнутым множеством (напомним, что мы условились рассматривать толь-

ко замкнутые функции). В каждой граничной точке [x; f(x)] 2 Rn+1 надграфика epi f согласно

утверждению теоремы 2.1.15 существует опорная гиперплоскость. Пусть [a; b] 2 Rn+1, где a 2 Rn и b 2 R направляющий вектор этой гиперплоскости (он обязательно должен быть ненулевым).

Тогда

¸ ·

¯ ¡ f(x)

¸

 

8

 

2

 

¸

 

 

h· b

 

[y; ¯]

epi f:

0

 

a

;

y ¡ x

 

;

 

 

 

 

Отсюда, в частности, беря ¯ = f(y) + ®, где ® ¸ 0, получаем

 

 

 

 

ha; y ¡ xi + b(f(y) + ® ¡ f(x)) ¸ 0

8 y 2 Rn:

(2.2.98)

Так как ® ¸ 0, то неравенство (2.2.98) возможно в том и только в том случае, когда b ¸ 0. Покажем, что b положительно. Действительно, если b = 0, то неравенство (2.2.98) переходит

2.2. ВЫПУКЛЫЕ ФУНКЦИИ

99

в ha; y ¡ xi ¸ 0, которое в силу произвольности y 2 Rn справедливо только, если a = 0n. Мы приходим к тому, что направляющий вектор [a; b] опорной гиперплоскости оказывается нулевым. Это противоречит определению направляющего вектора гиперплоскости. Поэтому b > 0. Более того, поскольку длина направляющего вектора не столь существенна, то, не умаляя общности, можно считать, что этот вектор отнормирован так, что b = 1.

Беря теперь в (2.2.98) ® = 0, получаем неравенство

ha; y ¡ xi + f(y) ¡ f(x) ¸ 0 8 y 2 Rn;

которое, полагая l = ¡a, c = f(x) + ha; xi и вводя в рассмотрение с этими l и c аффинную функцию g(y) = hl; yi + c (подчеркнем, что здесь как точка x 2 Rn, так разумеется и значение функции f(x) фиксированы), принимает вид: g(y) · f(y) для всех y 2 Rn. Отсюда делаем вывод, что данная аффинная функция g(y) 2 L(f). Чтобы прийти к равенству (2.2.97) остается только заметить, что g(x) = f(x). О множестве функций L(f) говорят как об опорном множестве функции f.

Обобщение выпуклых функций на основании приведенного свойства строится следующим образом. Берут некоторый класс функций, которые объявляются аффинными (абстрактными аффинными функциями), а затем функцию f(x) называют абстрактной выпуклой, если она удовлетворяет условию (2.2.97). Поясним такое построение на примере одного возможного класса абстрактных аффинных функций.

Введем в рассмотрение множество абстрактных линейных функций на Rn+, положив вместо (2.2.96)

 

 

 

 

 

 

 

 

 

 

 

l(x) =

min lixi;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i2J+(l)

 

 

 

 

l

 

n

J

 

(l) =

 

i

 

J : li > 0

 

J = [1 : n]

 

 

g(x) = l(x) + c соответствующие

где

2

R+ и

+

f

2

g. Напомним

. Пусть

 

 

 

 

 

 

n

абстрактные аффинные функции. Совокупность всех абстрактных аффинных на R+ функций g(x)

образует некоторый класс функций L.

 

n

 

¹

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Определение 2.2.14. Функция f(x), определенная на R+

и принимающая значения из R+ =

R+ [ +1, называется абстрактной выпуклой по отношению к классу L или L-выпуклой, если

существует множество функций L(f) µ L такое, что

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f(x) = sup

g(x); x 2 R+n :

 

(2.2.99)

 

 

 

 

 

 

 

 

 

 

 

g2L(f)

 

 

 

 

Оказывается, функция f(x) будет L-выпуклой в смысле определения 2.2.14 в том и только в том случае, когда она является возрастающей выпуклой вдоль лучей функцией. Такие функции называют еще ICAR-функциями (от английского названия increasing convex-along-rays function).

Определение 2.2.15. Функция f : n ! ¹ + называется выпуклой вдоль лучей, если для

R+ R

любого фиксированного x ¸ 0n функция f~(¸) = f(¸x) является выпуклой при ¸ > 0.

Под возрастающей функцией здесь будем понимать такую функцию f(x), для которой f(x1) ¸ f(x2), если только x1 ¸ x2.

Глава 3

ЗАДАЧИ ОПТИМИЗАЦИИ И УСЛОВИЯ ОПТИМАЛЬНОСТИ

3.1. ОБЩИЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ

3.1.1. Нелокальные критерии оптимальности

Рассмотрим задачу оптимизации в общем виде

f¤ = min f(x);

(3.1.1)

x2X

 

с допустимым множеством X µ Rn и с целевой функцией f(x), определенной в некоторой области, содержащей множество X. Частным случаем (3.1.1) является задача безусловной минимизации

f

¤

= min f(x):

(3.1.2)

 

x2Rn

 

Если функция f(x) и множество X являются выпуклыми, то такую задачу (3.1.1) будем называть задачей выпуклой минимизации. Соответственно, (3.1.2) задачей безусловной выпуклой минимизации.

Нас будут интересовать вопросы, связанные с разрешимостью задач вида (3.1.1) или (3.1.2), а также с теми условиями, которые должны выполняться в решениях этих задач. При этом мы пока не конкретизируем способ задания множества X.

Основной результат, касающийся существования у задачи (3.1.1) решения хорошо известен из анализа и дается он теоремой Веерштрасса.

Теорема 3.1.1. Пусть X µ Rn компактное множество и пусть f(x) непрерывная функция на X. Тогда точка глобального минимума функции f(x) на X, являющаяся решением задачи (3.1.1), существует.

Можно ослабить требования как к функции f(x), так и к множеству X, в условиях теоремы 3.1.1, сохранив ее утверждение. Ослабим сначала требования к функции f(x), заменяя условие ее непрерывности на условие полунепрерывности снизу.

100

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]