Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Иоффе, А. Д. Теория экстремальных задач [учеб. пособие]

.pdf
Скачиваний:
16
Добавлен:
22.10.2023
Размер:
15.51 Mб
Скачать

80

ГЛ. 1. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУ,МА

 

 

г)

образ множества X Ж U при отображении

 

 

 

, u) - >Fx {xt, u,)x +

 

F(x„ и)

 

 

 

содержит окрестность нуля

в

Y

 

и

существует

точка

(х, и) такая, что

 

 

 

 

 

 

 

 

 

 

 

Fх (х„, ut) x +

F (х„

и) =

0,

 

 

 

 

 

(.fix {xt> Ц,)>

Xs)

fi (xt,

и) < О

 

 

 

при всех i, при которых fi(x*, и*) =

0,

то Яо ф

0

и мож­

но считать,

что Яо = 1.

 

 

 

 

 

 

 

 

 

Соотношения (18) и (19) мы будем называть соот­

ветственно

уравнением

Эйлера Лагранжа

и

усло­

вием

Куна Таккера, а

равенства

(20)

суть

не что

иное,

как условия дополняющей

нежесткости.

Уравне­

ние Эйлера — Лагранжа, как

и

в

случае

гладких за­

дач, означает, что в точке х* функция Лагранжа удов­ летворяет необходимым условиям минимума по х, а ус­ ловие Куна — Таккера, как и в случае выпуклых задач, означает, что функция Лагранжа достигает минимума по и в точке «*. Таким образом, согласно теореме 3, принцип Лагранжа применим к гладко-выпуклым за­ дачам, т. е. необходимые условия минимума в задаче (14) — (17) совпадают с необходимыми условиями ми­ нимума функции Лагранжа при единственном не вклю­

ченном в эту функцию ограничении « е U.

 

 

 

да

Условие в) теоремы 3 выполняется, в частности, ког­

отображение

F

распадается

на

отображение

Л : X Ж TJ -+

Yi

(где

Yi — некоторое

банахово

прост­

ранство)

и

отображение

в

R™ так,

что

отображение

х -> Fi (х, «*)

регулярно.

Таким

образом,

справедливо

утверждение:

 

Предположим,

что в задаче

(14) —

 

С л е д с т в и е .

(17) условие F ( x , u ) = 0

записывается следующим

об­

разом:

 

 

 

 

 

F, (х, и) = 0,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

h, (х, и) = 0 ,

. . . ,

hm (х, и) = 0 ,

 

 

 

где

Ft: X Ж U -* Уи

Yt — банахово

пространство

и

hi,

. . . ,

hmдействительные

функции

на

X Ж U-

Предположим далее,

что

условие

в)

в формулировке

теоремы заменяется следующим:

 

 

 

 

 

 

§

1.1. ПОСТАНОВКИ

ЗАДАЧ

 

 

81

в') отображение х —*•Fl (x, «*)

регулярно

в точке х*.

Тогда, если выполнены остальные условия теоремы,

то ее утверждение остается в силе.

Каждая

из трех

1.1.4.

Замечания и обсуждения.

сформулированных

теорем распадается

на

две

части:

первую — общую и

вторую — содержащую

условия ре­

гулярности,

выполнение которых

обеспечивает неравен­

ство коэффициента Я0 нулю. Случай Яо — 0, вообще го­ воря, неинтересен, поскольку при этом необходимые условия никак не связаны с минимизируемым функцио­ налом и определяют только некоторую экстремальную структуру ограничений. Тем не менее применять тео­ ремы удобнее в общей форме. Во-первых, зачастую Яо ф 0, даже если не выполнены условия регулярности. Во-вторых, что особенно важно, прямая проверка не­ равенства Яо Ф 0 во многих случаях проще проверки соответствующих условий регулярности.

Равенство или неравенство коэффициента Яо нулю зависит, в частности, от того, какие ограничения вклю­ чены в функцию Лагранжа, а какие оставлены за ее пределами. Это лучше всего проследить на примере за­ дачи выпуклого программирования. В функцию Ла­ гранжа этой задачи мы не включили ограничение хеЛ . Выше отмечалось, что это ограничение можно задать функционально, например, так: А = {x |/„+i (x ) jC 0}. Однако здесь возможна такая ситуация, когда не су­

ществует

ни

одной

точки х

такой,

что / , ( х ) < 0

для

всех i =

1,

. . . , п 4-

1.

Если

бы

в

этом случае

мы

включили

ограничение

fn + i(x )^ 0

в функцию Лагран­

жа, то условие Слейтера было бы нарушено и нельзя было бы гарантировать неравенство коэффициента Яо нулю. Итак, стремление обеспечить неравенство коэф­ фициента Яо нулю побуждает отбирать ограничения, включаемые в функцию Лагранжа, так, чтобы условия регулярности не нарушались. Однако, с другой стороны, чем больше ограничений включено в функцию Ла­ гранжа, тем эффективней соответствующее необходимое условие минимума.

Заметим, кстати, что из теоремы 2 следует простое правило определения знаков множителей ’ Лагранжа, соответствующих ограничениям типа неравенства. В за­ даче на минимум их следует выбирать так, чтобы

82 ГЛ. 1. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА

функция Лагранжа стала выпуклой по х. (Это замеча­ ние надо иметь в виду, поскольку в выпуклых задачах часто встречаются ограничения вида g(x) ^z О, где g — вогнутая функция.) Конечно, в задачах на максимум знаки множителей Лагранжа должны быть такими, что­ бы функция Лагранжа была вогнутой. В невыпуклых задачах знаки надо выбирать такими, как будто зада­ ча — выпуклая, и т. д.

Нетрудно видеть, что классы задач, охватываемых теоремами 1 и 2, не пересекаются и, наоборот, теорема 3, по существу, содержит в себе теоремы 1 и 2, хотя и не охватывает их целиком. В самом деле, если в усло­ виях теоремы 3 множество U состоит из единственного элемента, а ограничения f i (х, и) ^ 0, .. ., /„ (х, и) s j О отсутствуют, то мы получаем утверждение, аналогичное теореме 1, но с дополнительным требованием конечной коразмерности. Наоборот, если отсутствует ограничение F(x,u) — О, U есть выпуклое подмножество линейного пространства и функции f0, . . ., /„ не зависят от х и выпуклы по и, то из теоремы 3 следуют все утвержде­ ния теоремы 2, за исключением, конечно, достаточности.

С помощью теоремы 3 можно получить и некоторые

обобщения теорем 1

и 2. Рассмотрим

такую задачу:

 

 

 

 

 

 

 

 

 

(21)

 

 

 

 

F(x) =

О,

 

 

 

(22)

 

 

М х ) < 0,

м * ) < о ,

 

(23)

 

 

 

 

х е Д ,

 

 

 

 

(24)

где, как обычно, F: X -> У, f0,

.

fn — функции на X,

А сг X и У — банахово пространство.

пространство и

Т е о р е м а 4.

Пусть X банахово

А — X. Предположим, что отображение F

и функции

fa, . . . .

fn

непрерывны и дифференцируемы по Фреше в

некоторой окрестности точки х „

удовлетворяющей усло~

виям (22) — (24), причем производная F'(x)

отображе­

ния F непрерывна в точке х*.

Допустим, наконец, что

образ

пространства

X при отображении

х ►/г'(х*)х

замкнут.

Тогда,

если

х* — точка локального минимума

в задаче

(21) — (24), то существуют

не равные

одно­

временно

нулю

множители

 

Лагранжа

Яо

0, .. ,

 

 

 

§

1.1.

ПОСТАНОВКИ

ЗАДАЧ

 

 

83

. .. ,

Кп >

0 и у* e F ’

такие,

что

 

 

 

 

 

2

х (х ,

V . . . , Л„,

у') =

£

KJ'. (х ) +

Z7'* (х ) у ’ = 0,

 

 

 

hfi (*.) =

0,

 

/ =

1..........я.

 

 

£сл« же, кроме того, отображение F регулярно в точке

х , «

существует такой вектор к е Х , что

 

 

 

 

 

 

Т7' (xj х =

0,

 

/' (xj х < 0

 

 

для тех индексов i =

1,

. . . ,

п, при которых ^ ( х « ) = 0,

то Ко ¥= 0

и можно без

ограничения общности считать,

что Ко = 1.

 

 

 

 

 

 

 

 

 

 

 

Точно так же с помощью теоремы 3 можно получить

следующее обобщение теоремы 2.

 

(21) — (24)« X ли­

Те о р е м а 5. Пусть

в задаче

нейное пространство, fo, . . . ,

/„ — выпуклые функции на

X, F аффинное

отображение

(т. е.

F (х) = уо +

Лх,

где

уо е

У, а Л: X -> Yлинейный оператор)

и

А

выпуклое множество. Тогда,

если х* — решение

задачи

(21) — (24), то существуют

не

равные одновременно

нулю

множители

Лагранжа

Х0

^ 0......... Кп ^

0

и

у* е

Y* такие, что

 

 

 

 

 

 

 

 

 

 

 

2 (х.,

К0,

. . . . К ,

у *) =

2

h fi (х.) +

( у\

F(xt)) =

 

 

 

 

 

 

 

 

i=i

 

 

 

 

 

 

 

 

 

 

 

 

=

rnin 2

(х,

Я0, . . . . Кп, у*)\

 

 

 

 

 

АчМх.) =

0,

 

/ =

1,

. . . ,

п.

 

 

Если же, кроме того, образ множества А при отображе­ нии x - * F ( x ) содержит окрестность нуля пространства Y и существует такой вектор х е 4 , что

F (х) = 0,

(х) < 0, i = l .........

п,

то Ко Ф 0 и можно считать, что Ко — 1. В последнем слу­ чае написанные выше соотношения достаточны для того, чтобы точка х», удовлетворяющая условиям (22) — (24), была решением задачи (21) — (24).

При формулировке теорем 1—3 мы всякий раз обращали вни­ мание на то, что основные соотношения в этих теоремах находятся в соответствии с принципом Лагранжа. Согласно этому принципу

84

ГЛ. 1. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА

при

подходящем выборе множителей Лагранжа решение задачи

с ограничениями удовлетворяет условиям стационарности (или ми­ нимальности при наличии выпуклой структуры) в задаче

2? -» inf;

без ограничений или при ограничениях, не включенных в функцию Лагранжа. Однако в теоремах фигурируют и другие условия, ха­ рактеризующие множители Лагранжа. Это — условия неотрицатель­ ности множителей Лагранжа, соответствующих ограничениям типа неравенства, и условия дополняющей нежесткости. На самом деле и эти условия, как и условия, которые выводились из принципа Лагранжа, носят экстремальный характер и могут быть получены

из другого, более общего экстремального принципа.

Пусть

X и

Для иллюстрации рассмотрим следующую задачу.

У— банаховы

пространства,

/о — функция на X, дифференцируемая

в окрестности

точки

х., Ф:

X -*■ У — отображение, тоже

дифферен­

цируемое по

Фреше

в окрестности точки х», и U — выпуклое

под­

множество пространства Y. Тогда можно сформулировать такую

задачу;

 

 

/„ (* )-> inf;

 

(25)

 

 

 

 

 

 

 

Ф (х) <= U.

 

(26)

Эту задачу можно рассматривать как некоторое обобщение гладкой задачи из п. 1.1.1. С другой стороны, она легко сводится к гладко­ выпуклой задаче, если положить

F (х, и) = Ф (х) — и,

а условие Ф (х )е U переписать в виде

 

F (х, и) = 0,

(27)

u e U .

(28)

Допустим, что в получившейся гладко-выпуклой задаче выполнены все условия теоремы 3 (в точке х„). Введем функцию

§ (х, г / * ) = 0 / оя М

+У\ (ф ( * ) > (у- ' I U)s .

где s(-\U) — опорная функция множества U, определенная в § 0.3. Покажем, что утверждения теоремы 3 для получившейся задачи

равносильны следующей теореме.

Т е о р е м а о с е д л о в о й т о ч к е . Для того чтобы х„ была точкой локального минимума в задаче (25), (26), необходимо су­ ществование таких не равных одновременно нулю числа 7,о 5= 0 и вектора у* е У*, что

(*,. у ) = У о (*,) +

Ф'* (*.) у = °-

(29)

Z (х9, у") = max

& (х,, г*).

(30)

2 * £ = У *

 

 

Выведем из сформулированной теоремы результат теоремы 3 для задачи (25), (27), (28) (обратный вывод совсем прост). Соот­

§ 1.2. ГЛАДКИЕ ЗАДАЧИ

85

ношение (29) эквивалентно равенству (18) в теореме 3. Далее, поскольку Ф (* * )е £ /, из определения опорной функции следует, что

(</*, Ф (* „)> < sup (у\ u)=s(y*\U),

lie U

т. е. (г/\ Ф (х,)) — s (у' |U) < 0. С другой стороны,

(0, Ф (х.)> — s (01£/) = 0.

Поэтому

0

<

шах ((2 *. Ф (*.)) - s (2 * |У)) =

(у\ Ф (*.)> -

s {у* |U) < 0,

 

 

2 *

 

 

 

 

откуда

(у*. Ф( х,))=з( у*\и) .

 

 

 

 

 

 

Полученный результат означает, что

 

 

 

inf

( у\ — и) = — sup {у\ и) =

 

 

 

uel/

веЦ

 

 

 

 

 

 

= — s (р* I и) =

(у*,

— Ф ( x j ) = (Уо> — и,)>

и мы сразу получаем соотношение (19) из

теоремы

3.

 

Совершенно аналогичным образом можно записать и теорему

Куна — Танкера. Для этого, обозначив

через

R™ множество векто­

ров

из

R" с неположительными

компонентами, введем функцию

 

 

п

V i (*) + б (х |Л) — s (я, I R1),

 

& (х, Л0, Л) = X0f0 (х) + 2

 

 

i=l

 

 

 

 

где Л = (Xi.........Л„). Предоставляем читателю проверить, что тео­

рема 2 равносильна следующей теореме.

о с е д л о в о й

т о ч к е .

Т е о р е м а

К у н а — Т а к к е р а

Пусть выполнены условия теоремы 2, включая условие Слейтера. Для того чтобы вектор х* был решением задачи (9)— (11), необ­ ходимо существование таких не равных одновременно нулю числа Яо 5* 0 и вектора Л е Rn, что

min 3! (х, Ло, Л) = 3 (х „ Ло, Л) == шах 3! (х,, Л0. р).

§ 1.2. Гладкие задачи.

Правило множителей Лагранжа

Сформулированное в предыдущем параграфе пра­ вило множителей Лагранжа содержит условие локаль­ ного экстремума. Поэтому его доказательство строится на использовании метода вариаций. Элементарный характер ограничений в гладких задачах позволяет

 

 

 

 

 

 

 

§ 1.2. ГЛАДКИЕ ЗАДАЧИ

 

 

 

87

существует такое целое число I,

21 ^

п,

что

 

 

 

 

 

 

б/(* .,

/0 = 0,

. . . .

 

 

 

А) =

0,

 

 

 

 

 

 

 

 

 

б<2'>f (х„ А) > 0

 

 

 

 

 

для всякого вектора h е

X.

 

 

 

 

 

 

 

 

 

Д о к а з а т е л ь с т в о

 

сразу

следует

из определения

п-й вариации и соответствующей теоремы для функций

одного переменного.

 

 

X банахово

 

 

 

 

С л е д с т в и е .

Пусть

пространство.

Предположим, что функция f дважды дифференцируема

по Фреше в точке л:*'. Тогда,

если х * — точка локального

минимума функции f, то

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Г ( Х , ) > 0.

 

 

 

 

 

 

 

Последнее соотношение означает, что квадратичная

форма х —►/" (х*) (х, х)

неотрицательно

определена.

 

1.2.2.

 

Гладкие задачи с ограничениями типа равенств.

Доказательство

правила

 

множителей

Лагранжа.

По

условию

теоремы

1 множество

L =

F'(x*)X

является

замкнутым подпространством пространства Y. Воз­

можны два случая: регулярный,

когда L = Y ,

и вырож­

денный, когда L есть собственное подпространство про­

странства

Y.

 

сначала

 

регулярный

случай.

Если

г}

Рассмотрим

 

L =

Y, то

отображение

F удовлетворяет в точке х* ус­

ловиям теоремы Люстерника и, следовательно,

про­

странство,

касательное

с

к

множеству

{х е

X |F(x) — 0}

в точке х*, совпадает

 

ядром оператора F'(х*). Если

h <= Кег Е'(х*),

то

в соответствии

с определением

каса­

тельного

вектора

мы

 

можем

 

построить

вариацию

x ( t , h ) = x , +

th +

r(t)

точки х* такую,

что

 

 

 

 

 

F (х (/,

А)) =

0

при

— е < / < 8 ,

е > 0 ,

 

 

 

 

 

 

/ _1 II7 (О II->0

при

/-> 0 .

 

 

 

В

этом

случае

функция

<р(/) =

f(x(t, h))

достигает ло­

кального минимума в точке / =

 

0. Поэтому

 

 

 

 

 

 

 

 

ф'(0) =

</'(*.),

л> =

0.

 

 

 

 

Это

равенство

должно

 

выполняться

 

для

всякого

h <= КегЕДх*). Поэтому

 

 

 

 

 

 

 

 

 

 

/'( x ,) e ( K e r E 'W ) X.

88

ГЛ. 1. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА

По лемме об аннуляторе из § 0.1 найдется такой эле­ мент у* е У*, что

откуда

/'( * .) +

(*.)£* = о.

Итак, правило множителей Лагранжа в регулярном случае доказано. В процессе доказательства мы сразу получили, что Яо Ф 0. Однако в регулярном случае кон­ станта Яо и не может равняться нулю. Действительно, если Я0= 0, то

(у*, F'{xt)x) = (F'*(x.) f , х} = 0

для всех х ^ X, что в силу условия регулярности влечет равенство у* == 0, а это противоречит требованию тео­ ремы, согласно которому все множители Лагранжа не должны обращаться в нуль одновременно.

*•) Обратимся к вырожденному случаю. Поскольку L — собственное замкнутое подпространство пространства У, аннулятор подпространства L содержит ненулевые эле­ менты (согласно следствию 2 из теоремы Хана — Ба­ наха). Пусть у* — такой элемент. Тогда для всех х е X

0

= ( f ,

F'{xt)x) = {Fr'(xt)y\ х),

т. е. (если Я0 =

0)

 

& х (х„ 0, f ) = F ' ' ( x , ) f = 0.

Правило множителей Лагранжа

полностью доказано.

§ 1.3. Выпуклые задачи. Доказательство теоремы Куна — Танкера

Этот параграф построен по схеме § 1.2. Как и там, начнем с изучения простейших вариантов задач выпук­

лого программирования.

Пусть X — локально

1.3.1.

Задачи без ограничений.

выпуклое

линейное топологическое

пространство и f

выпуклая функция на X. Рассмотрим задачу о безус­

ловном минимуме функции f:

 

 

f (.х) ->■ inf.

( 1)

§ 1.3.

ВЫПУКЛЫЕ ЗАДАЧИ

89

П р е д л о ж е н и е

1. Для того чтобы функция f

до­

стигала минимума в точке х*, необходимо и достаточно,

чтобы выполнялось соотношение

 

 

Ое=<Э/(*,).

 

Последнее соотношение есть аналог теоремы Ферма

из § 1.2 для гладких задач без ограничений.

определе­

Д о к а з а т е л ь с т в о следует прямо из

ния субдифференциала.

 

1.3.2.

Задачи с ограничениями типа равенств. Пусть

снова X — локально выпуклое линейное топологическое

пространство, f — выпуклая функция на X

и М ■— ли­

нейное многообразие, параллельное подпространству L.

Задачу

/(* ) —> inf;

(2)

 

 

 

(3 )

мы называем выпуклой задачей с ограничениями типа равенств.

П р е д л о ж е н и е 2. Для того чтобы точка х* была решением задачи (2), (3), достаточно, а если функция f непрерывна в некоторой точке из М, то и необходимо, чтобы

df СО ПL1 Ф 0 .

Д о к а з а т е л ь с т в о .

Достаточность

сразу следует

из определений. Для

доказательства

необходимости

рассмотрим функцию

 

 

&(x) =

f(x) + b(x\M).

 

Очевидно, х* будет решением задачи (2), (3) в том и только том случае, когда в точке х* функция S дости­ гает минимума. Сопоставив предложение 1 с теоремой Моро — Рокафеллара (см. § 0.3), получим

0 е df(xt) + d6(x, IМ).

Остается заметить, что дЬ ( x * ] M ) = L i . Предложение доказано.

90

ГЛ. 1. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА

С л е д с т в и е . Пусть

х\, . . . ,

х*п конечный набор

линейных

функционалов

из X*,

аи . .. , а п действи­

тельные числа и

 

 

М = <= X |(x*t, x) = ai, i = l , . . . . л}.

Пусть, далее, f(x) — выпуклая функция на X, непрерыв­ ная в некоторой точке множества М. В этих предполо­ жениях точка х* доставляет минимум функции f на мно­ жестве М тогда и только тогда, когда существуют такие числа %i.........%п, что

v ; + . . .

+ v ; e

* /(* ).

 

Это точный аналог правила множителей Лагранжа

для выпуклых задач.

В силу

следствия

из леммы

Д о к а з а т е л ь с т в о .

об аннуляторе L1 есть

линейная

оболочка

множества

к........... < } •

1.3.3.Задачи с ограничениями типа неравенств. До­

казательство теоремы Куна Таккера. Обратимся к за­ даче (9) — (П ) из § 1.1. Пусть х , — ее решение. Рас­ смотрим в Rn+1 множество С, чьими элементами яв­ ляются те и только те векторы (ро, •••, p „ ) e R n+I, Для каждого из которых найдется такой вектор т е Д, что

h (* ) — /о ( * . ) <

Р о!

Ы

* Х H i.............fn М < I1*-

 

Внутренность

множества

С не

пуста, ибо оно содер­

жит внутренность

неотрицательного

ортанта

в

Rn+1.

(Если ро >

0, . . . ,

рп >

0, то

ро >■ Ы **)— fo(x*) — 0

и рi > f i ( x t)

при i —

1......... п.)

Далее,

С — выпуклое

множество, поскольку

функции

fiy

i —

0, . . . , п,

вы­

пуклы. Наконец, 0 ф. С,

ибо, если 0 <= С,

то существует

такой х ^ А ,

что Ы *) <

Ы**) и f i ( x ) ^ 0, i =

1, .. ., п,

т. е. х* — не решение задачи.

По теореме отделимости множество С можно отде­ лить от нуля ненулевым линейным функционалом, т. е.

существуют не

равные одновременно нулю числа

U, . . . . Хп такие,

что

Соседние файлы в папке книги из ГПНТБ