книги из ГПНТБ / Васильев Ф.П. Лекции по методам решения экстремальных задач
.pdfМ И Н И М И З А Ц И Я Ф У Н К Ц И И одной ПЕРЕМЕННО Й |
[ГЛ. I |
ностных характеристик случайной величины z{u) можно доказать схо димость по вероятности последовательности {и,,}, определяемой фор мулами ( 1), к точке глобального минимума J (и) [45].
Практическое применение метода (1) показало, что его схо димость, вообще говоря, сильно замедляется в тех случаях, когда слева от точки минимума и* график функции имеет крутой спуск, справа от и* — крутой подъем, а на остальных участках функции /(«) изменяется медленно. Тогда на пологих участках шаги поис ка |мп+1— «п| могут стать очень малыми, а на крутых участках, наоборот, достаточно большими, и в результате большая часть вре мени на поиск может быть затрачена на чрезмерно медленные спуски на пологих участках и последующие большие скачки че рез точку минимума с попаданием на другой пологий участок. В таких ситуациях может оказаться полезной следующая так на
зываемая |
нормализованная |
процедура |
Кифера |
— Вольфовица |
|||||||
[230]: |
|
|
|
|
|
|
|
|
|
|
|
|
un+i — ип — ап sign (z {ип + сп) — z (ип— сП)), |
п = |
1 , 2 , . . . , |
(3) |
|||||||
где |
последовательности |
{а п}, |
{с„} |
удовлетворяют условиям |
(2 ) и, |
||||||
как |
обычно, |
s ig n x = l |
при х > 0 , |
signx= — 1 при |
х < 0 , signx= 0 |
||||||
при л := 0 . |
Сходимость |
процесса (3) можно ускорить, если длину |
|||||||||
шага {ап} |
|
менять лишь |
при |
изменении |
знака |
z{un-\-cn) — |
|||||
— z(un— с„), |
сохраняя |
ап постоянным в |
остальных |
случаях |
[230]. |
||||||
|
Различные варианты метода |
стохастической |
аппроксимации, |
строгое обоснование этого метода и различные приложения можно найти в работе [45]. Другой метод поиска минимума при наличии помех описан в работе [213].
Г л а в а 2
Минимизация функций многих переменных
Г
§ 1. ПОСТАНОВКА ЗАДАЧИ. ОБОЗНАЧЕНИЯ. ВСПОМОГАТЕЛЬНЫЕ СВЕДЕНИЯ
1.Пусть на некотором множестве U /n-мерного евклидов
пространства Е т задана |
функция J{u ) переменных (и\ |
ит) =и. |
||
Будем рассматривать задачу минимизации функции |
I (и) на |
|||
множестве U, |
понимая под этим следующие вопросы: |
1 ) |
найти |
|
/* = inf J (и) ; |
2) если на |
U нижняя грань достигается, |
то |
найти |
ибо |
|
|
|
|
точку u * e U y в которой /(и*) = / *; 3) если нижняя грань не дости гается на U, то указать последовательность {un}czU , для которой
lim J(u n) = J* . Точку u *^ U со свойством J ( u * ) = J * называют
—»оо
точкой минимума J (и) |
на U, |
а |
последовательность |
{un}czU со |
свойством lim /(«„) = / * |
называют минимизирующей |
последова- |
||
оо |
|
на U. |
|
|
тельностью для функции J(u) |
|
|||
Умение эффективно решать |
задачи минимизации функций |
конечного числа переменных на заданных множествах определяет успех в решении многих задач прикладного характера. Современ ная теория экстремальных задач позволяет свести многие экстре мальные задачи в бесконечномерных пространствах к задачам минимизации функций конечного числа переменных, и в связи с этим значение эффективных вычислительных алгоритмов поиска
экстремума функций конечного числа |
переменных в |
последнее |
||||
время еще более возросло. |
|
|
|
|
|
|
Что известно из классического анализа |
о методах |
решения |
||||
поставленной задачи? Если |
и* — точка |
минимума гладкой функ |
||||
ции J (и) на всем пространстве Ет, то |
[126] |
|
|
|||
dJ (О ... |
0 |
(i = 1 |
, 2 |
, |
,т). |
( 1) |
ди<■ |
|
|||||
|
|
|
|
|
|
Точка и*, являющаяся решением системы уравнений (1), назы вается стационарной точкой функции /(и ). Если стационарные точки найдены, то среди них нужно выбрать те точки, в которых в самом деле достигается минимум. Для этого нужно провести дополнительное исследование поведения функции в окрестности стационарной. точки. Если функция J(u) дважды непрерывно
52 МИНИМИЗАЦИЯ ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ [Гл. 2
дифференцируема, то наряду с системой ( 1 ) рассматривается квадратичная форма
у»/(«*) « у
4* ди!ди/ |
• |
1 |
|
которая в точке минимума должна быть неотрицательно опреде ленной. Если эта квадратичная форма положительно определена, то и* есть точка, вообще говоря, локального минимума функ ции /(и). Чтобы найти абсолютный минимум, остается перебрать все точки локального минимума и из них выбрать точку с наи меньшим значением функции, если таковая существует.
Создается впечатление, что изложенный классический подход в основном решает задачу минимизации достаточно гладких функ ций на всем пространстве. В действительности же на этом пути обычно встречаются такие вычислительные трудности, которые делают необходимым поиск других методов решения. Например,- отыскание стационарных точек из системы ( 1 ) сама по себе весьма серьезная задача, по трудности сравнимая, быть может, с исход
ной задачей минимизации. |
Далее, |
если множество |
О ф Е т, то |
|
минимум функции может достигаться на границе |
множества U, |
|||
и в этой точке условие ( 1 ), |
вообще говоря, не будет выполняться. |
|||
Разумеется, на этом основании классический подход |
не может |
|||
быть исключен из арсенала |
методов |
минимизации. |
В |
некоторых |
простых (но, к сожалению, |
редких) |
ситуациях классический под |
ход просто незаменим и дает полное решение задачи минимиза ции в аналитическом виде через различные параметры задачи.
К настоящему времени разработано и исследовано на сходи мость довольно много методов минимизации функций многих пере менных. В наших лекциях будут рассмотрены некоторые наиболее часто используемые на практике итерационные методы, позволяю щие при определенных условиях строить последовательности {и„}, которые являются минимизирующими или сходятся к точке мини мума. Част*? из этих методов пригодна для поиска минимума функции на всем пространстве Ет, часть — на ограниченных мно жествах U, а некоторые методы нетрудно приспособить к поиску минимума как при U = E m, так и при и ф Е т, причем может быть
U ограничено или не ограничено. |
Мы остановимся |
также н а' од |
|
ном общем приеме, позволяющем |
свести |
задачу |
минимизации |
функции на и ф Е т к последовательности |
задач минимизации на |
всем пространстве Ет, — здесь речь идет о так называемом методе штрафных функций. Будет изложена вычислительная схема каж дого из этих методов, при некоторых предположениях на функции и множество U будет доказана их сходимость, а в ряде случаев по лучим оценку скорости сходимости и дадим краткую характе ристику методов. При этом рассмотрим лишь основные ва
s n Постановка задачи. Обозначения. Вспомогательные сведения 53
рианты излагаемых методов, чтобы ознакомить читателя с основа ми этих методов, полагая, что знание основ методов облегчит читателю изучение литературы по данному вопросу, позволит ему без особого труда самостоятельно разобрать тот или иной алго ритм и выбрать подходящую модификацию метода или самому придумать новую его модификацию, исходя из особенностей кон кретной задачи.
Чем руководствоваться при выборе метода, каковы критерии, по которым можно'сравнивать различные методы? Довольно рас пространенный критерий оценки метода — скорость сходимости, и при этом считают, что чем выше скорость сходимости, тем лучше метод. Конечно, чем быстрее сходится метод, тем меньшее число итераций необходимо для получения решения с заданной точ ностью. Однако при оценке метода важное значение имеет не столько скорость сходимости метода, сколько общий объем вычис лений, требуемый для получения решения с заданной точностью. А общий объем вычислений зависит не только от числа итераций, но и от трудоемкости вычислений на каждой итерации. Нередко бывает, что при решении конкретной задачи выгоднее применять метод, который хотя и сходится медленнее и, следовательно, тре бует большого числа итераций, но расчет каждого шага итерации этого метода осуществляется просто и требует небольшого числа машинных операций, и суммарный объем вычислений для решения задачи с нужной точностью оказывается меньше, чем при приме нении другого, более быстро сходящегося метода, если каждый шаг итерации последнего связан с трудоемкими' вычислениями.
В том случае, когда свойства минимизируемой функции из вестны мало, то, видимо, сначала полезно применять грубые и простые методы минимизации (быть может, даже метод простого перебора значений функции на сетке с небольшим числом узлов), а затем на основе накопленной при этом информации о функции перейти к более точным методам. Например, при минимизации достаточно гладких функций сначала можно применить какой либо вариант градиентного метода, который вблизи точки мини-
•мума обычно начинает сходиться очень медленно, а затем на основе полученного приближения точки минимума перейти к ме тоду Ньютона, каждый шаг которого хотя и более трудоемок, но общий объем вычислений может оказаться небольшим из-за быстрой сходимости метода Ньютона вблизи точки минимума.
При выборе метода минимизации наряду с общим объемом вычислений следует принимать во внимание также и устойчивость метода по отношению к погрешностям, область сходимости мето да, степень гладкости и другие свойства минимизируемой функ ции, сложность вычислений значений функции и ее производных, используемых в методе, требуемый объем памяти, удобство реа лизации на ЭВМ и т. д.
54 |
|
|
М И Н И М И З А Ц И Я Ф У Н К Ц И И |
МНОГИХ ПЕРЕМЕННЫ Х |
|
[ Л , 2 |
|||||||||||
|
2. |
Для |
описания и изучения -методов минимизации нам пон |
||||||||||||||
бятся отдельные формулы и факты |
из классического анализа. При |
||||||||||||||||
мем |
следующие |
обозначения: Е т— евклидово |
пространство |
размер |
|||||||||||||
ности т\ и = |
а |
х |
I — вектор-столбец или |
точка |
пространства Ет с |
||||||||||||
( |
: |
||||||||||||||||
|
|
|
|
\umJ |
|
|
|
|
|
|
|
|
|
|
|
||
координатами |
u£, |
i — 1 , |
2 , . . . , т; |
иТ = (и1, ■■■, ит) — вектор-строка; |
|||||||||||||
А = |
{ |
а |
— матрица порядка п х |
т с элементами |
acj(i = 1 ,2 , . . . ,п\ |
||||||||||||
у = 1, |
2, |
. ••, т)\ |
матрицу, |
полученную транспонированием |
А, |
будем |
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
т |
|
|
|
|
|
обозначать через АТ или |
А*\ |
агb = |
(а, Ь)еп = |
а ‘Ь‘ — скалярное про- |
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
i=i |
|
_______ |
|
|
|
изведение двух |
векторов |
а |
и b |
из Е ,п; |а \Ет = |
] / (а, а)Ет~ |
евклидова |
|||||||||||
норма вектора |
а 6 |
Ет\ Аи = и — произведение матрицы |
А на |
вектор- |
|||||||||||||
столбец |
и, представляющее |
собой |
вектор-столбец v 6 |
Еп с |
координа- |
||||||||||||
|
|
|
т |
|
|
|
|
|
т |
|
|
|
|
|
|
|
|
тами |
|
v‘ = £ |
йци‘ \ (Ah,, t,) = |
^ |
dijVV — квадратичная форма с сим- |
||||||||||||
|
|
|
Уг=1 |
|
|
|
|
|
£,/=1 |
|
|
|
|
|
|
|
|
метрической матрицей Л |
порядка т х /гг, |
||А ||„jm = |
sup\Аи\Е — норма |
||||||||||||||
матрицы А порядка п х т . |
Там, |
|
|
|
|
|и|<1 |
|
|
|
||||||||
где не могут возникнуть недоразуме |
ния, индексы пространств в обозначениях скалярных произведений, норм векторов и матриц, знак транспонирования в обозначении век-
/•М «) X
тор-строки мы будем опускать. Пусть далее J' (и) — :
W n (и) J
диент функции J (и) в точке и,
J ихихУ•
Г ( и ) =
матрица вторых производных функции J (и) в точке и; здесь
|
J |
dj (иу |
д Ч ( и ) |
|
|
|
|
|
ди1 |
д и £дик |
’ |
|
|
||
|
|
|
|
|
|||
Qp (U). — множество |
всех |
функций, |
обладающих |
на U |
непрерывными |
||
частными производными до порядка |
р включительно; |
о (а) — величи |
|||||
на, бесконечно малая относительно а при а -» -0 , т. е. limo (а) -а- 1 .= |
0 . |
||||||
|
|
|
|
|
а -»0 |
|
|
Как |
известно, для любых а, b 6 Ет имеет место неравенство Ко |
||||||
ши — Буняковского: |
|(а, |
Ъ) |< |а \■|Ь\, причем |
знак |
равенства при |
|||
а , Ь Ф 0 |
возможен |
тогда |
и только |
тогда, когда |
a = |
ab, а = const. |
|
Далее, \Аи\Еа < IIA ||„,m |и |£|п для любых матриц А порядка п х т |
и |
||||||
любых и 6 Ет. |
|
|
|
|
|
|
§ п |
|
Постановка |
задачи. Обозначения. Вспомогательные сведения |
55 |
||||||||||||||
|
Если J (и) £С р (U), |
и + |
ah £ U при 0 < а < |
1, |
то |
|
|
|
||||||||||
|
|
J (u + |
h) — J |
(и) = |
(/' (и), h) + о ( \h\) |
при р = |
1 , |
(2 ) |
||||||||||
J(u + h) — J(u) |
= |
( J ' ( u ) , h ) + - j ( J "(u)h,h) + o{\h\2) |
при р = 2. |
(3) |
||||||||||||||
|
Рассмотрим функцию g (а) — / (и + аК) одной переменной а, |
0 < |
||||||||||||||||
< С а < ;1 , при фиксированных и, h, предполагая, |
что u + a h ^ U |
при |
||||||||||||||||
всех |
а, |
0 < |
а < |
1. |
Если J (и) 6 |
Ср (U), |
то g (а) 6 |
Ср [0, |
1], |
причем |
||||||||
ё' (а) = |
( J ’ (« + |
ah), |
Щ, |
(р > |
1), |
g" (а) = (/" (и + |
ah) h, |
h) |
(р > 2). |
(4) |
||||||||
В самом деле, если, |
например, |
J |
(и) £ С2 ([/), то, заменив в формуле |
|||||||||||||||
(3) |
и на и + ah, h |
на Дah, получим |
|
|
|
|
|
|
|
|||||||||
|
|
|
g (а |
+ |
Да) — g (а) = |
Да (/' (и -f- ah), h) + |
|
|
|
|||||||||
|
|
|
|
+ |
|
|
Да2 (/" (и + |
ah) h, h) + о ( |Да |2). |
|
|
|
|||||||
Отсюда |
следует, что g (а) в С2 [0, |
1] и верны формулы (4). |
|
|||||||||||||||
|
Выпишем следующие формулы классического |
анализа для функ |
||||||||||||||||
ции g (а): |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
а |
|
|
|
|
|
|
|
|
|
|
g(a) — g (0 ) = |
g ’ (0 ха) а = | g' (t) dt = |
g r (0 ) а + |
- y g " (0 2а) а2, |
|
|||||||||||||
|
|
|
|
|
|
|
|
|
о |
|
|
|
|
|
|
|
|
|
|
|
|
|
g' (а) — g' (0 ) = аg" (0 3а), 0 < в£< 1 . |
|
|
|
|||||||||||
|
Полагая в |
этих |
формулах |
а = 1 |
и |
пользуясь равенствами |
(4), |
|||||||||||
получим |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
J |
{и + |
h) — J |
|
(и) = g (1) — g (0) = |
(J'(u + |
Bjh), h) = |
|
|||||||||
|
|
|
|
|
|
|
|
= ^ (J'(u + th),h)dt, |
|
|
|
|
(5) |
|||||
|
|
|
|
|
|
|
|
о |
|
|
|
|
|
|
|
|
|
|
|
|
J |
(u + |
h) — J |
(u) = |
(J' {u),h) + |
-1- (/" (и 4 - e2/i) h, h), |
(6 ) |
||||||||||
|
{J’ (u + h) - |
J' (u), h) = g' (1) — g' (0) = (J" (u + |
Q3h) h, h). |
(7) |
3.В настоящее время наиболее полно исследованы зада
минимизации выпуклых функций на выпуклых множествах. Р аз дел экстремальных задач, рассматривающий такие задачи, часто называют выпуклым программированием. Приведем определения выпуклых множеств и функций, докажем некоторые их свойства. По поводу выпуклых множеств и функций см. работы [39, 46, 73,
8 8 , 97, 114, 116, 127, 128, 133, 134, 199, 229, 260, 269] и др.
56 |
М И Н И М И З А Ц И Я Ф У Н К Ц И И |
М НОГИ Х ПЕРЕМЕННЫХ |
|
[ Г л . 2 |
|||||||
|
|
|
iPTu--' |
° |
’ |
’ ••• « - |
|
выпуклым, |
|||
О п р е д е л е н и е |
1 . |
Множество |
|
£/ называется |
|||||||
если а и + ( 1— а ) в е (/ |
при любых |
u, |
n et/ и любых а, Ог^агсН, |
||||||||
т. е. отрезок £ ^ -а (у — и), |
где О ^ а ^ Л , |
соединяющий |
любые две |
||||||||
точки и, v множества, также принадлежит множеству. |
|
|
|||||||||
Таким |
образом, |
формулы |
|
(2— 7) |
справедливы |
при |
всех |
||||
и, u+h^ .U , |
если |
U — выпуклое множество, а функция J (и) |
доста |
||||||||
точно гладкая. |
|
|
Функция J (и ), определенная |
|
|
||||||
О п р е д е л е н и е |
2. |
на выпук |
|||||||||
лом множестве U, называется выпуклой, если |
|
|
|
||||||||
|
J (аи + (1 — a) v) •< a J (и) + (1 — a) J (у) f t v |
(8 ) |
|||||||||
при всех и, |
v ^ U |
и всех |
а, O ^ assri. |
Если в (8 ) равенство |
воз |
||||||
можно только при а = 0 и а = 1, то /(и) |
называется |
строго выпук |
|||||||||
лой функцией. |
|
|
J (и) выпуклая функция |
|
|
|
|||||
Т е о р е м а |
1. Если |
на |
выпуклом |
||||||||
множестве |
U, то |
всякая |
точка |
локального минимума |
J (и) |
одно |
временно является точкой ее абсолютного минимума на 0 . Мно
жество U* всех точек минимума J (и) на U выпукло |
(если |
оно не |
|||||||||
пусто). Если |
J (и) строго выпуклая |
функция на U, то она может |
|||||||||
достигать своего |
минимума |
на U не более, чем в одной точке. |
|||||||||
Д о к а з а т е л ь с т в о . |
Пусть |
|
н* — точка локального |
мини |
|||||||
мума /(«), т. е. |
существует |
такая |
окрестность О точки и*, что |
||||||||
J ( u * ) ^ J ( u ) |
при всех н е О |
и « e U . |
Пусть |
вопреки утверждению |
|||||||
существует |
такая точка |
|
ие1/, |
|
что |
/(и*) > / ( у ) . |
Так |
как |
|||
и — и* + a ( v — u*)eO f)£/ при всех достаточно малых а, |
0 < а < 1, то |
||||||||||
с учетом выпуклости функции J (и) |
будем иметь |
|
|
|
|
||||||
J (и*) < |
/ (и* -Ь а (у — и*)) < a J |
(у) + (1 — a) J («*) < |
J |
(и*). |
|
||||||
Противоречие. Следовательно, |
ы* — точка |
абсолютного |
минимума |
||||||||
J {и) на U. |
|
|
|
|
|
|
|
|
|
|
|
Далее, если выпуклая функция достигает своего минимума в |
|||||||||||
двух различных точках и*, |
v*^ U , |
то она достигает минимума |
во |
всех точка отрезка, соединяющего эти две точки. Это следует из соотношений
J («*) = J (у*) < |
J (<ш* + (1 — а) у*) < |
a J (и*) + (1 — a) J |
(у’) = |
J (и*), |
||||
превращающихся в равенства при всех a, |
O ^ a^ C l. Однако в слу |
|||||||
чае строго выпуклой функции такое равенство невозможно |
при |
|||||||
0 < а < 1 . А |
2. Если выпуклая |
функция |
J ( u ) ^ C l (U) |
на |
вы |
|||
Т е о р е м а |
||||||||
пуклом множестве U, то |
|
|
|
|
|
|
|
|
(J'(y ), и — у )< Т (« ) — |
(и), и — у) |
при всех и, у € U. |
||||||
|
|
|
|
|
|
|
|
(9) |
Д о к а з а т е л ь с т в о . |
Перепишем |
неравенство |
(8 ) |
в |
виде |
|||
J(v-\-a(u—у) ) —J ( v ) ^ . a [ J ( u ) —/(у)]. К левой |
части |
этого |
нера |
§ П |
Постановка задачи. Обозначения. Вспомогательные |
сведения |
|
57 |
||||||||||||
венства |
применим |
формулу |
(5): |
J(v-{-a(u —v ) ) — J(v) = a(J'(v-\ - |
||||||||||||
+ 0 a(u — a )), и— v), |
O ^ G ^ l, и получим (//(u + ’0 a (« — v)), и— v) ^ |
|||||||||||||||
^ / ( u ) — 7 (d) при |
всех a, |
0 < a ^ l . Отсюда |
при a -*-+ 0 вытекает |
|||||||||||||
левое неравенство (9). Поменяв в полученном неравенстве |
роля |
|||||||||||||||
ми и и v, получим правое неравенство |
(9). |
А |
|
|
|
C 1 (U) |
||||||||||
Т е о р е м а |
3. |
Для того чтобы выпуклая функция J (и) g |
||||||||||||||
достигла |
своего |
минимума |
|
на выпуклом |
множестве |
U в |
точке |
|||||||||
«*е£/ , необходимо и достаточно, чтобы |
|
|
|
|
|
|
|
|||||||||
|
|
(/'(«*), |
и — ы‘) > 0 |
при всех |
|
и £ и . |
|
|
|
( 1 0 ) |
||||||
Если и* — внутренняя |
точка |
множества |
U, |
то условие |
(10) |
экви |
||||||||||
валентно равенству / '(«*) = 0 . |
|
|
|
|
|
u *^ U — точка |
||||||||||
Д о к а з а т е л ь с т в о . |
|
Необходимость. Пусть |
||||||||||||||
минимума /(и) на U. Тогда при любом u^U , и а, |
0 < а < 1 , |
с по |
||||||||||||||
мощью формулы (2 ) имеем |
|
|
|
|
|
|
|
|
|
|
|
|||||
0 < |
J |
(и* + |
а (и — «*)) — J (и*) = а (J ' (и*), |
и — и*) + |
о (а), |
|
|
|||||||||
или |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0 |
< (/ '(« *). « - « * ) + |
а |
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Отсюда при а-Я ) сразу получим условие (10). Заметим, что |
||||||||||||||||
условием выпуклости J (и) |
мы здесь не воспользовались, так |
что |
||||||||||||||
условие |
минимума |
(10) необходимо |
для всех J(u )^ .C l (U), |
если |
||||||||||||
U — выпуклое множество. |
|
|
|
|
|
|
|
|
|
|
|
|||||
Если и* — внутренняя |
точка |
множества |
U и h — произволь |
|||||||||||||
ный вектор из Ет, то |
u — u* + ah^.U |
при всех достаточно |
малых |
|||||||||||||
a, |a|^ao. |
Полагая в (10) |
u=u*-\-ah, |
получим a (/ '(«*), |
h) ^ 0 |
||||||||||||
при всех a, |
|a|^ao, |
что |
возможно |
только |
при |
(Г (и *), |
h ) —0. |
|||||||||
В силу произвола h отсюда имеем / '(«*) = 0 . |
|
|
|
|
|
|
||||||||||
Д о с т а т о ч н о с т ь . |
Пусть /(«) |
— выпуклая |
функция, |
пусть |
для некоторой точки и* выполнено условие (10). Тогда из левого
неравенства |
(9) |
при |
|
v = u* |
получим |
0 ^ |
(/ '(«*), и— и *)^ . |
||
(и)— /’(и*) |
при всех |
и е 1/, |
т. е. |
и * — точка |
минимума.^, |
||||
Заметим, что условие минимума |
(10) является обобщением |
||||||||
условия ( 1 ) на случай, |
когда 11фЕт и точка минимума и* |
может |
|||||||
лежать на границе множества. |
|
|
|
|
|
||||
Так как при и =ы * |
(10) превращается в равенство, то условие |
||||||||
( 1 0 ) может |
|
быть |
|
переписано |
|
в эквивалентном |
виде |
||
min (J'(u *)t и— и*) = 0 . |
|
|
|
|
|
|
|
||
uBU |
|
|
3. |
Функция J(u ), |
определенная на выпук |
||||
О п р е д е л е н и е |
|||||||||
лом множестве U, называется сильно выпуклой, если существует |
|||||||||
такая постоянная к > 0 , |
что |
|
|
|
|
|
|||
J (аи + (1 — a) v) < |
a J (и) -j- (1 — a)J(v ) — а (1 — а) и|и — у |2 (11) |
||||||||
при всех u ,v £ U |
и всех |
а, 0 <С а •< 1 . |
|
|
|
|
58 |
М И Н И М И З А Ц И Я |
Ф У Н К Ц И И |
МНОГИ Х ПЕРЕМЕННЫ Х |
|
|
[ Г л . 2 |
|||||||||||
Очевидно, |
сильно |
|
выпуклая |
функция /(«) |
выпукла |
и даже |
|||||||||||
строго выпукла. Примером сильно выпуклой |
функции |
является |
|||||||||||||||
J(u) = (и, |
и ) = и 2, |
(х — 1 ). |
|
|
|
|
|
|
|
|
|
|
|
||||
Т е о р е м а |
4. |
Для |
того |
чтобы Д ы )е С '(Д ) |
на |
выпуклом |
|||||||||||
множестве U была сильно выпуклой |
функцией, |
необходимо и |
|||||||||||||||
достаточно, чтобы существовала такая константа ц > 0 , |
что |
|
|||||||||||||||
(J'(v) — /'(и ), |
v — ы ) > р \v— и )2 |
при всех |
и, v £ U . |
(12) |
|||||||||||||
Д о к а з а т е л ь с т в о . |
Н е о б х о д и м о с т ь . |
Пусть |
J {и) — |
||||||||||||||
сильно выпуклая |
функция |
|
из |
Cl (U). |
В неравенстве |
(11) |
при |
||||||||||
а = — |
имеем |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
х |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
при всех |
и, v 6 |
U. |
|
|
|
|
|
|
(13) |
|||
К каждой квадратной скобке применим правое |
неравенство |
(9). |
|||||||||||||||
Получим |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
х \ и — |
о|2< 2 ^ / ' (и), ^ ~ ) + |
2 ^ ' (v ), |
V — |
и \ |
____ |
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
) ~ |
|
|
|
|
|
|
|
= |
|
{J'{v) — J' (и), |
V — |
и) |
|
|
|
|
|
|
|||
при всех |
и, v^ U . Остается |
в |
неравенстве |
(12) |
принять р,=х. |
||||||||||||
Д о с т а т о ч н о с т ь . |
Пусть |
/ (ц )е С ‘ (£/) |
и |
удовлетворяет |
|||||||||||||
неравенству (12). Покажем, |
что тогда J (и) — сильно выпукла, |
при |
|||||||||||||||
чем в неравенстве |
(11) |
|
тогда |
можно принять х = -^ -р . С помощью |
|||||||||||||
формулы (5) |
будем иметь |
|
|
|
|
|
|
|
|
|
|
|
|||||
|
сU (и) 4 - (1 |
— a)J(v)~J (аи 4- (1 — а ) v)= |
|
|
|
||||||||||||
|
— a [ J |
(и)— J |
(о)] — [J iv4- а (и— v))— J (и)] = |
|
|
|
|||||||||||
1 |
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
= а J (У' (и4- t(u— v)), и — v)dt— а ^ (У' (о ~ (а(и— |
v)), и—v)dt = |
||||||||||||||||
о |
|
|
1 |
|
|
|
|
|
о |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
= |
а ^ (У' (и 4- t {и — |
и)) — J' |
(v4- ta (и — и)), |
|
|
|
||||||||||
|
|
|
о |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(р + (ц — v)t) — (v + |
ta{u — v))) - - |
di- |
> |
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
<(1 — а) |
|
|
|
|
||
> аЦ J |
- * (l _ -” )2 -\u — v\2d t = у ц а (1 |
— a)|u — v |2 |
|
||||||||||||||
|
о |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
при всех |
и, v^ U |
|
и 0 < а < 1 . |
А |
|
|
|
|
|
|
|
|
§ /] |
|
Постановка |
задачи. Обозначения. Вспомогательные |
сведения |
|
59 |
||||||||
|
Т е о р е м а |
5. |
Для того чтобы функция |
7(м)<=С2(£/) |
на |
вы |
||||||||
пуклом множестве U, имеющем внутренние точки, была |
сильно |
|||||||||||||
выпуклой, необходимо и достаточно, чтобы существовала |
такая |
|||||||||||||
константа р > 0 , |
что |
|
|
|
|
|
|
|
|
|
||||
|
|
{J"(u)l, |
I) > р |£|2 |
при всех |
u £ U |
и |
£ € Ет. |
|
(14) |
|||||
|
Д о к а з а т е л ь с т в о . |
Н е о б х о д и м о с т ь . |
Пусть |
J (и) — |
||||||||||
сильно |
выпукла |
и |
J ( u ) ^ C 2(U). |
Пусть |
сначала |
« — внутренняя |
||||||||
точка |
множества |
U, |
а £ — произвольная |
точка |
из Ет. Тогда |
|||||||||
£'= |
и + г£ е£ / |
при |
всех достаточно малых е, |е|^ео. Из |
форму |
||||||||||
лы (7) с учетом неравенства |
(12) |
имеем |
|
|
|
|
|
|
||||||
е (J' (и -Ь eg) — J ’ {и), |
|) = ег {J" (и + |
0eg) g, g) > |
е2ц 11 12, |
0 < |
0 < |
1. |
||||||||
Следовательно, |
(7"(n)g, g) = lim (J" ( u + 0eg) |
g, g)i^=p|g|2 при |
всех |
|||||||||||
g e £ m. Если |
и — граничная |
е-*0 |
U, то существует |
такая |
после |
|||||||||
точка |
||||||||||||||
довательность внутренних точек {«,г}е (У , что ип-*-и(п-*-оо). |
Для |
|||||||||||||
внутренних точек по доказанному выполняется (J"(un)l, g) |
|
2 |
||||||||||||
при |
всех 1<^Ет. Пользуясь |
непрерывностью |
|
|
отсюда |
при |
/г-хоо получим неравенство (14) и для граничных точек U. Заметим, что если выпуклое множество U не имеет внутрен
них точек в Е\,п> то оно лежит в некоторой гиперплоскости прост ранства Ет (см. ниже упражнение 5.5). В этом случае множество U можно поместить в пространство меньшей размерности и все рас суждения проводить в этом пространстве. Нетрудно придумать функцию в Епь которая в пространстве Ег (г<Ст) сильно выпукла,
а в Ет не выпукла |
(например, |
1(и\ |
и2) = |
(и1)2— (и2) 2 при ц2 = 0 ) . |
|||||||||
Д о с т а т о ч н о с т ь . |
|
Пусть |
/( « ) е С 2 (У ) |
и |
удовлетворяет |
||||||||
условию |
(14). |
Отсюда |
с |
помощью |
формулы |
(7) |
при h = v—и |
||||||
имеем |
|
|
|
|
|
|
|
|
|
|
|
|
|
(J'(v) — / '(« ), |
v — и) = (J" (и + 0 (v — u))(v — u), |
v — « )> |
|||||||||||
|
|
|
|
|
|
> р | и — v\2 |
|
|
|
|
|||
при всех |
и, v^ U . Тогда |
согласно теореме 4 J (и) сильно выпукла, |
|||||||||||
и в неравенстве |
(11) |
можно принять |
и = |
— . |
Заметим, что при |
||||||||
доказательстве |
достаточности |
существование |
внутренних |
точек |
|||||||||
U не использовалось. |
|
|
|
|
|
|
|
|
|
|
|||
З а м е ч а н и е . |
|
Полезно |
уяснить связь между |
константами |
|||||||||
к и р, из неравенств |
(11), |
(12) |
и |
(14). |
Как |
видно из |
доказа |