Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Васильев Ф.П. Лекции по методам решения экстремальных задач

.pdf
Скачиваний:
16
Добавлен:
25.10.2023
Размер:
14.17 Mб
Скачать

М И Н И М И З А Ц И Я Ф У Н К Ц И И одной ПЕРЕМЕННО Й

[ГЛ. I

ностных характеристик случайной величины z{u) можно доказать схо­ димость по вероятности последовательности {и,,}, определяемой фор­ мулами ( 1), к точке глобального минимума J (и) [45].

Практическое применение метода (1) показало, что его схо­ димость, вообще говоря, сильно замедляется в тех случаях, когда слева от точки минимума и* график функции имеет крутой спуск, справа от и* — крутой подъем, а на остальных участках функции /(«) изменяется медленно. Тогда на пологих участках шаги поис­ ка |мп+1— «п| могут стать очень малыми, а на крутых участках, наоборот, достаточно большими, и в результате большая часть вре­ мени на поиск может быть затрачена на чрезмерно медленные спуски на пологих участках и последующие большие скачки че­ рез точку минимума с попаданием на другой пологий участок. В таких ситуациях может оказаться полезной следующая так на­

зываемая

нормализованная

процедура

Кифера

Вольфовица

[230]:

 

 

 

 

 

 

 

 

 

 

 

un+i — ип ап sign (z {ип + сп) — z (ипсП)),

п =

1 , 2 , . . . ,

(3)

где

последовательности

{а п},

{с„}

удовлетворяют условиям

(2 ) и,

как

обычно,

s ig n x = l

при х > 0 ,

signx= — 1 при

х < 0 , signx= 0

при л := 0 .

Сходимость

процесса (3) можно ускорить, если длину

шага {ап}

 

менять лишь

при

изменении

знака

z{un-\-cn)

z(un— с„),

сохраняя

ап постоянным в

остальных

случаях

[230].

 

Различные варианты метода

стохастической

аппроксимации,

строгое обоснование этого метода и различные приложения можно найти в работе [45]. Другой метод поиска минимума при наличии помех описан в работе [213].

Г л а в а 2

Минимизация функций многих переменных

Г

§ 1. ПОСТАНОВКА ЗАДАЧИ. ОБОЗНАЧЕНИЯ. ВСПОМОГАТЕЛЬНЫЕ СВЕДЕНИЯ

1.Пусть на некотором множестве U /n-мерного евклидов

пространства Е т задана

функция J{u ) переменных (и\

ит) =и.

Будем рассматривать задачу минимизации функции

I (и) на

множестве U,

понимая под этим следующие вопросы:

1 )

найти

/* = inf J (и) ;

2) если на

U нижняя грань достигается,

то

найти

ибо

 

 

 

 

точку u * e U y в которой /(и*) = / *; 3) если нижняя грань не дости­ гается на U, то указать последовательность {un}czU , для которой

lim J(u n) = J* . Точку u *^ U со свойством J ( u * ) = J * называют

—»оо

точкой минимума J (и)

на U,

а

последовательность

{un}czU со

свойством lim /(«„) = / *

называют минимизирующей

последова-

оо

 

на U.

 

тельностью для функции J(u)

 

Умение эффективно решать

задачи минимизации функций

конечного числа переменных на заданных множествах определяет успех в решении многих задач прикладного характера. Современ­ ная теория экстремальных задач позволяет свести многие экстре­ мальные задачи в бесконечномерных пространствах к задачам минимизации функций конечного числа переменных, и в связи с этим значение эффективных вычислительных алгоритмов поиска

экстремума функций конечного числа

переменных в

последнее

время еще более возросло.

 

 

 

 

 

 

Что известно из классического анализа

о методах

решения

поставленной задачи? Если

и* — точка

минимума гладкой функ­

ции J (и) на всем пространстве Ет, то

[126]

 

 

dJ (О ...

0

(i = 1

, 2

,

,т).

( 1)

ди<■

 

 

 

 

 

 

 

Точка и*, являющаяся решением системы уравнений (1), назы­ вается стационарной точкой функции /(и ). Если стационарные точки найдены, то среди них нужно выбрать те точки, в которых в самом деле достигается минимум. Для этого нужно провести дополнительное исследование поведения функции в окрестности стационарной. точки. Если функция J(u) дважды непрерывно

52 МИНИМИЗАЦИЯ ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ [Гл. 2

дифференцируема, то наряду с системой ( 1 ) рассматривается квадратичная форма

у»/(«*) « у

4* ди!ди/

1

 

которая в точке минимума должна быть неотрицательно опреде­ ленной. Если эта квадратичная форма положительно определена, то и* есть точка, вообще говоря, локального минимума функ­ ции /(и). Чтобы найти абсолютный минимум, остается перебрать все точки локального минимума и из них выбрать точку с наи­ меньшим значением функции, если таковая существует.

Создается впечатление, что изложенный классический подход в основном решает задачу минимизации достаточно гладких функ­ ций на всем пространстве. В действительности же на этом пути обычно встречаются такие вычислительные трудности, которые делают необходимым поиск других методов решения. Например,- отыскание стационарных точек из системы ( 1 ) сама по себе весьма серьезная задача, по трудности сравнимая, быть может, с исход­

ной задачей минимизации.

Далее,

если множество

О ф Е т, то

минимум функции может достигаться на границе

множества U,

и в этой точке условие ( 1 ),

вообще говоря, не будет выполняться.

Разумеется, на этом основании классический подход

не может

быть исключен из арсенала

методов

минимизации.

В

некоторых

простых (но, к сожалению,

редких)

ситуациях классический под­

ход просто незаменим и дает полное решение задачи минимиза­ ции в аналитическом виде через различные параметры задачи.

К настоящему времени разработано и исследовано на сходи­ мость довольно много методов минимизации функций многих пере­ менных. В наших лекциях будут рассмотрены некоторые наиболее часто используемые на практике итерационные методы, позволяю­ щие при определенных условиях строить последовательности {и„}, которые являются минимизирующими или сходятся к точке мини­ мума. Част*? из этих методов пригодна для поиска минимума функции на всем пространстве Ет, часть — на ограниченных мно­ жествах U, а некоторые методы нетрудно приспособить к поиску минимума как при U = E m, так и при и ф Е т, причем может быть

U ограничено или не ограничено.

Мы остановимся

также н а' од­

ном общем приеме, позволяющем

свести

задачу

минимизации

функции на и ф Е т к последовательности

задач минимизации на

всем пространстве Ет, — здесь речь идет о так называемом методе штрафных функций. Будет изложена вычислительная схема каж ­ дого из этих методов, при некоторых предположениях на функции и множество U будет доказана их сходимость, а в ряде случаев по­ лучим оценку скорости сходимости и дадим краткую характе­ ристику методов. При этом рассмотрим лишь основные ва­

s n Постановка задачи. Обозначения. Вспомогательные сведения 53

рианты излагаемых методов, чтобы ознакомить читателя с основа­ ми этих методов, полагая, что знание основ методов облегчит читателю изучение литературы по данному вопросу, позволит ему без особого труда самостоятельно разобрать тот или иной алго­ ритм и выбрать подходящую модификацию метода или самому придумать новую его модификацию, исходя из особенностей кон­ кретной задачи.

Чем руководствоваться при выборе метода, каковы критерии, по которым можно'сравнивать различные методы? Довольно рас­ пространенный критерий оценки метода — скорость сходимости, и при этом считают, что чем выше скорость сходимости, тем лучше метод. Конечно, чем быстрее сходится метод, тем меньшее число итераций необходимо для получения решения с заданной точ­ ностью. Однако при оценке метода важное значение имеет не столько скорость сходимости метода, сколько общий объем вычис­ лений, требуемый для получения решения с заданной точностью. А общий объем вычислений зависит не только от числа итераций, но и от трудоемкости вычислений на каждой итерации. Нередко бывает, что при решении конкретной задачи выгоднее применять метод, который хотя и сходится медленнее и, следовательно, тре­ бует большого числа итераций, но расчет каждого шага итерации этого метода осуществляется просто и требует небольшого числа машинных операций, и суммарный объем вычислений для решения задачи с нужной точностью оказывается меньше, чем при приме­ нении другого, более быстро сходящегося метода, если каждый шаг итерации последнего связан с трудоемкими' вычислениями.

В том случае, когда свойства минимизируемой функции из­ вестны мало, то, видимо, сначала полезно применять грубые и простые методы минимизации (быть может, даже метод простого перебора значений функции на сетке с небольшим числом узлов), а затем на основе накопленной при этом информации о функции перейти к более точным методам. Например, при минимизации достаточно гладких функций сначала можно применить какой либо вариант градиентного метода, который вблизи точки мини-

•мума обычно начинает сходиться очень медленно, а затем на основе полученного приближения точки минимума перейти к ме­ тоду Ньютона, каждый шаг которого хотя и более трудоемок, но общий объем вычислений может оказаться небольшим из-за быстрой сходимости метода Ньютона вблизи точки минимума.

При выборе метода минимизации наряду с общим объемом вычислений следует принимать во внимание также и устойчивость метода по отношению к погрешностям, область сходимости мето­ да, степень гладкости и другие свойства минимизируемой функ­ ции, сложность вычислений значений функции и ее производных, используемых в методе, требуемый объем памяти, удобство реа­ лизации на ЭВМ и т. д.

— гра-

54

 

 

М И Н И М И З А Ц И Я Ф У Н К Ц И И

МНОГИХ ПЕРЕМЕННЫ Х

 

[ Л , 2

 

2.

Для

описания и изучения -методов минимизации нам пон

бятся отдельные формулы и факты

из классического анализа. При­

мем

следующие

обозначения: Е т— евклидово

пространство

размер­

ности т\ и =

а

х

I — вектор-столбец или

точка

пространства Ет с

(

:

 

 

 

 

\umJ

 

 

 

 

 

 

 

 

 

 

 

координатами

u£,

i — 1 ,

2 , . . . , т;

иТ = (и1, ■■■, ит) вектор-строка;

А =

{

а

— матрица порядка п х

т с элементами

acj(i = 1 ,2 , . . . ,п\

у = 1,

2,

. ••, т)\

матрицу,

полученную транспонированием

А,

будем

 

 

 

 

 

 

 

 

 

 

 

 

т

 

 

 

 

 

обозначать через АТ или

А*\

агb =

(а, Ь)еп =

а ‘Ь‘ — скалярное про-

 

 

 

 

 

 

 

 

 

 

 

 

i=i

 

_______

 

 

изведение двух

векторов

а

и b

из Е ,п; |а \Ет =

] / (а, а)Ет~

евклидова

норма вектора

а 6

Ет\ Аи = и — произведение матрицы

А на

вектор-

столбец

и, представляющее

собой

вектор-столбец v 6

Еп с

координа-

 

 

 

т

 

 

 

 

 

т

 

 

 

 

 

 

 

тами

 

v‘ = £

йци‘ \ (Ah,, t,) =

^

dijVV — квадратичная форма с сим-

 

 

 

Уг=1

 

 

 

 

 

£,/=1

 

 

 

 

 

 

 

метрической матрицей Л

порядка т х /гг,

||А ||„jm =

sup\Аи\Е — норма

матрицы А порядка п х т .

Там,

 

 

 

 

|<1

 

 

 

где не могут возникнуть недоразуме­

ния, индексы пространств в обозначениях скалярных произведений, норм векторов и матриц, знак транспонирования в обозначении век-

/•М «) X

тор-строки мы будем опускать. Пусть далее J' (и) :

W n (и) J

диент функции J (и) в точке и,

J ихихУ

Г ( и ) =

матрица вторых производных функции J (и) в точке и; здесь

 

J

dj (иу

д Ч ( и )

 

 

 

 

ди1

д и £дик

 

 

 

 

 

 

 

Qp (U). — множество

всех

функций,

обладающих

на U

непрерывными

частными производными до порядка

р включительно;

о (а) — величи­

на, бесконечно малая относительно а при а -» -0 , т. е. limo (а) -а- 1 .=

0 .

 

 

 

 

 

а -»0

 

Как

известно, для любых а, b 6 Ет имеет место неравенство Ко­

ши — Буняковского:

|(а,

Ъ) |< |а \■|Ь\, причем

знак

равенства при

а , Ь Ф 0

возможен

тогда

и только

тогда, когда

a =

ab, а = const.

Далее, \Аи\Еа < IIA ||„,m |и |£|п для любых матриц А порядка п х т

и

любых и 6 Ет.

 

 

 

 

 

 

§ п

 

Постановка

задачи. Обозначения. Вспомогательные сведения

55

 

Если J (и) £С р (U),

и +

ah £ U при 0 < а <

1,

то

 

 

 

 

 

J (u +

h) J

(и) =

(/' (и), h) + о ( \h\)

при р =

1 ,

(2 )

J(u + h) — J(u)

=

( J ' ( u ) , h ) + - j ( J "(u)h,h) + o{\h\2)

при р = 2.

(3)

 

Рассмотрим функцию g (а) — / + аК) одной переменной а,

0 <

< С а < ;1 , при фиксированных и, h, предполагая,

что u + a h ^ U

при

всех

а,

0 <

а <

1.

Если J (и) 6

Ср (U),

то g (а) 6

Ср [0,

1],

причем

ё' (а) =

( J ’ (« +

ah),

Щ,

(р >

1),

g" (а) = (/" +

ah) h,

h)

(р > 2).

(4)

В самом деле, если,

например,

J

(и) £ С2 ([/), то, заменив в формуле

(3)

и на и + ah, h

на Дah, получим

 

 

 

 

 

 

 

 

 

 

g (а

+

Да) — g (а) =

Да (/' (и -f- ah), h) +

 

 

 

 

 

 

 

+

 

 

Да2 (/" +

ah) h, h) + о ( |Да |2).

 

 

 

Отсюда

следует, что g (а) в С2 [0,

1] и верны формулы (4).

 

 

Выпишем следующие формулы классического

анализа для функ­

ции g (а):

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

а

 

 

 

 

 

 

 

 

 

 

g(a) — g (0 ) =

g ’ (0 ха) а = | g' (t) dt =

g r (0 ) а +

- y g " (0 2а) а2,

 

 

 

 

 

 

 

 

 

 

о

 

 

 

 

 

 

 

 

 

 

 

 

 

g' (а) — g' (0 ) = аg" (0 3а), 0 < в£< 1 .

 

 

 

 

Полагая в

этих

формулах

а = 1

и

пользуясь равенствами

(4),

получим

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

J

+

h) J

 

(и) = g (1) — g (0) =

(J'(u +

Bjh), h) =

 

 

 

 

 

 

 

 

 

= ^ (J'(u + th),h)dt,

 

 

 

 

(5)

 

 

 

 

 

 

 

 

о

 

 

 

 

 

 

 

 

 

 

 

 

J

(u +

h) — J

(u) =

(J' {u),h) +

-1- (/" 4 - e2/i) h, h),

(6 )

 

{J’ (u + h) -

J' (u), h) = g' (1) — g' (0) = (J" (u +

Q3h) h, h).

(7)

3.В настоящее время наиболее полно исследованы зада

минимизации выпуклых функций на выпуклых множествах. Р аз­ дел экстремальных задач, рассматривающий такие задачи, часто называют выпуклым программированием. Приведем определения выпуклых множеств и функций, докажем некоторые их свойства. По поводу выпуклых множеств и функций см. работы [39, 46, 73,

8 8 , 97, 114, 116, 127, 128, 133, 134, 199, 229, 260, 269] и др.

56

М И Н И М И З А Ц И Я Ф У Н К Ц И И

М НОГИ Х ПЕРЕМЕННЫХ

 

[ Г л . 2

 

 

 

iPTu--'

°

’ ••• « -

 

выпуклым,

О п р е д е л е н и е

1 .

Множество

 

£/ называется

если а и + ( 1— а ) в е (/

при любых

u,

n et/ и любых а, Ог^агсН,

т. е. отрезок £ ^ -а (у — и),

где О ^ а ^ Л ,

соединяющий

любые две

точки и, v множества, также принадлежит множеству.

 

 

Таким

образом,

формулы

 

(2— 7)

справедливы

при

всех

и, u+h^ .U ,

если

U — выпуклое множество, а функция J (и)

доста­

точно гладкая.

 

 

Функция J (и ), определенная

 

 

О п р е д е л е н и е

2.

на выпук­

лом множестве U, называется выпуклой, если

 

 

 

 

J (аи + (1 — a) v) •< a J (и) + (1 — a) J (у) f t v

(8 )

при всех и,

v ^ U

и всех

а, O ^ assri.

Если в (8 ) равенство

воз­

можно только при а = 0 и а = 1, то /(и)

называется

строго выпук­

лой функцией.

 

 

J (и) выпуклая функция

 

 

 

Т е о р е м а

1. Если

на

выпуклом

множестве

U, то

всякая

точка

локального минимума

J (и)

одно­

временно является точкой ее абсолютного минимума на 0 . Мно­

жество U* всех точек минимума J (и) на U выпукло

(если

оно не

пусто). Если

J (и) строго выпуклая

функция на U, то она может

достигать своего

минимума

на U не более, чем в одной точке.

Д о к а з а т е л ь с т в о .

Пусть

 

н* — точка локального

мини­

мума /(«), т. е.

существует

такая

окрестность О точки и*, что

J ( u * ) ^ J ( u )

при всех н е О

и « e U .

Пусть

вопреки утверждению

существует

такая точка

 

ие1/,

 

что

/(и*) > / ( у ) .

Так

как

и — и* + a ( v — u*)eO f)£/ при всех достаточно малых а,

0 < а < 1, то

с учетом выпуклости функции J (и)

будем иметь

 

 

 

 

J (и*) <

/ (и* -Ь а (у — и*)) < a J

(у) + (1 — a) J («*) <

J

(и*).

 

Противоречие. Следовательно,

ы* — точка

абсолютного

минимума

J {и) на U.

 

 

 

 

 

 

 

 

 

 

 

Далее, если выпуклая функция достигает своего минимума в

двух различных точках и*,

v*^ U ,

то она достигает минимума

во

всех точка отрезка, соединяющего эти две точки. Это следует из соотношений

J («*) = J (у*) <

J (<ш* + (1 — а) у*) <

a J (и*) + (1 — a) J

(у’) =

J (и*),

превращающихся в равенства при всех a,

O ^ a^ C l. Однако в слу­

чае строго выпуклой функции такое равенство невозможно

при

0 < а < 1 . А

2. Если выпуклая

функция

J ( u ) ^ C l (U)

на

вы­

Т е о р е м а

пуклом множестве U, то

 

 

 

 

 

 

 

(J'(y ), и — у )< Т (« ) —

(и), и — у)

при всех и, у U.

 

 

 

 

 

 

 

 

(9)

Д о к а з а т е л ь с т в о .

Перепишем

неравенство

(8 )

в

виде

J(v-\-a(u—у) ) J ( v ) ^ . a [ J ( u ) —/(у)]. К левой

части

этого

нера­

§ П

Постановка задачи. Обозначения. Вспомогательные

сведения

 

57

венства

применим

формулу

(5):

J(v-{-a(u —v ) ) J(v) = a(J'(v-\ -

+ 0 a(u — a )), иv),

O ^ G ^ l, и получим (//(u + ’0 a (« — v)), иv) ^

^ / ( u ) — 7 (d) при

всех a,

0 < a ^ l . Отсюда

при a -*-+ 0 вытекает

левое неравенство (9). Поменяв в полученном неравенстве

роля­

ми и и v, получим правое неравенство

(9).

А

 

 

 

C 1 (U)

Т е о р е м а

3.

Для того чтобы выпуклая функция J (и) g

достигла

своего

минимума

 

на выпуклом

множестве

U в

точке

«*е£/ , необходимо и достаточно, чтобы

 

 

 

 

 

 

 

 

 

(/'(«*),

и — ы‘) > 0

при всех

 

и £ и .

 

 

 

( 1 0 )

Если и* — внутренняя

точка

множества

U,

то условие

(10)

экви­

валентно равенству / '(«*) = 0 .

 

 

 

 

 

u *^ U — точка

Д о к а з а т е л ь с т в о .

 

Необходимость. Пусть

минимума /(и) на U. Тогда при любом u^U , и а,

0 < а < 1 ,

с по­

мощью формулы (2 ) имеем

 

 

 

 

 

 

 

 

 

 

 

0 <

J

(и* +

а — «*)) — J (и*) = а (J ' (и*),

и и*) +

о (а),

 

 

или

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

< (/ '(« *). « - « * ) +

а

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Отсюда при а-Я ) сразу получим условие (10). Заметим, что

условием выпуклости J (и)

мы здесь не воспользовались, так

что

условие

минимума

(10) необходимо

для всех J(u )^ .C l (U),

если

U — выпуклое множество.

 

 

 

 

 

 

 

 

 

 

 

Если и* — внутренняя

точка

множества

U и h — произволь­

ный вектор из Ет, то

u — u* + ah^.U

при всех достаточно

малых

a, |a|^ao.

Полагая в (10)

u=u*-\-ah,

получим a (/ '(«*),

h) ^ 0

при всех a,

|a|^ao,

что

возможно

только

при

(Г (и *),

h ) —0.

В силу произвола h отсюда имеем / '(«*) = 0 .

 

 

 

 

 

 

Д о с т а т о ч н о с т ь .

Пусть /(«)

— выпуклая

функция,

пусть

для некоторой точки и* выполнено условие (10). Тогда из левого

неравенства

(9)

при

 

v = u*

получим

0 ^

(/ '(«*), ии *)^ .

(и)— /’(и*)

при всех

и е 1/,

т. е.

и * — точка

минимума.^,

Заметим, что условие минимума

(10) является обобщением

условия ( 1 ) на случай,

когда 11фЕт и точка минимума и*

может

лежать на границе множества.

 

 

 

 

 

Так как при и =ы *

(10) превращается в равенство, то условие

( 1 0 ) может

 

быть

 

переписано

 

в эквивалентном

виде

min (J'(u *)t и— и*) = 0 .

 

 

 

 

 

 

 

uBU

 

 

3.

Функция J(u ),

определенная на выпук­

О п р е д е л е н и е

лом множестве U, называется сильно выпуклой, если существует

такая постоянная к > 0 ,

что

 

 

 

 

 

J (аи + (1 — a) v) <

a J (и) -j- (1 a)J(v ) — а (1 — а) и|и — у |2 (11)

при всех u ,v £ U

и всех

а, 0 <С а •< 1 .

 

 

 

 

58

М И Н И М И З А Ц И Я

Ф У Н К Ц И И

МНОГИ Х ПЕРЕМЕННЫ Х

 

 

[ Г л . 2

Очевидно,

сильно

 

выпуклая

функция /(«)

выпукла

и даже

строго выпукла. Примером сильно выпуклой

функции

является

J(u) = (и,

и ) = и 2,

(х — 1 ).

 

 

 

 

 

 

 

 

 

 

 

Т е о р е м а

4.

Для

того

чтобы Д ы )е С '(Д )

на

выпуклом

множестве U была сильно выпуклой

функцией,

необходимо и

достаточно, чтобы существовала такая константа ц > 0 ,

что

 

(J'(v) — /'(и ),

v — ы ) > р \v— и )2

при всех

и, v £ U .

(12)

Д о к а з а т е л ь с т в о .

Н е о б х о д и м о с т ь .

Пусть

J {и)

сильно выпуклая

функция

 

из

Cl (U).

В неравенстве

(11)

при

а = —

имеем

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

х

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

при всех

и, v 6

U.

 

 

 

 

 

 

(13)

К каждой квадратной скобке применим правое

неравенство

(9).

Получим

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

х \ и —

о|2< 2 ^ / ' (и), ^ ~ ) +

2 ^ ' (v ),

V

и \

____

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

) ~

 

 

 

 

 

 

=

 

{J'{v) J' (и),

V

и)

 

 

 

 

 

 

при всех

и, v^ U . Остается

в

неравенстве

(12)

принять р,=х.

Д о с т а т о ч н о с т ь .

Пусть

/ (ц )е С ‘ (£/)

и

удовлетворяет

неравенству (12). Покажем,

что тогда J (и) — сильно выпукла,

при­

чем в неравенстве

(11)

 

тогда

можно принять х = -^ -р . С помощью

формулы (5)

будем иметь

 

 

 

 

 

 

 

 

 

 

 

 

сU (и) 4 - (1

a)J(v)~J и 4- (1 а ) v)=

 

 

 

 

a [ J

(и)J

(о)] — [J iv4- а v))J (и)] =

 

 

 

1

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

= а J (У' 4- t(uv)), и v)dtа ^ (У' ~ (а(и—

v)), иv)dt =

о

 

 

1

 

 

 

 

 

о

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

а ^ (У' (и 4- t {и

и)) J'

(v4- ta (и и)),

 

 

 

 

 

 

о

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(р + (ц — v)t) — (v +

ta{u — v))) - -

di-

>

 

 

 

 

 

 

 

 

 

 

 

 

 

 

<(1 — а)

 

 

 

 

> аЦ J

- * (l _ -” )2 -\u — v\2d t = у ц а (1

— a)|u — v |2

 

 

о

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

при всех

и, v^ U

 

и 0 < а < 1 .

А

 

 

 

 

 

 

 

 

§ /]

 

Постановка

задачи. Обозначения. Вспомогательные

сведения

 

59

 

Т е о р е м а

5.

Для того чтобы функция

7(м)<=С2(£/)

на

вы­

пуклом множестве U, имеющем внутренние точки, была

сильно

выпуклой, необходимо и достаточно, чтобы существовала

такая

константа р > 0 ,

что

 

 

 

 

 

 

 

 

 

 

 

{J"(u)l,

I) > р |£|2

при всех

u £ U

и

£ € Ет.

 

(14)

 

Д о к а з а т е л ь с т в о .

Н е о б х о д и м о с т ь .

Пусть

J (и)

сильно

выпукла

и

J ( u ) ^ C 2(U).

Пусть

сначала

« — внутренняя

точка

множества

U,

а £ — произвольная

точка

из Ет. Тогда

£'=

и + г£ е£ /

при

всех достаточно малых е, |е|^ео. Из

форму­

лы (7) с учетом неравенства

(12)

имеем

 

 

 

 

 

 

е (J' (и eg) — J ’ {и),

|) = ег {J" (и +

0eg) g, g) >

е2ц 11 12,

0 <

0 <

1.

Следовательно,

(7"(n)g, g) = lim (J" ( u + 0eg)

g, g)i^=p|g|2 при

всех

g e £ m. Если

и — граничная

е-*0

U, то существует

такая

после­

точка

довательность внутренних точек {«,г}е (У , что ип-*-и(п-*-оо).

Для

внутренних точек по доказанному выполняется (J"(un)l, g)

 

2

при

всех 1<^Ет. Пользуясь

непрерывностью

 

 

отсюда

при

/г-хоо получим неравенство (14) и для граничных точек U. Заметим, что если выпуклое множество U не имеет внутрен­

них точек в Е\,п> то оно лежит в некоторой гиперплоскости прост­ ранства Ет (см. ниже упражнение 5.5). В этом случае множество U можно поместить в пространство меньшей размерности и все рас­ суждения проводить в этом пространстве. Нетрудно придумать функцию в Епь которая в пространстве Ег (г<Ст) сильно выпукла,

а в Ет не выпукла

(например,

1(и\

и2) =

(и1)2— (и2) 2 при ц2 = 0 ) .

Д о с т а т о ч н о с т ь .

 

Пусть

/( « ) е С 2 (У )

и

удовлетворяет

условию

(14).

Отсюда

с

помощью

формулы

(7)

при h = v—и

имеем

 

 

 

 

 

 

 

 

 

 

 

 

 

(J'(v) — / '(« ),

v и) = (J" (и + 0 (v u))(v — u),

v — « )>

 

 

 

 

 

 

> р | и — v\2

 

 

 

 

при всех

и, v^ U . Тогда

согласно теореме 4 J (и) сильно выпукла,

и в неравенстве

(11)

можно принять

и =

— .

Заметим, что при

доказательстве

достаточности

существование

внутренних

точек

U не использовалось.

 

 

 

 

 

 

 

 

 

 

З а м е ч а н и е .

 

Полезно

уяснить связь между

константами

к и р, из неравенств

(11),

(12)

и

(14).

Как

видно из

доказа­

Соседние файлы в папке книги из ГПНТБ