Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Иоффе, А. Д. Теория экстремальных задач [учеб. пособие]

.pdf
Скачиваний:
75
Добавлен:
22.10.2023
Размер:
15.51 Mб
Скачать

10

СПИСОК

ОСНОВНЫХ ОБОЗНАЧЕНИИ

 

 

Пп А —- линейная оболочка множества А,

 

 

aff А — аффинная оболочка множества А,

А,

 

ri А — относительная внутренность множества

 

conv А — выпуклая

оболочка множества А,

 

 

conv А — замыкание

выпуклой оболочки множества А,

д{ (х) — субдифференциал функции f в точке х,

 

dxf (х, у) — субдифференциал функции х -> / (х, у),

 

f* (х*) — функция, сопряженная с функцией {,

или преобразо­

вание

Юнга — Фенхеля функции f,

 

 

А0 — поляра множества А,

 

 

А + В — алгебраическая сумма множеств А и В,

 

f l © f 2 ~ конволюция функций f: и f2,

 

 

/1

V /2 — верхняя грань функций fi и f2,

 

 

/Л — прообраз функции f при отображении Л,

 

 

Л / — образ функции f при отображении Л,

 

 

 

ft dy, — конволгоционный интеграл функций

х->

f (t, х) по

мере

(г,

 

 

 

J ft dy, — интеграл функций x - > f{t,x ) по мере р,

 

f (х) -> inf (sup); д :е С — обозначение экстремальной

задачи,

х. — решение экстремальной задачи,

&— функционал в задачах вариационного исчисления и опти­

мального управления, Ж — квадратичный функционал в задачах вариационного ис­

числения,

L = L {t, х, х) — лагранжиан, 3? — функция Лагранжа,

&— функция Вейерштрасса,

Н— функция Понтрягина,

Ж — гамильтониан.

0. В в е д е н и е

ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ

Первые задачи геометрического содержания, связан­ ные с отысканием наименьших и наибольших величин, были поставлены в древности. Упоминание об изопериметрическом свойстве круга относится к V веку до н. э.; вопросы о максимумах и минимумах встречаются в тру­ дах Евклида, Аполлония, Архимеда. Потребность ре­ шать экстремальные проблемы способствовала созда­ нию математического анализа и вариационного исчисле­ ния. В XVII и XVIII веках были открыты вариационные принципы в оптике и механике и вариационное исчис­ ление стало языком естествознания.

В наши дни в связи с запросами техники и эконо­ мики теория экстремальных задач переживает второе рождение. Бурно развиваются новые разделы: матема­ тическое программирование, теория оптимального управ­ ления, численные методы оптимизации.

Экстремальные проблемы очень разнообразны, и всетаки, несмотря на то, что старинные геометрические за­ дачи на экстремум кажутся совсем не похожими на проблемы оптимального управления летательными ап­ паратами, в исследовании их можно усмотреть много общего.

Расскажем вкратце об общих свойствах, присущих экстремальным задачам, и об основных принципах ис­ следования проблем экстремального характера. Начнем с постановок задач.

Проблема отыскания наибольшей или наименьшей величины возникает обычно не в аналитической, а в описательной форме. Для того чтобы применять мате­ матические средства, необходимо формализовать за­ дачу. Обычно можно выделить три компоненты, состав­ ляющие математически точно поставленную проблему. Это — функция fo(x) вместе с областью X ее определе­ ния и некоторое подмножество С множества X, которое задает ограничение в поставленной задаче. Множество

12

0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ

X называется классом допустимых элементов, подмно­ жество С множеством допустимых элементов или про­ сто ограничением. (Под словом «функция» понимается далее отображение в расширенную вещественную пря­ мую, когда значения -фоо и — сю допускаются наряду с обычными вещественными числами.) Словесно экстре­ мальная задача формулируется так: найти нижнюю

[верхнюю) грань функции }о(х) по всем х, принадлежа-

щим ограничению С. Для обозначения такой экстре­ мальной задачи используется стандартная запись:

/ 0 (х) —.>inf (sup); х е С ,

(1)

При строгой постановке задачи должен быть точно

описан класс допустимых элементов X.

в задаче (1)

Нижняя (верхняя) грань функции fa[x)

называется значением этой задачи, а та точка х», где достигается эта нижняя (верхняя) грань, называется

решением

задачи или

ее абсолютным

экстремумом

минимумом или максимумом.

 

то точка

Если пространство X наделено топологией,

х* такая,

что

f0[ x ) ^

f0[x*) (соответственно

f0(x

sg:fo(x*))

для

всех х

из пересечения

С с некоторой

окрестностью точки х*, называется локальным миниму­ мом (максимумом) в задаче (1).

Заметим, что всегда можно ограничиться лишь рас­ смотрением задач на отыскание нижней грани; для этого достаточно (если нужно) заменить fQ на —f0. Значение задачи об отыскании нижней грани мы называем иногда

минимумом, а ее решение — минималью.

Обычно одна и та же задача допускает разные фор­ мализации.

Рассмотрим, например, задачу о брахистохроне. Начнем с опи­ сательной постановки. В «Беседах» Галилея обсуждается такой во­ прос. Пусть два одинаковых шарика начинают одновременно дви­

гаться: один — по дуге

окружности,

другой — по

ее хорде.

Какой

из шариков быстрее достигнет нижнего конца

хорды?

Оказы­

вается, — тот, который

движется по

окружности.

Напрашивается

более общая постановка задачи: какую форму следует придать же­ лобу, скатываясь по которому без трения под воздействием силы тяжести, шарик попадал бы из одной заданной точки в другую за кратчайшее время. Так описательно ставится задача о брахисто­ хроне. Перевести ее на математический язык можно по-разному. Обычно принята такая формализация. Введем в плоскости систему координат (х, у) так, чтобы ось х была горизонтальна, а ось у

 

0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ

 

13

направлена

вертикально

вниз.

Пусть

у(х) есть форма

желоба.

В соответствии с

законом

Галилея

скорость

шарика

в

точке

(х,у(х))

не

зависит

от

формы

желоба,

а зависит лишь

от

самой

ординаты

у(х). Эта

скорость

равна V 2gy‘ (х) .

Следовательно, вре­

мя dt, требуемое для преодоления участка кривой длины ds, равно dsIVigy {х).

Так мы приходим к следующей постановке:

Л,

1Л + у'2 W

 

ХаI

dx -> inf;

У 2gy (X)

(2)

У(*о) = 0. у (*i)

■■Уl-

Полученная задача относится к числу простейших задач клас­ сического вариационного исчисления. Легко понять, что минимиза­ ция функционала в (2) равносильна минимизации интеграла

f

V ^ + J L d t

О)

У ч У

 

по всем кривым (x{t), у(0), соединяющим точки (х0, 0)

и (Xi,yt).

Такие задачи относятся к

классу задач вариационного

исчисления

в параметрической форме.

 

 

Но к той же задаче можно подойти и как к проблеме о быстро­ действии. Выше говорилось уже, что в точке (х, у) скорость дви­

жения шарика равна У 2gy. Представим себе теперь плоскую изо­ тропную оптическую среду, в которой локальная скорость распро­

странения света в точке (х, у) равна У 2gy. Принцип Ферма в геометрической оптике гласит, что при своем двиокении в неодно­ родной среде свет выбирает такую траекторию, чтобы минимизиро­ вать время прохождения участка пути между заданными точками.

В применении к среде, где скорость равна У 2gy , получается сле­ дующая постановка задачи о распространении света:

Т -> inf;

 

1

 

x2 + y2 =

2gy,

|

(4)

х (0) = х 0,

у (0) = 0 , х (Г) = xi, у (Т) = I/,.

]

 

Ясно, что решение этой задачи плоской геометрической оптики дает ответ и в задаче о брахистохроне. (Отметим, что оптико-механиче­ ская аналогия послужила И. Бернулли путеводной нитью при ре­ шении задачи о брахистохроне.) Наконец, еще один путь формали­ зации. При движении шарика по желобу у(х) на него действуют две силы, а именно, сила тяжести и реакция опоры, перпендику­ лярная скорости. В силу закона Ньютона ускорение шарика пропор­ ционально действующей суммарной силе. В итоге приходим к сле­ дующей постановке задачи:

Т-> inf;

x= u,ij — g + v, xu + y v = 0,

*(0) = *о. У (0 )= 0 , х(7') = хь

(5)

у(Т) = у1.

14

0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ

Такие постановки характерны для оптимального управления. Отме­ тим еще разные модификации в пределах некоторых из указанных постановок. Например, можно, следуя Эйлеру, в (2) поменять ме­ стами х и у и рассмотреть такую простейшую задачу классического вариационного исчисления:

 

 

 

dy -> inf;

 

 

х (0) = х0,

x((/!)=Xi.

 

Можно вместо

уравнения

х2 + уг = 2gy в (4)

рассмотреть вклю­

чение:

 

 

 

 

 

(х,

(/)e=B (0,

V2gy),

 

где В(0,г) есть

круг с центром в

нуле радиуса

г. Допустимо еще

вместо последнего включения рассмотреть систему уравнений с управлениями:

£ =

и Y2gy .

у — v У 2gy ,

и2 + V2 1.

Получилось

довольно

большое число

формализаций, и каждая

из них обладает и своими преимуществами и своими недостатками. Но нам хочется подчеркнуть, что сама проблема формализации ре­ шается неоднозначно, и выбор наиболее естественной формы записи задачи является искусством, которое постигается при решении боль­ шого числа задач. Следует отметить, однако, что с математической точки зрения ни одна из задач (2) — (5) еще не поставлена полностью,

ибо нигде не очерчен точно

класс допустимых элементов. Этот

класс также

может выбираться по-разному. Скажем, задачи типа

(2) рассматривают обычно в

классе непрерывно

дифференцируемых

функций. Но

в этом классе

решения задачи

(2) не существует.

Действительно, решением задачи о брахистохроне является, как из­ вестно, циклоида, которая имеет в начальной точке бесконечную производную. Если же рассмотреть класс функций, являющихся не­ прерывными и непрерывно дифференцируемыми на отрезке |д'о, Xi] всюду, кроме, может быть, точки хо, то к этому классу циклоида будет принадлежать. Обычно рассматривают менее специальные классы: класс кусочно дифференцируемых функций, класс абсолют­ но непрерывных функций и др.

Ограничения в экстремальных проблемах стараются записать в виде равенств и неравенств. Такие ограниче­ ния называются функциональными. Помимо функцио­ нальных ограничений, встречаются ограничения типа включений: х е /1 , нефункционального характера. В ре­ зультате экстремальная задача (1) приобретает такую

0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ

15

форму:

 

/о (*)->inf;

 

 

 

 

 

 

F (х) -

у0,

 

 

 

ft(х) < 0 ,

i s I,

 

 

 

х е

А.

 

Здесь У

и

/ — некоторые

множества, F\

X —*Y,

ft'. X -> R ,

i e

/ и Л с 1 , Отметим, что различие между

функциональными и нефункциональными ограничения­

ми, вообще

говоря, условно

(ибо каждое

включение

х ^ А

можно

записать

функционально),

но

часто оно

оказывается полезным.

 

 

 

 

Перейдем теперь к обсуждению общих принципов

теории

экстремальных

задач.

Предметом

этой теории

является точно поставленная экстремальная проблема. В связи с каждой такой проблемой естественно возни­ кают три вопроса. Во-первых, существует ли решение задачи? Если можно предполагать, что решение суще­ ствует, то надо выяснить, каким условиям оно должно удовлетворять. Наконец, в-третьих, как фактически най­ ти решение задачи или минимизирующую последова­ тельность для нее? Поставленные вопросы соответствуют разделам теории экстремальных задач, где изучаются существование решений, необходимые и достаточные условия экстремума и вычислительные методы нахож­ дения решений. Эти разделы связаны между собою, но вместе с тем каждый из них обладает достаточно боль­

шой самостоятельностью.

о н е о б х о д и м ы х

у с л о ­

Расскажем сначала

в и я х э к с т р е м у м а .

Первый общий принцип

полу­

чения необходимых условий в экстремальных задачах без ограничений был найден Ферма. Идея Ферма, выра­ женная современным языком, состоит в том, что реше­ ния гладкой задачи fo(*)—*■inf следует искать среди стационарных точек функционала fo(x), т. е. среди ре­

шений уравнения

(6)

Г0(х) = 0.

Этот результат называют иногда теоремой Ферма. Для задач с ограничениями общий принцип получения необ­ ходимых условий экстремума был выдвинут Лагранжем.

16 0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ

Замысел Лагранжа можно распространить далеко за пределы тех задач, которые он сам рассматривал. Мы раскроем его на примере той общей постановки, с которой постоянно будем иметь дело в этой книге. Пусть

X и

У— линейные

пространства,

F: X —> У, fp. X R,

i — l,

... , т, A cz X. Рассмотрим задачу:

 

 

fo W —> inf;

F(x) = 0,

 

 

 

 

fi (x) ^ 0 ,

i =

1, . . . , m,

x e A.

 

Следующую функцию:

 

 

 

 

m

 

 

S£ (x, у', Я.0.........l m) =

 

 

 

 

 

(y*,

F (x)) +

2 hfi (x),

 

 

 

 

 

 

 

 

i= о

 

где у* — линейный

функционал

на

У,

а А*— числа,

на­

зовем

функцией Лагранжа задачи

(I')- Функционал у*

и числа Я*, 0 ^ i ^ т,

называются множителями

Ла­

гранжа. (Отметим,

что

функция Лагранжа составлена

с учетом только функциональных ограничений.) Прин­ цип Лагранжа состоит в следующем:

Пусть точка х* есть точка локального минимума в

задаче (Г ).

Тогда найдутся такие множители Лагранжа

у* u K i^ O

(С К Л '^ т ), не равные одновременно нулю,

что х* удовлетворяет необходимому условию локального минимума в задаче

3? (х, •) —> inf; л е ф

и при этом

 

hifi(xt) — 0, г'= 1 , . . . . пг.

(7)

Иными словами, необходимые условия минимума в исходной задаче совпадают с необходимыми условиями минимума функции Лагранжа (при выборе некоторых множителей Лагранжа) по множеству я е Л , состоя­ щему из ограничений, не включенных в функцию Ла­ гранжа. Соотношения (7) называются условиями до­ полняющей нежесткости. Они означают, что отличные от нуля множители Лагранжа надо приписывать только тем ограничениям типа неравенства, которые суще­ ственны в данной точке, т. е. тем, где /,(л:*) = 0.

Проиллюстрируем принцип Лангранжа на конечно­ мерных задачах. Пусть в (1') X = А — Rn, т. е. X — д-мер-

0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ

17

ное евклидово пространство, и неравенства отсутствуют. Равенства задаются конечным числом соотношений вида

f 1(*) = 0.

•••,

fm (X) = 0.

 

Таким образом, F — (fu

. .. ,

fm)

есть

отображение из

R71 в Rm. Все функции fo(x),

... ,

fm(x)

предполагаются

гладкими. В соответствии с принципом Лагранжа над­ лежит составить функцию Лагранжа

пг]

2 = Я Ш х )

/=о

и написать необходимое условие в задаче без ограни­ чений 2.? —►inf. Но такое необходимое условие дается теоремой Ферма (см. (6 )): З ’х — О. В итоге получается система уравнений:

т

^ = 2 У ' W = o.

Полученный результат широко известен под названием

правила множителей Лагранжа.

В гл. 1 мы выделим три класса задач, для которых верен принцип Лагранжа. Это — гладкие задачи, задачи выпуклого программирования, а также задачи со сме­ шанной гладко-выпуклой структурой. Классическое ва­ риационное исчисление относится к числу гладких за­ дач, задачи оптимального управления могут быть реду­ цированы к гладко-выпуклым задачам. Эти вопросы освещаются в первых двух главах книги и в пятой главе.

Принцип Лагранжа верен для многих важных за­ дач, но всякий раз его необходимо обосновывать. Ка­ ковы же методы доказательства принципа Лагранжа и других необходимых условий? В основе большинства подобных доказательств лежит метод вариаций. Объ­

ясним

существо

этого метода. Рассмотрим общую за­

д а ч у '(1), где X — топологическое пространство. Вариа­

цией

точки х*

называется непрерывное отображение

Я->х(Я) отрезка

[0, е] в X такое, что х(0) = х*. Вариа­

ция называется допустимой, если для достаточно малых

Я все точки кривой

х(Я) принадлежат

С. Пусть теперь

вариация х (Я)

такова, что функция

ф(Я) = /о(*(Я))

]

'0«rpjf >.

 

СССР

18 0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ

является дифференцируемой в нуле. Тогда, если а, есть точка локального минимума в задаче (1), то функция Ф должна иметь минимум в точке нуль и, значит, дол­ жно выполняться неравенство ф '(0 )^ 0 , являющееся необходимым условием минимума функции одного пере­ менного, заданной на отрезке [0, е]. Метод вариаций со­ стоит в том, что ищется достаточно широкий класс до­ пустимых вариаций и затем извлекаются следствия из соотношений ф/ (0 )^ 0 , написанных для каждой вариа­ ции из заданного класса.

На первом этапе развития теории применялись про­ стейшие вариации — вариации по направлениям. Так были получены необходимые условия в задачах конеч­ номерного анализа и в классическом вариационном ис­ числении. Вывод необходимых условий экстремума в классическом вариационном исчислении непосредствен­ ным применением метода вариаций проводится у нас в § 2.2. Помимо вариаций по направлениям, в вариа­ ционном исчислении применялись вариации иной при­ роды. Для вывода необходимых условий сильного мини­ мума Вейерштрасс применял вариации, получившие название «игольчатых». При помощи таких вариаций можно вывести простейшие варианты принципа макси­ мума (см. § 2.4).

Как правило, множество допустимых вариаций ста­ раются выбрать так, чтобы оно оказалось локально устроено, как выпуклое. Выпуклые задачи обладают многими замечательными особенностями. В них всякий локальный минимум является абсолютным, кроме того, с каждой выпуклой задачей можно сопоставить другую, называемую двойственной к ней; при этом решения лю­ бой из них являются множителями Лагранжа для дру­ гой. Часто двойственная задача проще устроена, чемисходная.

Вернемся снова к принципу Лагранжа. Если для по­ ставленной задачи (или для задачи, полученной из нее применением метода вариаций) этот принцип оказы­ вается применимым, то он приводит к некоторым урав­ нениям (алгебраическим, дифференциальным и т. п.). Решения этих уравнений называются экстремалями. Обычно найти экстремали удается лишь при помощи очень трудоемких вычислений. И все-таки случается, что

0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ

19

уравнения, полученные из необходимых условий экстре­ мума, удается разрешить в общем виде.

Зададимся вопросом, какие свойства задачи могут облегчить решение этих уравнений. Отметим несколько таких обстоятельств. Во-первых, это — линейная струк­ тура задачи. Задачи с линейной структурой наиболее полно изучены. Сюда относятся задачи линейного про­ граммирования (ему посвящен § 6.1), квадратичные за­ дачи в гильбертовом пространстве (см. §§ 6.2 и 6.3) —

здесь линейными оказываются те уравнения, которые выражают необходимые условия, — и линейные задачи оптимального управления (см. § 9.3). В качестве вто­ рого обстоятельства отметим выпуклую структуру за­ дачи. Об одном замечательном свойстве выпуклых за­ дач— о возможности двойственного описания их — уже говорилось. Особенно плодотворны методы, связанные с выпуклостью, когда эта выпуклость сочетается с ко­ нечномерностью. Этим последним обстоятельством объ­ ясняется обилие решенных задач об аппроксимации в пространствах с метрикой С. В заключение отметим также, что если задача обладает какой-то инвариантной структурой, то это, как правило, влечет за собой много важной информации относительно решений задачи — теорема Нётер в вариационном исчислении и т. п. На этом мы закончим обсуждение вопросов, связанных с необходимыми условиями экстремума, и перейдем к до­ статочным условиям.

("Раздел книги, посвященный д о с т а т о ч н ы м

у с л о ­

в и я м (гл. 7), занимает в ней скромное место.

Дело в

том, что если часть теории экстремальных задач, посвя­ щенная необходимым условиям экстремума, имеет ныне устойчивые очертания — там выработан свой язык, своя методология и получены общие и содержательные теоре­ мы, то этого нельзя еще сказать про принципы получе­ ния достаточных условий. Здесь нам хочется обсудить возможные перспективы теории и примерный план ее построения. Суть дела видится нам в следующем. Полу­ чение достаточных условий связано с глобальным под­ ходом, когда индивидуальная задача включается в со­ вокупность подобных ей задач, зависящих от некоторых параметров. (Эту процедуру называют методом возму­ щения.) Минимум в полученных задачах становится

Соседние файлы в папке книги из ГПНТБ