8 Ответ
Выпуклые множества и функции
Выше мы дали определение выпуклого множества: напомним, что множество -- выпуклое, если вместе с любыми двумя точками множеству принадлежат все точки отрезка, соединяющего в пространстве точку с точкой . Заметим, что отрезок, состоящий из точек , можно параметризовать следующим образом: Тогда при будет получаться точка , при -- точка , а при -- промежуточные точки отрезка, так что обозначения точек отрезка как будут согласованы с обозначениями его концов.
На следующем рисунке изображены два множества на плоскости : одно выпуклое, а другое нет.
Рис.7.17.
Выпуклыми в пространстве являются, например, такие множества: всё пространство , его положительный октант и неотрицательный октант , любой шар, как открытый , так и замкнутый , любая гиперплоскость (заданная некоторым уравнением вида , а также открытое и замкнутое полупространства, заданные, соответственно, условиями и .
Упражнение 7.8 Докажите утверждения о выпуклости всех перечисленных множеств.
Заметим также, что, согласно определению, выпуклы также все одноточечные множества и пустое множество .
Теорема 7.15 Если все множества некоторого семейства выпуклы, то выпукло и их пересечение
Доказательство. Пусть точки и принадлежат ; тогда обе они принадлежат каждому из множеств . Значит, если -- произвольная точка отрезка, соединяющего и , то она принадлежит , поскольку выпукло. Но так как для всех , то , что и требовалось доказать.
Из этой теоремы следует, например, что прямая в -мерном пространстве (её можно задать как векторным уравнением: , где -- фиксированные векторы, а -- параметр, так и в виде пересечения гиперплоскостей ) является выпуклым множеством. Действительно, каждая гиперплоскость -- выпуклое множество.
Проколотая окрестность любой точки , то есть множество ( ), не является выпуклым. Чтобы показать это, достаточно выбрать любой ненулевой вектор длины меньше и рассмотреть точки проколотой окрестности и , расположенные симметрично относительно точки . Тогда середина отрезка, соединяющего с , то есть точка , совпадает с и, следовательно, не лежит в проколотой окрестности точки .
Если , то есть речь идёт о подмножествах прямой , то выпуклые множества можно описать полностью: это а) пустое множество; б) все одноточечные множества; в) все интервалы вида (где может равняться , а может равняться ); г) все полуинтервалы вида (где может равняться ) и (где может равняться ); наконец, д) все отрезки вида . Никаких других выпуклых множеств на прямой нет.
Упражнение 7.9 Докажите утверждение о виде всех выпуклых множеств на прямой.
Напомним изученное в первом семестре определение выпуклой функции одного вещественного переменного.
Определение 7.12 Функция , заданная на отрезке , называется выпуклой (или выпуклой книзу) на этом отрезке, если для всех и выполняется неравенство
|
(7.10) |
и вогнутой (или выпуклой кверху), если выполняется неравенство
|
(7.11) |
(То есть функция вогнута в том и только том случае, если функция выпукла.)
В левой части этого неравенства стоит значение функции в производной точке
отрезка между и (будем для простоты считать, что ), а в правой части неравенства -- значение линейной функции , такой что и (см. рис.).
Рис.7.18.
Если и , то неравенство, означающее выпуклость функции , превращается в такое:
при всех .
Дадим теперь определение выпуклой функции многих переменных.
Определение 7.13 Пусть -- выпуклое множество, на котором задана функция . Функция называется выпуклой (или выпуклой книзу) на множестве , если для любых двух точек функция , служащая ограничением функции на отрезок, соединяющий точки и , является выпуклой (книзу) функцией одного переменного (здесь, как и выше, ).
Рис.7.19.
Функция называется вогнутой (или выпуклой кверху) в , если функция вогнута.
Таким образом, функция вогнута в том и только том случае, когда функция выпукла.
Выпуклость функции в означает, что для любого отрезка с концами и параметризация этого отрезка в виде задаёт композицию , являющуюся выпуклой функцией параметра . Ввиду выпуклости области , любые точки и отрезка лежат в , и их снова можно взять в качестве концов отрезка. Поэтому для выпуклости функции в области необходимо и достаточно, чтобы неравенство
выполнялось при всех и .
Если при этом при всех и выполняется строгое неравенство
то функцию будем называть строго выпуклой в .
Наконец, функция называется строго вогнутой, если функция строго выпукла; это означает выполнение строгого неравенства
при всех и .
Геометрически (в случае ) строгая выпуклость означает, что для любой хорды графика точки дуги графика с теми же концами, что у хорды, лежащие в вертикальном сечении, проходящем через эту хорду, располагаются ниже точек хорды. Строгая вогутость означает, что в любом вертикальном сечении график проходит выше любого отрезка, соединяющего две точки графика.
Рис.7.20.
Заметим, что понятия выпуклой и вогнутой функций (а также строго выпуклой и строго вогнутой функций) в области определены только для выпуклых областей .
Дадим теперь такое алгебраическое определение.
Определение 7.14 Пусть дана квадратная матрица размера . Она называется неотрицательно определённой, если для любого вектора-столбца (точкой обозначено скалярное произведение в ). Матрица называется положительно определённой, если для всех .
Заметим, что выражение можно записать в виде , где -- это матрица-строка, равная транспонированному столбцу . Вообще, верхний левый индекс мы будем применять для обозначения транспонированной матрицы.
Определение 7.15 Квадратная матрица называется симметричной, если при всех имеет место равенство , то есть если .
У симметричной матрицы равны друг другу элементы, расположенные симметрично друг другу относительно главной диагонали матрицы.
Теорема 7.16 Пусть -- симметричная неотрицательно определённая матрица размера . Тогда квадратичная функция (она же называется квадратичной формой, заданной матрицей )
является выпуклой функцией (во всем пространстве, то есть при ).
Если же симметричная матрица -- положительно определённая, то заданная ею квадратичная форма является строго выпуклой.
Доказательство. Пусть и -- две произвольные точки и , где , -- точка отрезка, соединяющего с .
Предположим, что матрица неотрицательно определена. Элементарные преобразования позволяют записать в виде
|
|
|
|
Поскольку матрица неотрицательно определена, имеет место неравенство
откуда сразу следует, что
а это неравенство означает выпуклость функции .
Доказательство строгой выпуклости в случае положительно определённой матрицы проводится с помощью очевидных изменений приведённого доказательства.
Другой пример выпуклой функции даёт линейная функция:
Пример 7.21 Линейная функция
где -- постоянные, является выпуклой функцией во всём пространстве (но не является строго выпуклой функцией). Действительно, как легко проверить, при всех и имеем
Поскольку функция , очевидно, также линейна, линейная функция является одновременно и вогнутой (но не строго вогнутой).
Если о некоторых функциях известно, что они выпуклы в области , то из них можно сконструировать другие выпуклые функции, используя следующие свойства выпуклых функций.
Теорема 7.17 Пусть -- выпуклая область и функции и выпуклы в . Тогда сумма этих функций также выпукла в .
Доказательство. Пусть и , где . Тогда
|
|
|
|
что и означает выпуклость функции .
Поскольку, как мы доказали выше, квадратичная функция с неотрицательно определённой матрицей и линейная функция выпуклы, то и их сумма, согласно доказанному свойству, -- выпуклая функция. В качестве упражнения докажите, однако, ещё одно утверждение, не вытекающее из теоремы 7.17:
Упражнение 7.10 Докажите, что если -- квадратичная форма, заданная симметричной положительно определённой матрицей , а -- линейная функция, то функция строго выпукла.
Указание: по сути дела, нужно повторить доказательство теоремы 7.16, с очевидными изменениями.
Теорема 7.18 Если функция выпукла в области , то функция , заданная в равенством
тоже выпукла в .
Доказательство. Пусть снова и , где . Тогда
|
(7.11*) |
|
(7.12) |
что и означает выпуклость функции . Первое неравенство в (7.11*) следует из того, что функция выпукла, а второе -- из того, что при всех имеет место неравенство:
а при всех -- равенство
(Проверьте, что последние два утверждения действительно верны.)
Теорема 7.19 Если функция выпукла в области , то функция также выпукла в .
Доказательство. Пусть снова и , где . Тогда, ввиду того что , получаем:
|
|
|
|
|
|
Последнее неравенство следует из того, что при .
Следующие три утверждения остаются читателю для самостоятельного доказательства в качестве упражнения.
Теорема 7.20 Если функции и выпуклы в области и , то функция также выпукла в .
Если функции и выпуклы в области , то функция также выпукла в .
Если функция выпукла в области , а функция одного переменного выпукла на интервале , содержащем множество значений функции при всех , и возрастает всюду на интервале или убывает всюду на , то композиция выпукла в . (Например, если функция выпукла в , то функция также будет выпуклой в .)
Выпуклые функции интересны такой своей особенностью: они не могут иметь нескольких локальных минимумов с разными значениями.
Сначала дадим такое определение.
Определение 7.16 Пусть -- некоторая область в .
Точка называется точкой локального минимума функции , если существует такая окрестность , , что при всех . Если при этом при всех , не совпадающих с , то точка называется точкой строгого локального минимума. И в том и в другом случае значение называется локальным минимумом функции .
Точка называется точкой локального максимума функции , если существует такая окрестность , , что при всех . Если при этом при всех , не совпадающих с , то точка называется точкой строгого локального максимума. И в том и в другом случае значение называется локальным максимумомфункции .
Теорема 7.21 Любая точка локального минимума функции , выпуклой в области , даёт наименьшее значение функции во всей области ; любая точка локального максимума функции , выпуклой в области , даёт наибольшее значение функции во всей области .
Доказательство. Очевидно, что достаточно доказать лишь первое утверждение: второе следует из него сменой знака функции.
Пусть -- точка локального минимума, а в некоторой другой точке функция имеет меньшее значение: . Тогда в точках отрезка, соединяющего с , то есть точках , при всех значения функции будут меньше, чем в точке :
Но точки с имеются в любой, сколь угодно малой, окрестности точки , что противоречит предположению о том, что -- точка локального минимума. Значит, неравенство невозможно, и для любой точки . Это означает, что значение функции в точке локального минимума -- наименьшее во всей области .
Практическая ценность этого утверждения в том, что при поиске наименьшего значения выпуклой функции в области достаточно найти любую точку локального минимума; во всех остальных точках локального минимуцма (если они существуют) значение функции будет точно такое же. Для невыпуклых функций это, конечно, не так, как видно на следующем рисунке:
Рис.7.21.
Имеет место также следующая
Теорема 7.22 Eсли функция строго выпукла в области , то её точка минимума в -- единственная.
Доказательство. Пусть в двух разных точках и функция принимает одно и то же значение Поскольку функция строго выпукла, то в точках , не совпадающих с и с , должно выполняться неравенство
Но это означает, что в точках , например, в середине отрезка , значение меньше , что противоречит предположению о том, что значение -- наименьшее во всей области. Значит, второй точки с тем же минимальным значением нет.