
8 Ответ
Выпуклые множества и функции
Выше мы дали
определение выпуклого множества:
напомним, что множество
--
выпуклое, если вместе с любыми двумя
точками
множеству
принадлежат
все точки
отрезка,
соединяющего в пространстве
точку
с
точкой
.
Заметим, что отрезок, состоящий из
точек
,
можно параметризовать следующим
образом:
Тогда
при
будет
получаться точка
,
при
--
точка
,
а при
--
промежуточные точки отрезка, так что
обозначения точек отрезка как
будут
согласованы с обозначениями его концов.
На следующем рисунке
изображены два множества на плоскости
:
одно выпуклое, а другое нет.
Рис.7.17.
Выпуклыми
в пространстве
являются,
например, такие множества: всё
пространство
,
его положительный октант
и
неотрицательный октант
,
любой шар, как открытый
,
так и замкнутый
,
любая гиперплоскость
(заданная
некоторым уравнением вида
,
а также открытое и замкнутое
полупространства, заданные, соответственно,
условиями
и
.
Упражнение 7.8 Докажите утверждения о выпуклости всех перечисленных множеств.
Заметим также, что,
согласно определению, выпуклы также
все одноточечные множества
и
пустое множество
.
Теорема 7.15 Если
все множества
некоторого
семейства
выпуклы,
то выпукло и их пересечение
Доказательство.
Пусть точки
и
принадлежат
;
тогда обе они принадлежат каждому из
множеств
.
Значит, если
--
произвольная точка отрезка,
соединяющего
и
,
то она принадлежит
,
поскольку
выпукло.
Но так как
для
всех
,
то
,
что и требовалось доказать.
Из этой теоремы
следует, например, что прямая в
-мерном
пространстве (её можно задать как
векторным уравнением:
,
где
--
фиксированные векторы, а
--
параметр, так и в виде пересечения
гиперплоскостей
)
является выпуклым множеством.
Действительно, каждая гиперплоскость
--
выпуклое множество.
Проколотая
окрестность любой точки
,
то есть множество
(
),
не является выпуклым. Чтобы показать
это, достаточно выбрать любой ненулевой
вектор
длины
меньше
и
рассмотреть точки проколотой
окрестности
и
,
расположенные симметрично относительно
точки
.
Тогда середина отрезка, соединяющего
с
,
то есть точка
,
совпадает с
и,
следовательно, не лежит в проколотой
окрестности точки
.
Если
,
то есть речь идёт о подмножествах
прямой
,
то выпуклые множества можно описать
полностью: это а) пустое множество; б)
все одноточечные множества; в) все
интервалы вида
(где
может
равняться
,
а
может
равняться
);
г) все полуинтервалы вида
(где
может
равняться
)
и
(где
может
равняться
);
наконец, д) все отрезки вида
.
Никаких других выпуклых множеств на
прямой нет.
Упражнение 7.9 Докажите утверждение о виде всех выпуклых множеств на прямой.
Напомним изученное в первом семестре определение выпуклой функции одного вещественного переменного.
Определение 7.12
Функция
,
заданная на отрезке
,
называется выпуклой (или выпуклой
книзу) на этом отрезке, если для
всех
и
выполняется
неравенство
|
(7.10) |
и вогнутой (или выпуклой кверху), если выполняется неравенство
|
(7.11) |
(То есть
функция
вогнута
в том и только том случае, если
функция
выпукла.)
В левой части этого
неравенства стоит значение функции
в
производной точке
отрезка
между
и
(будем
для простоты считать, что
),
а в правой части неравенства --
значение линейной функции
,
такой что
и
(см.
рис.).
Рис.7.18.
Если
и
,
то неравенство, означающее выпуклость
функции
,
превращается в такое:
при всех .
Дадим теперь определение выпуклой функции многих переменных.
Определение 7.13
Пусть
--
выпуклое множество, на котором задана
функция
.
Функция
называется выпуклой (или выпуклой
книзу) на множестве
,
если для любых двух точек
функция
,
служащая ограничением функции
на
отрезок, соединяющий точки
и
,
является выпуклой (книзу) функцией
одного переменного
(здесь,
как и выше,
).
Рис.7.19.
Функция называется вогнутой (или выпуклой кверху) в , если функция вогнута.
Таким образом,
функция
вогнута
в том и только том случае, когда
функция
выпукла.
Выпуклость
функции
в
означает,
что для любого отрезка
с
концами
и
параметризация
этого отрезка в виде
задаёт
композицию
,
являющуюся выпуклой функцией параметра
.
Ввиду выпуклости области
,
любые точки
и
отрезка
лежат
в
,
и их снова можно взять в качестве концов
отрезка. Поэтому для выпуклости
функции
в
области
необходимо
и достаточно, чтобы неравенство
выполнялось при всех и .
Если при этом при всех и выполняется строгое неравенство
то функцию будем называть строго выпуклой в .
Наконец, функция называется строго вогнутой, если функция строго выпукла; это означает выполнение строгого неравенства
при всех и .
Геометрически (в
случае
)
строгая выпуклость означает, что для
любой хорды графика
точки
дуги графика с теми же концами, что у
хорды, лежащие в вертикальном сечении,
проходящем через эту хорду, располагаются
ниже точек хорды. Строгая вогутость
означает, что в любом вертикальном
сечении график проходит выше любого
отрезка, соединяющего две точки графика.
Рис.7.20.
Заметим, что понятия выпуклой и вогнутой функций (а также строго выпуклой и строго вогнутой функций) в области определены только для выпуклых областей .
Дадим теперь такое алгебраическое определение.
Определение 7.14
Пусть дана квадратная матрица
размера
.
Она называется неотрицательно
определённой, если
для
любого вектора-столбца
(точкой
обозначено скалярное произведение
в
).
Матрица
называется положительно
определённой, если
для
всех
.
Заметим, что
выражение
можно
записать в виде
,
где
--
это матрица-строка, равная транспонированному
столбцу
.
Вообще, верхний левый индекс
мы
будем применять для обозначения
транспонированной матрицы.
Определение 7.15
Квадратная матрица
называется симметричной,
если при всех
имеет
место равенство
,
то есть если
.
У симметричной матрицы равны друг другу элементы, расположенные симметрично друг другу относительно главной диагонали матрицы.
Теорема 7.16 Пусть -- симметричная неотрицательно определённая матрица размера . Тогда квадратичная функция (она же называется квадратичной формой, заданной матрицей )
является выпуклой
функцией (во всем пространстве, то есть
при
).
Если же симметричная
матрица
--
положительно определённая, то заданная
ею квадратичная форма
является
строго выпуклой.
Доказательство.
Пусть
и
--
две произвольные точки
и
,
где
, --
точка отрезка, соединяющего
с
.
Предположим, что
матрица
неотрицательно
определена. Элементарные преобразования
позволяют записать
в
виде
|
|
|
|
Поскольку матрица неотрицательно определена, имеет место неравенство
откуда сразу следует, что
а это неравенство
означает выпуклость функции
.
Доказательство строгой выпуклости в случае положительно определённой матрицы проводится с помощью очевидных изменений приведённого доказательства.
Другой пример выпуклой функции даёт линейная функция:
Пример 7.21 Линейная функция
где
--
постоянные, является выпуклой функцией
во всём пространстве
(но
не является строго выпуклой функцией).
Действительно, как легко проверить, при
всех
и
имеем
Поскольку функция
,
очевидно, также линейна, линейная
функция
является
одновременно и вогнутой (но не строго
вогнутой).
Если о некоторых функциях известно, что они выпуклы в области , то из них можно сконструировать другие выпуклые функции, используя следующие свойства выпуклых функций.
Теорема 7.17 Пусть
--
выпуклая область и функции
и
выпуклы
в
.
Тогда сумма этих функций
также
выпукла в
.
Доказательство. Пусть и , где . Тогда
|
|
|
|
что и означает
выпуклость функции
.
Поскольку, как мы доказали выше, квадратичная функция с неотрицательно определённой матрицей и линейная функция выпуклы, то и их сумма, согласно доказанному свойству, -- выпуклая функция. В качестве упражнения докажите, однако, ещё одно утверждение, не вытекающее из теоремы 7.17:
Упражнение 7.10
Докажите, что если
--
квадратичная форма, заданная симметричной
положительно определённой матрицей
,
а
--
линейная функция, то функция
строго
выпукла.
Указание: по сути дела, нужно повторить доказательство теоремы 7.16, с очевидными изменениями.
Теорема 7.18 Если
функция
выпукла
в области
,
то функция
,
заданная в
равенством
тоже выпукла в .
Доказательство. Пусть снова и , где . Тогда
|
(7.11*) |
|
(7.12) |
что и означает
выпуклость функции
.
Первое неравенство в (7.11*)
следует из того, что функция
выпукла,
а второе -- из того, что при всех
имеет
место неравенство:
а при всех
--
равенство
(Проверьте, что последние два утверждения действительно верны.)
Теорема 7.19 Если
функция
выпукла
в области
,
то функция
также
выпукла в
.
Доказательство.
Пусть снова
и
,
где
.
Тогда, ввиду того что
,
получаем:
|
|
|
|
|
|
Последнее неравенство
следует из того, что
при
.
Следующие три утверждения остаются читателю для самостоятельного доказательства в качестве упражнения.
Теорема 7.20 Если
функции
и
выпуклы
в области
и
,
то функция
также
выпукла в
.
Если функции
и
выпуклы
в области
,
то функция
также
выпукла в
.
Если функция
выпукла
в области
,
а функция одного переменного
выпукла
на интервале
,
содержащем множество значений
функции
при
всех
,
и
возрастает
всюду на интервале
или
убывает всюду на
,
то композиция
выпукла
в
.
(Например, если функция
выпукла
в
,
то функция
также
будет выпуклой в
.)
Выпуклые функции интересны такой своей особенностью: они не могут иметь нескольких локальных минимумов с разными значениями.
Сначала дадим такое определение.
Определение 7.16 Пусть -- некоторая область в .
Точка
называется точкой
локального минимума функции
,
если существует такая окрестность
,
,
что
при
всех
.
Если при этом
при
всех
,
не совпадающих с
,
то точка
называется точкой
строгого локального минимума. И в том
и в другом случае значение
называется локальным
минимумом функции
.
Точка
называется точкой
локального максимума функции
,
если существует такая окрестность
,
,
что
при
всех
.
Если при этом
при
всех
,
не совпадающих с
,
то точка
называется точкой
строгого локального максимума. И в том
и в другом случае значение
называется локальным
максимумомфункции
.
Теорема 7.21 Любая точка локального минимума функции , выпуклой в области , даёт наименьшее значение функции во всей области ; любая точка локального максимума функции , выпуклой в области , даёт наибольшее значение функции во всей области .
Доказательство. Очевидно, что достаточно доказать лишь первое утверждение: второе следует из него сменой знака функции.
Пусть
--
точка локального минимума, а в некоторой
другой точке
функция
имеет меньшее значение:
.
Тогда в точках отрезка, соединяющего
с
,
то есть точках
,
при всех
значения
функции будут меньше, чем в точке
:
Но точки
с
имеются
в любой, сколь угодно малой, окрестности
точки
,
что противоречит предположению о том,
что
--
точка локального минимума. Значит,
неравенство
невозможно,
и
для
любой точки
.
Это означает, что значение функции в
точке локального минимума
--
наименьшее во всей области
.
Практическая ценность этого утверждения в том, что при поиске наименьшего значения выпуклой функции в области достаточно найти любую точку локального минимума; во всех остальных точках локального минимуцма (если они существуют) значение функции будет точно такое же. Для невыпуклых функций это, конечно, не так, как видно на следующем рисунке:
Рис.7.21.
Имеет место также следующая
Теорема 7.22 Eсли функция строго выпукла в области , то её точка минимума в -- единственная.
Доказательство.
Пусть в двух разных точках
и
функция
принимает
одно и то же значение
Поскольку
функция строго выпукла, то в точках
,
не совпадающих с
и
с
,
должно выполняться неравенство
Но это означает,
что в точках
,
например, в середине отрезка
,
значение меньше
,
что противоречит предположению о том,
что значение
--
наименьшее во всей области. Значит,
второй точки
с
тем же минимальным значением
нет.