Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теория оптимизац_Конспект лекций_2012.doc
Скачиваний:
104
Добавлен:
17.03.2015
Размер:
536.58 Кб
Скачать

1.2. Экстремум функции многих переменных

Рассмотрим задачу поиска экстремума функции многих переменных

(2.1)

где xRnn-мерный вектор.

Напомним, что совокупность всех n-мерных векторов, для которых введены операции сложения, вычитания, умножение на число, скалярного произведения называют n-мерным вещественным евклидовым пространством. R1 – это множество вещественных чисел, R2 – двухмерное множество на плоскости, R3 – множество представляет собой трехмерную поверхность.

Скалярное произведение векторов записывают в виде

(2.2)

Нормой (длиной) вектора называют число

(2.2)

Расстояние между точками x и y вычисляется по формуле

(2.3)

1. Необходимое условие безусловного экстремума. Рассмотрим задачу безусловной минимизации скалярной функции f (x) векторного аргумента x размерности n, т. е. x = Rn.

Необходимое условие безусловного экстремума следует из следующей теоремы.

Теорема 2.1. Для того чтобы в точке x0 функция f (x1, ... , хn) имела безусловный локальный экстремум, необходимо, чтобы все ее частные производные в этой точке должны быть равны нулю:

(2.4)

Доказательство. Пусть в точке x0 функция f(x) достигает минимума. Зафиксируем все аргументы функции f(x), кроме одной xj. Получим функцию одной переменной xj:

Для функции одной переменной, согласно необходимым условиям экстремума функции одной переменной теоремы 1.2, в точке экстремума производная по xj равна нулю:

Проведя аналогичные рассуждения относительно для переменных xj (j=1, 2, …,n) убеждаемся, что в точке экстремума все частные производные функции f(x) равны нулю. Теорема доказана.

Точки, в которых выполнено необходимое условие экстремума, называются стационарными.

Условие стационарности записывается в одной из следующих эквивалентных форм:

где n-мерный вектор с компонентами , i=1, ..., n, который называется градиентом функции f (x) в точке x.

Из курса математического анализа известно, что градиент функции, как вектор, определяет направление возрастания функции, а антиградиент – направлениеубывания функции.

Заметим, что необходимое условие экстремума (2.4) эквивалентно равенству нулю дифференциала функции f (x): df(x) = 0. В самом деле, если выполнено условие (2.4), то для любых dxi, i = l, ..., п, имеем

Справедливо и обратное утверждение, так как из последнего равенства в силу произвольности независимых приращений dxi, i = 1, ..., п, следует, что все частные производные в точке x0 равны нулю:

, i = l, ..., п

Условия (2.4) образуют систему п уравнений для определения п компонент вектора x. Эти уравнения могут иметь различную природу и допускать любое количество решений, в частности, не иметь ни одного. Как и выше, точки x0, являющиеся решениями системы уравнений (2.4), будем называть стационарными, а условие (2.4) — необходимым условием экстремума первого порядка.

Система уравнений (2.4) в общем случае нелинейные, и самая основная проблема методов оптимизации – поиск решения этой системы уравнений. Системы Mathematica, MATLAB, Mathcad, Maple имеют программы для аналитического и численного решения нелинейных систем уравнений. Проблема заключается в том, что не для всех систем уравнений можно найти аналитические решения в виде комбинации элементарных функций. Численные методы решения не всегда сходятся к истинному решению. Сходимость решения зависит от задания значения начального приближения. Основная проблема заключается в следующем – как надо задать такое начальное приближение, чтобы последовательность значений сходилось к решению системы. Различные методы численного решения систем уравнений отличаются друг от друга разными скоростями сходимости и используют различные порядки производных минимизируемой функции. Численные методы поиска экстремума будут рассмотрены в дальнейшем.

2. Достаточные условия экстремума функции многих переменных. После того как решение x0 системы уравнений (1.1) будет найдено, необходимо еще определить характер стационарной точки. Для этого нужно исследовать поведение функции f(x) в окрестности стационарной точки x0. Снова воспользуемся разложением функции f(х) в ряд Тейлора, предполагая ее дважды непрерывно дифференцируемой по всем переменным х1,... , хn. Тогда получим

(2.5)

Здесь через обозначены элементы матрицы вторых производных функции f(x) в стационарной точке x0, а через —норму вектора . Матрица вторых производных, которую также называютгессиан, имеет вид

(2.6)

.

Характер стационарной точки x0 функции f(x) связан со знакоопределенностью квадратичной формы

(2.7)

Квадратичная форма называется положительно определенной, если

(2.8)

для любых векторов . Здесь также приведен другой вид записи квадратичной формы с использованием скалярного произведения.

Соответственно, симметричная матрица вторых производных f"(x0) называется положительно определенной, если выполнено (2.8). Отрицательно определенным квадратичным формам и матрицам соответствуют противоположные знаки в неравенстве (2.8).

Таким образом, с учетом разложения (2.5), приходим к следующей формулировке условий второго порядка экстремальности функции f(x1,..., хп).

Теорема 2.2. Для того чтобы дважды непрерывно дифференцируемая функция п переменных f (x) имела в стационарной точке x0 безусловный локальный минимум (максимум), достаточно, чтобы матрица ее вторых производных была положительно (отрицательно) определенной.

3. Условия знакоопределенности квадратичных форм и матриц. Критерий Сильвестра. Проверка знакоопределенности матриц может быть осуществлена, например, с помощью критерия Сильвестра. Согласно этому критерию, необходимым и достаточным условием положительной определенности квадратичной формы (хT Ах), где А = {aij} — симметричная ппматрица, является выполнение п неравенств:

Необходимым и достаточным условием отрицательной определенности квадратичной формы (х, Ах) является выполнение цепочки следующих п неравенств:

Если квадратичная форма не меняет знака, но обращается в нуль при ненулевых значениях аргумента, то для определения характера cстационарной точки x0 требуется исследование производных более высокого порядка.

4. Пример. Проиллюстрируем содержание настоящего параграфа на следующей задаче: определить экстремальные значения функции

Из необходимых условий (2.4) имеем

Поэтому x1 = 0, x2 = 0 стационарная точка. Коэффициенты квадратичной формы (2.5), вычисленные в ней, равны

Тогда, согласно теореме 2.2, имеем следующие случаи:

1) , — функцияf(x) имеет в точке x0 = (0, 0)T минимум;

2) , — экстремума нет;

3) , — экстремума нет;

4) , — функцияf(х) имеет в точке x0 = {0, 0}T максимум.

Отметим, что случаи 1) и 4) соответствуют поверхности, являющейся эллиптическим параболоидом, а случаи 2) и 3) — гиперболическому параболоиду, имеющему стационарную точку типа «седло».