Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методы оптимизации. Функции нескольких переменных.doc
Скачиваний:
295
Добавлен:
23.03.2016
Размер:
4.91 Mб
Скачать

3.1. Критерии оптимальности

Здесь рассматриваются условия, которые позволяют характеризовать (т. е. классифицировать) точки пространства управляемых переменных. Критерии оптимальности необходимы для распознавания решений и, кроме того, составляют основу большинства используемых методов поиска решений. Рассмотрим разложение Тейлора для функции нескольких переменных:

f(x)=f()+f()∆x+½∆xf()∆x+O(∆x),(3.4)

где — точка разложения из пространства RN; х = х - — величина изменения х; f(x) — N-мерный вектор-столбец первых производных f(х), вычисленных в точке ; f() = H() — симметрическая матрица порядка N×N вторых частных производных f(x), вычисленных в точке . (Эту матрицу часто называют матрицей Гессе. Ее элемент, расположенный на пересечении i-й строки и j-го столбца, равен f / dxx.) O(∆x) — сумма всех членов разложения, имеющих порядок по x выше второго. Пренебрегая членами высших порядков (т. е. исключая O(x)), определим величину изменения целевой функции f(х), соответствующего произвольному изменению х:

f(x)= f(x) - f() = f()x+½xf()∆x (3.5)

Напомним, что по определению во всех точках из окрестности точки минимума целевая функция принимает значения, которые превышают минимальное, т. е. имеет место неравенство

f = f(x) - f() ≥0. (3.6)

Точка является точкой глобального минимума, если неравенство (3.6) выполняется для всех х RN; такие точки будем обозначать через х**. Когда формула (3.6) справедлива лишь в некоторой δ-окрестности точки , т. е. для всех х, таких, что ||х – || < δ при заданном δ > 0, то есть точка локального минимума, или х*. Если же

f = f(x) f() ≤0. (3.7)

то есть точка максимума (локального или глобального в соответствии с данными выше определениями). Исключение знака равенства из формул (3.6) и (3.7) позволяет определить точку строгого минимума или максимума. В случае когда f принимает как поло­жительные и отрицательные, так и нулевые значения в зависимости от выбора точек из δ-окрестности, точка представляет собой седловую точку.

Вернемся к равенству (3.5) и вспомним о выдвинутом ранее предположении о том, что f(х), f(x) и f(x) существуют и непрерывны для всех х RN. Как следует из формулы (3.5), для того чтобы знак f не менялся при произвольном варьировании ∆х, градиент f() должен быть равен нулю, т. е. должна быть стационарной точкой. В противном случае разность f может принимать положительные или отрицательные значения в зависимости от знаков f() и ∆х Таким образом, точка должна удовлетворять условию стационарности

f() = 0, (3.8)

и формула (3.5) принимает следующий вид:

f(x) = +½xf()∆x. (3.9)

Очевидно, что знак f(x) определяется квадратичной формой

Q(х) = xf()∆x (3.10)

или Q(z)=zTAz.

Из линейной алгебры известно (см. приложение А), что

А — положительно определенная матрица, если Q(z)>0 для любых z;

А — положительно полуопределенная матрица, если Q (z)≥0 для любых z;

А — отрицательно определенная матрица, если Q(z)<0 для любых z;

(3.11)

А — отрицательно полуопределенная матрица, если Q(z)≤0 для любых z;

А — неопределенная матрица, если Q (z)>0 для некоторых z и Q(z)<0 для остальных z.

Из (3.11) следует, что стационарная точка есть

точка минимума, если 2f() — положительно полуопределенная матрица;

точка максимума, если 2f() — отрицательно полуопределенная матрица;

(3.12)

cедловая точка, если 2f(x) 0 — неопределенная матрица.

Кроме того, может оказаться полезным провести анализ стационарной точки в несколько ином аспекте. Рассмотрим стационарную точку вместе с окружающей ее δ-окрестностью и векторами, исходящими из точки (рис. 3.2). При этом

= +s(). (3.13)

Путем соответствующего выбора и s можно построить все точки из окрестности точки . Подстановка (3.13) в (3.9) дает формулу

f(x) = (/2)sf()s. (3.14)

Теперь с помощью (3.11) и (3.12) можно классифицировать s(x) как направление спуска, направление подъема или направление общего вида. Если направление спуска найти не удается, то

Рис.3.2. Окрестность стационарной точки.

является точкой локального минимума х*, что соответствует случаю,

когда 2f() — положительно полуопределенная матрица.

Ниже формулируются необходимые и достаточные условия существования минимума функции нескольких переменных.

Теорема 3.1. Необходимые условия

Для наличия в точке х* локального минимума необходимо, что­бы выполнялось равенство

f(x*)=0 (3.15а)

и матрица 2f(x*) была положительно полуопределенной. (3.15б)

Теорема 3.2. Достаточные условия

Если f(x*)=0 (3.16а)

и матрица 2f(x*) положительно определена, (3.16б)

то х* есть точка изолированного (строгого) локального минимума f(x).

Доказательства этих теорем непосредственно следуют из прове­денного выше обсуждения и предоставляются читателю в качестве упражнений. Обычно приходится довольствоваться нахождением локального минимума; вместе с тем если можно показать, что xT 2f(x) x≥0 для всех х, то f(х) называется выпуклой функцией, а локальный минимум оказывается глобальным.

Пример 3.1. Критерии оптимальности

Рассмотрим функцию

f(x) = 2 + 4 10+

линии уровня которой изображены на рис. 3.3. Требуется классифицировать точку = [0,0]

f(x) = 2 + 4 10+

Рис. 3.3. Линии уровня нелинейной функции двух переменных из примера 3.1

Решение

Следовательно, точка — стационарная.

Следовательно,

Матрица 2f() является неопределенной, так как квадратичная форма zTHz принимает положительное значение при z = (0, 1) и отрицательное значение при z = (l, 1) (см. приложение А). Поэтому представляет собой седловую точку, что и отражено на рис. 3.3.