01-09-2014_14-57-50 / Моделир. Оптим.(з)_Подобие_ЛП_лекц
..pdf
141
Отсюда следует, что х=1,3 -точки локального минимума, а х=2 -точка локального максимума. Чтобы идентифицировать х=0,вычислим третью производную.
d |
3 |
f |
|
600x |
3 |
2160x |
2 |
1980x |
360 |
|
360 |
|
|||||||
|
|
|
|||||||||||||||||
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
||||||||||||||
dx |
3 |
|
|
|
|
|
|||||||||||||
|
x 0 |
|
|
|
|
|
|
|
|
|
|
x 0 |
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
Так как эта производная отлична от нуля и имеет нечѐтный порядок, то |
|||||||||||||||||||
точка х=0 является не точкой оптиума, а точкой перегиба. |
|
на интервале |
-2 |
||||||||||||||||
Пример 4.3. Максимизировать |
f (x) x |
3 |
3x |
2 |
9x 10 |
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
х 4. Имеем |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
df |
5x2 6x 9 0 ; |
|
|
|
|
|
||||||||
|
|
|
|
|
dx |
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Решая это уравнение, получим две стационарные точки х=3 и х=-1, которые расположены внутри заданного интервала. Для того, чтобы найти глобальный максимум, вычислим значения функции в точках х=3,-1,-2,4.
(3)=37, (-2)=12, (-1)=5, (4)=30.
Таким образом, точка х=3 соответствует максимальному значению функции на интервале [-2,4]. Для проверки выполнения достаточных условий экстремума и необходимых условий второго порядка используются два способа.
4.3. Критерий Сильвестра.
Вместо перебора всех стационарных точек и соответствующих значений функции можно воспользоваться специальными процедурами, позволяющий найти глобальный оптимум с меньшими затратами времени.
Определение модальной функции не позволяет непосредственно проверить, является ли функция унимодальной. В теории оптимизации выделяется важный класс выпуклых и вогнутых функций, которые допускают проверку такого рода.
Когда функция достаточно проста, теоремы (4.1…4.3) позволяют явным образом решить задачу (4.1). При этом для исследования матрицы f (x* ) на неотрицательную и положительную определѐнность, как правило, используется критерий Сильвестра с использованием угловых миноров (первый способ).
а) Критерий проверки достаточных условий экстремума. Пусть А -
симметрическая матрица порядка nxn. Тогда
1) Для того чтобы Гессе G(x*) была положительно определена (G(x*) > 0) и точка x* являлась точкой локального минимума, необходимо и достаточно, чтобы знаки угловых миноров были строго положительны:
M1 > 0, M2 > 0,…,Mn > 0 |
(4.8) |
141
142
2) Для того чтобы Гессе G(x*) была отрицательно определена (G(x*) < 0) и точка x* являлась точкой локального максимума, необходимо и достаточно, чтобы знаки угловых миноров чередовались, начиная с отрицательного:
M1 < 0, M2 > 0, M3 < 0,…, (-1)n Mn > 0 |
(4.9) |
б) Критерий проверки необходимых условий экстремума второго порядка.
1)Для того чтобы Гессе G(x*) была положительно полуопределена определена
(G(x*) 0) и точка x* являлась точкой локального минимума, необходимо и достаточно, чтобы все главные миноры определителя матрицы Гессе были неотрицательны.
2)Для того чтобы Гессе G(x*) была положительно полуопределена определена
(G(x*) 0) и точка x* может быть являлась точкой локального максимума, необходимо и достаточно, чтобы все главные миноры четного порядка были неотрицательны, а все главные миноры нечетного порядка – неположительны.
Второй способ (с помощью собственных значений матрицы Гессе).
Матрица G размерностью(n x n) считается положительно определенной, если все ее собственные значения 1, 2,…, n положительны, т.е. j > 0 для всех j = 1, 2,…, n.
Матрица G считается отрицательно определенной, если собственные значения отрицательны, т.е. j < 0 для всех j = 1, 2,…, n.
Если среди собственных значений G встречаются и положительные и отрицательные, то матрица является знакопеременной, а исследуемая функция – невыпуклой.
Для определения собственных значений необходимо решить характеристическое уравнение:
det G I o ,
где I – квадратная единичная матрица; det – знак определителя.
Матрица G I отличается от матрицы Гессе тем, что по диагонали распола-
гаются члены вида
|
2 |
f |
|
|
|
x |
||
|
|
2 |
|
|
j |
.
Так для двухмерной функции f(x1, x2) характеристическое уравнение будет иметь вид:
142
143
|
2 |
|
f |
|
|
|
2 |
f |
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
x |
2 |
|
x x |
|
|
|
|||||||
|
|
|
||||||||||||
det |
|
|
|
|
|
0 |
||||||||
|
|
1 |
|
|
|
|
1 |
|
2 |
|||||
|
|
|
|
f |
|
|
|
|
||||||
|
|
2 |
2 |
f |
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
x |
|
x |
|
2 |
|
|
|
|
|||||
|
|
|
|
|
||||||||||
|
2 |
2 |
|
|
|
|
|
|||||||
|
|
|
|
1 |
|
|
|
|
|
|
||||
(4.10)
Собствееные значения 1 и 2 есть корни обыкновенного квадратного уравнения
2 + b + c = 0, образуются после раскрытия определителя.
Для примера возьмеме функции двух переменных: f(x)= 2 - 2x1 -2x2
+x12+x22-x1 x2
Координаты экстремальной точки x* определяются решением системы уравнений
|
|
|
|
f |
0 и |
f |
0 |
равны x1*=2, x2*=2 |
|
|
|
|
x |
x |
|||
|
|
|
|
|
2 |
|
||
|
|
|
|
1 |
|
|
|
|
Гессиан |
G |
2 |
1 |
. После решения характеристического уравнения |
||||
|
|
|||||||
|
|
|
1 |
2 |
|
|
|
|
2 |
|
1 |
0 |
, т.е. квадратного уравнения (2- )2-1 = 0 получены соб- |
||||
det |
|
|
||||||
1 |
2 |
|
|
|
|
|
|
|
ственные значения 1=3, 2=1, т.е. матрица G является положительно оперделенной. Следовательно, функция f(x) является выпуклой и в экстремальной точке х* = (2,2) принимает минимальное значение f(x*) = -2.
4.4 Теорема Вейерштрасса.
Сформулированная выше задача оптимизации (4.1) имеет решение при любых целых функциях и допустимых множествах. Существуют задачи, в которых невозможно найти оптимальную точку и оптимальное значение. Например, не существует точек минимума у функции одной переменной на множе-
стве Х в случаях изображѐнных на рис.4.5. |
|
|
y |
y |
y |
f |
0 |
|
|
|
f |
0 |
|
|
|
|
|
|
|
||
0 |
|
0 |
|
|
0 |
|
|
|
a |
b х |
a |
х |
|
a |
b |
х |
|
|
|
|
|
|
|
|
|
Х=[a,b) |
|
Х=[a,+ ) |
|
|
|
Х=[a,b]
Рис.4.7. Графики функций, не имеющие минимума.
143
144
В первом случае точка минимума не существует, поскольку множество Х не замкнутое. Во втором случае - вследствие не ограниченности Х. В третьем случае минимум не достигается из-за того, что функция не является непрерывной.
Итак, при изучении задач оптимизации в первую очередь возникает вопрос о существовании решения. В этом случае имеет место, следующее утвержде-
ние, которое называют теоремой Вейерштрасса.
Теорема 4.5. Пусть Х – компакт в Е |
n |
(замкнутое ограниченное множе- |
|
|
ство), - непрерывная функция на Х. Тогда точка глобального минимума функции на Х (глобальное решение задачи (4.1)) существует.
В дальнейшем окажется полезной и несколько иная форма данной теоре-
мы. |
Е |
|
, - непрерывная функ- |
Теорема 4.6 Пусть Х - замкнутое множество в |
n |
||
|
|
|
ция на Х, причѐм существует такая точка х’ Х, что множество вида N(x’)={x Х (x) (x’)} ограничено. Тогда точка глобального минимума функции на Х существует (рис. 4.6)
Следствие:
Если функция (х) непрерывна на
Е |
n |
|
и
lim f (x |
k |
) |
|
|
|
k |
|
|
, то (x) достигает
своего абсолютного минимума (наименьшего значения) на любом замкнутом
подмножестве |
Е |
n |
. |
|
|
|
Рис.4.6 График функции имеющий глобальный минимум.
4.5Обобщенная задача оптимизации.
Втеории оптимизации иногда более удобно рассматривать общую задачу оптимизации, в которой понятие решение определяется таким образом, что оно всегда существует. Для того чтобы сформулировать эту обобщѐнную задачу,
144
145
понадобится определение точной нижней грани. |
|
|
|
|
||||||||||
Число (или символ - ) |
f |
0 |
называют точной нижней гранью или инфи- |
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||
мумом функции на множестве X, если неравенство f |
0 |
(x) имеет место |
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
для всех х Х и, кроме того, для любого числа ’> f |
0 |
найдѐтся точка х’ Х та- |
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
кая, что верно неравенство (x’)< ’. Тот факт, что |
f 0 - точная нижняя грань |
|||||||||||||
функции на множестве Х, записывают в виде |
|
|
|
|
||||||||||
|
|
|
|
f 0 inf f (x) |
|
|
|
(4.8) |
||||||
|
|
|
|
|
|
|
|
x X |
|
|
|
|
|
|
Аналогично вводится понятие точной верхней грани. Число (или символ |
||||||||||||||
+ ) f |
00 |
называют точной верхней гранью или супремумом функции на мно- |
||||||||||||
жестве Х, если неравенство f |
00 |
(x) справедливо для всех х Х и для любого |
||||||||||||
числа ’ < f |
00 |
найдѐтся точка х’ Х такая, что верно неравенство (x’) > ’. Для |
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
точной верхней грани используется обозначение |
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
f |
00 |
sup f (x) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
x X |
|
|
|
|
Как указано выше, не всегда можно указать точку, в которой точная грань |
||||||||||||||
достигается, т.е. точку |
x0 |
, для которой f (x0 ) inf f (x) .Поэтому в обобщѐнной |
|
задаче минимизации f (x) inf |
под решением понимают не отдельную точку, |
||
|
|
x X |
|
как это имеет место в обычной задаче оптимизации, а последовательность то-
|
к =1,2,…,такую, что |
|
|
|
|
чек xk k 1 , xk X , |
|
|
(4.9) |
||
|
lim |
f (xk ) f |
0 |
|
|
|
|
|
|
|
|
|
k |
|
|
|
|
Эта последовательность всегда существует и называется, минимизирую- |
|||||
щей последовательностью. |
|
|
|
|
|
Таким образом, обобщѐнная задача минимизации целевой функции на |
|||||
множестве Х заключается в отыскании числа (или символа - ) f |
0 |
и последова- |
|||
|
|
|
|
|
|
тельности точек |
|
к =1,2,…,таких что выполняются равенства |
|||
xk k 1 , xk X , |
|||||
(4.8) ... (4.9). |
|
|
|
|
|
4.6. Задача условной минимизации.
Задача (4.1) называется задачей условной оптимизации (условной задачей), если Х-собственное подмножество пространства En , ( En ) .
Рассмотрим конечномерную задачу условной минимизации с ограничениями типа равенств и неравенств:
f(x) inf,
gi(x)=0, j=1,2...,k,
gi(x) 0, i=1,2,...,m, x En
Предположим, что задача является гладкой, т.е. функции f(x), gi(x), j=1,2...,k, gi(x), i=1,2,...,m –непрерывно-дифференцируемы по х.
145
146
Допустимое множество этой задачи имеет вид
X=
x
E |
n |
|
gi(x)=0, j=1,2...,k, gi(x)
0, i=1,2,...,m
Для такой задачи сохраняют силу утверждения теорем 4.1…4.3,если еѐ локальное решение х* является внутренней точкой допустимого множества Х(х* intX). Для многих условных задач минимум достигается на границе, в силу чего для них классические результаты анализа неприемлемы. Вообще при переходе от безусловных задач к условным все вопросы оптимизации становятся более сложными.
В дальнейшем мы часто будем прибегать к геометрической интерпретации
задач оптимизации, где x E |
2 |
,основанной на понятии линий (или поверхно- |
||
|
|
|
|
|
стей) уровня функции (x), т.е. множества вида |
||||
L |
( f ) {x E |
2 |
f (x) }, E |
|
|
||||
|
|
|
|
|
Для геометрической интерпретации данной двумерной задачи необходимо изобразить еѐ допустимое множество Х и несколько характерных линий уровня целевой фунции (рис.4.7.).
Рис.4.7 Геометрическая интерпритация задача оптимизации.
Чтобы отразить характер изменения функции, у данной линии уровня L
полезно ставить знак ―+ ― с той стороны, где принимает значения большие , и знак ― - ― с другой. Если функция дифференцируема в точке х, то градиент’(x) ортогонален к проходящей через х линии уровня и направлен (если естественно ’(x) 0) в сторону возрастания функции, т.е. в сторону знака ―+‖. В геометрическом плане поиск глобального решения сводится к нахождению минимального числа * среди всех таких, что линия уровня L имеет непу-
стое пересечение с Х. При этом любая точка х* L * X является глобальным решением задачи, а сама * f (x*) - минимальным значением функции на Х. Возможны два случая: х* лежит внутри (рис.4.9,а) и на границе (рис. 4.9,б)
множества Х.
Глава 5.Численные методы решения задач одномерной оптимизации.
146
147
Задача оптимизации, в которой целевая функция задана функцией одной переменной, относится к наиболее простому типу оптимизационных задач. Это связано не только с тем, что именно такие задачи обычно решаются в инженерной практике, но и с тем, что одномерные методы оптимизации часто используются для анализа подзадач, которые возникают при реализации итеративных процедур, ориентированных на решение многомерных задач оптимизации.
Для решения задачи минимизации функции ( x ) на отрезке [a; b] на практике, как правило, применяют приближенные методы. Они позволяют найти решение этой задачи с необходимой точностью в результате определения конечного числа значений функции ( x ) и ее производных в некоторых точках отрезка [a; b]. Методы, использующие только значения функции и не требующие вычисления ее производных, называются прямыми методами минимизации.
5.1. Прямые методы.
Большим достоинством прямых методов является то, что от целевой функции не требуется дифференцируемости и, более того, она может быть не задана в аналитическом виде. Единственное, на чем основаны алгоритмы прямых методов оптимизации, это возможность определения значения ( x ) в заданных точках.
Рассмотрим наиболее распространенные на практике прямые методы поиска точки минимума. Самым слабым требованием на функцию ( x ), позволяющим использовать эти методы, является ее унимодальность. Поэтому далее будем считать функцию ( x ) унимодальной на отрезке [a; b].
5.1.1. Метод перебора Метод перебора (пассивная стратегия поиска) является простейшим из
прямых методов оптимизации.
Пусть (x) Q[a; b],
где Q[a; b] - множество унимодальных функций на отрезке [a; b]. Требуется найти какую-либо из точек минимума x * функции f( x ) на от-
резке [a; b] с абсолютной погрешностью >0. Разобьем [a; b] на n равных частей точками деления
x a i |
b a |
, |
i=0,1,2,...,n, |
i |
n |
|
где n b a .
Вычислив значения ( x ) в этих точках, путем сравнения найдем точку xm , для которой
f (xm ) min f (xi ) .
0 i n
147
148
|
Далее полагаем x |
* |
xm , |
f |
* |
f (xm ) |
. При этом максимальная погрешность |
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
n |
определения точки |
|
|
x |
* |
равна |
n |
b a |
. |
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
и точку минимума x* функ- |
|
Пример 5.1. Найти минимальное значение f |
* |
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ции |
|
8x |
|
6x |
|
|
|
72x на отрезке [1,5; 2,0]. Точку x * найти с погрешно- |
||||||||||
|
f (x) x |
4 |
3 |
2 |
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
стью =0,05.
(x) Q[1,5; 2,0], так как |
f |
|
||||
(x) |
||||||
Выбрав n |
2 1.5 |
10 |
, вычислим |
|||
0,05 |
||||||
|
|
|
|
|
||
12x |
2 |
48x |
|
значения
12 0 f (xi ) ,
при х [1,5;2] .
xi 1.5 0.05i , i=0,1,...,10,
поместив их в таблице 1.
Табл. 5.1
Значения функции f(х)
x i |
|
|
1.50 |
1.55 |
1.60 |
1.65 |
1.70 |
|
1.75 |
1.80 |
1.85 |
1.90 |
1.95 |
2.00 |
i |
|
|
- |
-90.2 |
-91.2 |
-91.8 |
- |
|
- |
-91.9 |
-91.4 |
-90.5 |
- |
- |
f (x |
) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
89.4 |
|
|
|
92.08 |
|
92.12 |
|
|
|
89.4 |
88.0 |
|
|
Из таблицы 5.1 находим х* 1.75, |
* -92.12. |
|
|
|
|
|||||||
Упражнения.
Методом перебора найти точку минимума b] с точностью и минимум *.
1. |
f (x) x |
4 |
4x |
2 |
32x 1 |
, |
[1,5;2], =0,05. |
|
|
|
|
|
|
x
* функции f(
x
) на отрезке [a;
2.
3.
Ответ: x*=1,6702; *= -33,5064.
f (x) |
1 |
x |
7 |
x |
3 |
|
1 |
x |
2 |
x , |
[1;1,5], =0,05. |
|||
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|||||
|
7 |
|
|
|
|
|
|
|
2 |
|
|
|
|
|
Ответ: x*=1,2963; *= -1,7557. |
||||||||||||||
f (x) 5x |
|
8x |
5 |
20x , |
[3;3,5], =0,02. |
|||||||||
2 |
4 |
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Ответ: x*=3,3532; *= -47,1447.
4. |
f (x) |
1 |
x |
3 |
5x x ln x , |
[1,5;2], =0,02. |
|
||||||
|
|
|
|
|
|
|
|
|
3 |
|
|
|
|
|
Ответ: x*=1,8411; *= -6,0016. |
|||||
5. |
f (x) x2 2x e x , |
[1;1,5], =0,05. |
||||
Ответ: x*=1,156; *=0,6609.
5.1.2.Методы исключения интервалов
Вметоде перебора, рассмотренном выше, точки xi , в которых определяют-
ся значения ( x ), выбираются заранее. Если же для выбора очередной точки вычисления ( x ) использовать информацию, содержащуюся в уже найденных
148
149
значениях f(х), то поиск точки минимума можно сделать более эффективным, то есть сократить число определяемых для этого значений ( x ).
Фактически все одномерные методы поиска основаны на предположении, что исследуемая функция обладает свойством унимодальности, по крайней мере, в допустимой области. Это позволяет определить, в каком из задуманных двумя точками подинтервалов точка оптимума отсутствует.
Методы поиска, которые позволяют определить оптимум функции одной переменной путем последовательного исключения подинтервалов и, следовательно, путем уменьшения интервала поиска, носят название методов исключения интервалов.
Теорема. Пусть функция f унимодальна на замкнутом интервале а x b, а ее минимум достигается в точке x *. Рассмотрим точки x1 и x2 , расположенные в интервале таким образом, что а< x1 < x2 <b. Сравнивая значения функции в точ-
ках |
x1 |
и x2 можно сделать следующие выводы. |
|
|
1. |
Если ( x1 ) > ( x2 ), то точка минимума |
не лежит в интервале ( x ), то |
есть |
x * ( x1 , b) (рис. 5.1, а). |
|
|
f (x) |
f (x) |
|
a
x |
1 |
|
x |
* |
x |
|
|
2 |
||
|
|
|
b
x
a x1
x |
* |
|
x |
2 |
|
b
x
есть
вала
( x1 , x
a) |
б) |
|
Рис. 5.1. Графические иллюстрации к теореме. |
|
|
2. Если ( x1 ) < ( x2 ), |
то точка минимума не лежит в интервале ( x2 |
,b), то |
x * (a, x2 ) (рис.5.1, б). |
|
|
Примечание. Если ( x1 ) = ( x2 ), то можно исключить оба крайних интер-
(a, x1 ) и ( x2 |
,b); при этом точка минимума должна располагаться в интервале |
2 ). |
|
Согласно теореме, которую иногда называют правилом исключения интервалов, можно реализовать процедуру поиска, позволяющую найти точку оптимума путем последовательного исключения частей исходного ограниченного интервала. Поиск завершается, когда оставшийся подинтервал уменьшается до достаточно малых размеров. Несомненным достоинством поисковых методов
149
150
такого рода является то, что они основаны лишь на вычислении значении функции. При этом не требуется, чтобы исследуемые функции были дифференцируемы; более того, допустимы случаи, когда функцию нельзя далее записать
ваналитическом виде.
Впроцессе применения рассматриваемых методов поиска можно выделить два этапа:
1. этап установления границ интервала, на котором реализуется процедура поиска границ достаточно широкого интервала, содержащего точку оптимума;
2. этап уменьшения интервала, на котором реализуется конечная последовательность преобразования исходного интервала с тем, чтобы уменьшить его длину до заранее установленной величины.
5.1.2.1. Этап установления границ интервала
На этом этапе сначала выбирается исходная точка, а затем на основе правила исключения строится относительно широкий интервал, содержащий точку оптимума. Обычно поиск граничных точек такого интервала проводится с помощью эвристических методов поиска. В этом случаи (k+1)-я пробная точка определяется по рекуррентной формуле (метод Swann W. H.).
xk 1 |
xk |
2 |
k |
, k=0,1,2,..., |
|
|
|
|
где x0 – произвольно выбранная начальная точка; - подбираемая некоторым способом величина шага.
Знак определяется путем сравнения значений ( x0 ), ( x0 + ) и ( x0 -
). Если
( x0 - ) ( x0 ) ( x0 + ),
то, согласно предположению об унимодальности, точка минимума должна располагаться правее точки x0 и величина выбирается положительной. Если
изменить знаки неравенств на противоположные, то следует выбирать отрицательной.
Если же
( x0 - ) ( x0 ) ( x0 + ),
то точка минимума лежит между x0 - и x0 + и поиск граничных то-
чек завершен. Случай, когда
( x0 - ) ( x0 ) ( x0 + ),
противоречит предложению об унимодальности. Пример 5.2. Рассмотрим задачу минимизации функции f (x) 100 x 2
при заданной начальной точке x0 =30 и величине шага =5. Знак определяется на основе сравнения значений
150
