Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ЭВМ_Семестр4_МетодПособие

.pdf
Скачиваний:
25
Добавлен:
05.06.2015
Размер:
2.47 Mб
Скачать

При решении вопроса о выборе численного метода рекомендуется оценить поведение линий уровня целевой функции в окрестностях предполагаемой точки экстремума. Число т. е. отношение максимального и минимального собственных значений гессиана функции в предполагаемой точке экстремума (характеризующее разброс собственных значений оператора ( )), называется числом обуслов-

ленности гессиана функции f в точке . Если , то функция называется плохо обусловленной или овражной. Овражность, то есть вытянутость линий уровня вдоль одного направления, приводит к тому, что градиентные методы поиска экстремума функции сходятся медленно.

В зависимости от наивысшего порядка частных производных функции ( ), используемых для формирования и , численные методы принято делить на три группы:

Методы нулевого порядка, использующие информацию только о значениях функции ( ) (методы деформируемого многогранника, конфигураций). Эти методы могут применяться в тех случаях, когда функция задана неявно или не задана аналитически, но известен ряд значений функции или эти значения вычисляются непосредственно в ходе реализации алгоритма. Они также могут быть полезны в случаях, когда производные функции могут быть заданы аналитически, но их выражения очень громоздки.

Методы первого порядка, использующие информацию о значениях самой функции ( ) и ее первых производных (методы наискорейшего градиентного спуска, дробления шага, Гаусса–Зейделя, Флет- чера–Ривса).

Методы второго порядка, использующие, кроме того, и информацию о вторых производных функции ( ) (метод Ньютона и его модификации).

101

Метод конфигураций (Хука – Дживса)

Следует выделить два этапа метода конфигураций:

1)исследование с циклическим изменением переменных и

2)ускорение поиска по образцам.

Поиск начинается в точке , который называется старым базисом. Направления поиска - координатные направления. По каждому

направлению поочередно с шагом

(

) проверяется выполне-

ние условия

( )

и в качестве нового базиса берется точка

с координатами, полученными в результате удачных шагов из начальной точки по каждому из направлений.

Направление от старого базиса к новому задает направление ускорения поиска: в качестве следующей точки минимизирующей последовательности проверяется точка ( ) Здесь - ускоряющий множитель, задаваемый пользователем. Если полученная точка является удачной, то она берется в качестве следующей точки для исследования. В противном случае исследование ведется из точки .

Метод деформируемого многогранника (Нелдера – Мида).

При решении задачи поиска минимума функции ( ) методом Нел- дера-Мида строится последовательность множеств из точек, которые являются вершинами выпуклого многогранника. На каждом

последующем (

)-м шаге из системы

точек ( )

,

полученной на м шаге, выводится точка

( ), в которой функция

( ) имеет наибольшее значение (худшая точка). Вместо

( ) в си-

стему вводится новая точка, выбираемая на отрезке прямой, прохо-

102

дящей через худшую точку и центр тяжести оставшихся вершин многогранника:

<∑

=

- центр тяжести;

- новая точка (―растянутое‖ ( ) отражение наихудшей

вершины).

Метод дробления шага.

В данном методе строится релаксационная последовательность точек,

т.е. таких точек

 

что (

)

(

)

Точ-

ки последовательности

вычисляются по следующему правилу:

 

(

)

 

 

 

(10.4)

Начальная точка

и начальный шаг

задаются пользователем. Ве-

личина шага

не изменяется до тех пор, пока функция убывает в

точках последовательности. Это контроли-руется путем проверки выполнения условия ( ) ( ) ( ). Если условие убывания не выполняется, то величина шага уменьшается, как правило, вдвое, т.е .

Метод наискорейшего градиентного спуска Как и в предыдущем методе, точки релаксационной последователь-

ности

вычисляются по правилу (1.6). Точка

задается

пользователем; величина шага

определяется из условия мини-

мума одномерной функции ( )

.

(

)/. Задача

 

103

 

 

 

минимизации функции ( ) может быть решена с использованием

необходимого условия минимума

 

 

 

с последующей проверкой

 

 

достаточного усло-вия минимума

 

 

 

или с использованием чис-

 

 

 

ленных методов.

 

 

 

 

Метод сопряженных направлений (Флетчера - Ривса).

В данном методе используются свойства векторов, сопряженных от-

носительно некоторой матрицы. Векторы

и называются сопря-

женными относительно

матрицы , если

выполняется равенство

.

 

 

Точки релаксационной

последовательности

вычисля-

ются по правилу:

 

 

(

)

 

(

)

(10.5)

(

)‖

( )‖

Точка

задается пользователем; величина шага

определяется из

условия минимума функции

( )

 

 

 

(

). Задача минимиза-

ции одномерной функции

(

) может быть решена с использовани-

ем необходимого условия минимума

 

d

=0 с последующей проверкой

 

 

 

 

 

 

 

 

dt

 

 

достаточного условия минимума

d 2

 

>0 или с использованием чис-

dt 2

 

 

 

 

 

 

 

 

 

 

ленных методов. Коэффициент

 

 

вычисляется из условия сопря-

женности направлений

и

.

 

 

 

 

 

 

 

104

Метод Ньютона

 

 

 

Строится последовательность

точек * +

k=0,1,…,

таких, что

f (xk ) f (xk 1 ) , k=0,1,… Точки последовательности * +

вычисляются

по правилу

Точка

задается пользовате-

лем с учетом знакопостоянства и невырожденности матрицы Гессе в задаваемой начальной точке и близости выбранной точки к предполагаемой точке минимума. Направление спуска определяется для каж-

дого значения

по формуле

( )

( ), где – матрица Гессе.

Порядок решения задачи минимизации

Записать необходимые условия экстремума.

Аналитически или используя прикладные пакеты найти стационарные точки.

Проверить выполнение достаточных условий экстремума в найденных стационарных точках.

Найти глобальный минимум функции.

Оценить обусловленность задачи в точке минимума и овражность графика в окрестности точки минимума.

Сделать предварительный вывод о работоспособности избранного численного метода.

Построить график функции, задавая пределы изменения координат с учетом аналитически найденных точек минимума - максимума.

Выбрать несколько начальных точек для реализации численного метода.

Задать критерий завершения итерационного процесса.

Найти минимум. Сравнить результаты с аналитически найденным значением глобального минимума.

105

Исследовать сходимость алгоритма, фиксируя точность определения минимума, количество итераций метода и количество вычислений минимизируемой функции в зависимости от задаваемой точности поиска.

Сделать выводы об объѐме вычислений в зависимости от задаваемой точности и начального приближения.

Решение задачи минимизации со смешанными ограничениями

Общая задача нахождения экстремума функции при наличии ограничений - равенств и ограничений неравенств записывается в следующем виде:

(

)

(

)

 

(10.6)

*

( )

 

 

( )

 

 

 

 

+

 

 

где среди функций

( ) и

( ) могут быть нелинейные.

Активные ограничения: неравенства в точке

это ограничения,

которые выполняются в данной точке в виде равенства.

Пассивные ограничения: неравенства в точке

это ограничения,

которые выполняются в данной точке в виде строгого неравенства. Если градиенты активных ограничений-неравенств и ограниченийравенств в точке линейно независимы, то говорят, что в оптимальной точке выполнено условие регулярности.

Обобщенная функция Лагранжа для задачи со смешанными ограничениями определяется следующим образом

( ) ( ) ∑ ( ) (10.7)

Если условие регулярности

выполнено, то этот коэффициент

можно положить равным 1.

 

106

Теорема Куна − Таккера (дифференциальная форма необходимого

условия минимума). Пусть точка

− точка локального минимума в

задаче

математического программирования (10.6), функции

 

дважды непрерывно

дифференцируемы в точке ,

функции

дважды непрерывно дифференцируемы в некото-

рой окрестности точки . Тогда существует число и вектор такие, что выполняются следующие условия:

условие стационарности обобщенной функции Лагранжа по :

( )

условие нетривиальности:

т.е. хотя бы один из множителей Лагранжа отличен от нуля;

условие неотрицательности:

т.е. множители Лагранжа, соответствующие целевой функции и ограничениям – неравенствам, неотрицательны; условия дополняющей нежесткости:

( )

Если при этом выполнено условие регулярности, то для выпуклых функций и линейных функций условия теоре-

107

мы Куна ─ Таккера являются одновременно необходимыми и достаточными условиями глобального минимума.

Достаточное условие минимума первого порядка.

Пусть имеется точка

 

, удовлетворяющая условию стационарно-

сти обобщенной функции Лагранжа по при

, суммарное чис-

ло активных ограничений-неравенств в точке

и

ограничений-

равенств совпадает с числом переменных

. Если

 

для всех ак-

тивных ограничений

(

) то точка – точка условного локального

минимума в задаче (6).

 

 

 

 

 

Достаточное условие минимума второго порядка.

 

 

Пусть имеется точка(

), удовлетворяющая условию стационар-

ности обобщенной функции Лагранжа по

при (

). Если в этой

точке

(

)

для всех ненулевых

таких,

что для активных

в точке

ограничений-неравенств

( )

,

и

(

)

 

, то точка

является точкой локального мини-

мума.

Общая схема решения задачи условной минимизации функции: Составляется обобщенная функция Лагранжа вида.

Выписываются необходимые условия минимума, сформулированные в теореме Куна - Таккера. К этим условиям добавляются ограничения, задающие допустимое множество . Полученная система алгебраических уравнений и неравенств используется для поиска условностационарных (подозрительных на экстремум) точек. Целесообразно проанализировать отдельно случаи и (или – любое положительное число). Однако если выполнено одно из условий регулярности, то вариант рассматривать не надо.

108

В найденных точках проверяется выполнение достаточных условий минимума и проводится анализ на глобальный экстремум.

Чувствительность решения ЗНП (задачи нелинейного программирования).

Множители Лагранжа могут быть использованы для оценивания влияния малых изменений правых частей ограничений на оптимальное решение задачи нелинейного программирования. Пусть ( ) – решение ЗНП

 

(

)

(10.8)

*

( )

+

 

при некотором векторе b свободных членов в ограничениях - нера-

венствах, а (

) соответственно значение целевой функции при этом

решении ЗНП,

т. е. ( )

( ). Тогда

справедлива

следующая

оценка изменения целевой функции:

(

)

( )

при из-

менении вектора b на некоторый малый вектор-приращение

:

 

 

(

)

 

 

 

(10.9)

где

– вектор множителей Лагранжа, соответствующий решению

(b).

 

 

 

 

 

 

 

Седловые точки функции Лагранжа

Существование экстремума тесно связано с наличием у функции Лагранжа (7) так называемой седловой точки.

Рассматривается задача выпуклого программирования с ограничени- ями-неравенствами

 

(

)

(10.10)

*

( )

+

 

109

Предполагается, что выполнено условие регулярности, т.е. можно

рассматривать только вариант

 

.

 

 

 

 

Определение. Точка (

), где

 

 

,

,

,

называется

седловой точкой функции Лагранжа

(

), если

 

 

(

)

(

)

 

(

)

 

(10.11)

Критерий для седловой точки функции Лагранжа. Точка (

) – яв-

ляется седловой для функции Лагранжа

(

) в том и только в том

случае, когда выполнены следующие условия:

 

 

(

)

*

(

)

 

+

 

(10.12)

(

)

*

(

)

 

+

 

(10.13)

 

(

)

 

 

 

 

 

(10.14)

Условие (12) минимума функции Лагранжа по эквивалентно выполнению в точке ( ) неравенства

( )

Условие (1.15) максимума функции Лагранжа по λ эквивалентно выполнению в точке (х*, λ*) неравенства

( )

– оптимальное решение задачи существует в том и только в том

случае, когда сущес-вует такой вектор

что (

) – седловая

точка функции Лагранжа ( ).

 

 

110