- •1. Задачи оптимизации
- •1.1. Основные понятия
- •1.2. Постановка задачи оптимизации
- •1.2.1 Задача безусловной оптимизации
- •1.2.2. Задача условной оптимизации
- •1.2.3. Классическая задача на условный экстремум
- •1.2.4. Понятия выпуклого множества и выпуклой функции
- •1.2.5. Выпуклая задача оптимизации
- •1.2.6. Задача математического программирования
- •1.2.7. Задачи выпуклого программирования
- •1.2.8. Задачи линейного и квадратичного программирования
- •1.2.9. Задача дискретной оптимизации
- •1.2.10. Задачи оптимального управления
- •2.Начальные сведения о численных методах оптимизации
- •2.1. Понятие о численных методах оптимизации
- •2.2. Сходимость методов оптимизации
- •2.3. Условия остановки (критерии окончания счета)
- •2.4. Направление убывания и методы спуска
- •2.5. Выбор длины шага из условия минимизации функции вдоль заданного направления
2.4. Направление убывания и методы спуска
Многие методы минимизации относятся к числу методов спуска. В методах спуска направление движения к минимуму на каждом шаге выбирается из числа направлений убывания минимизируемой функции.
Говорят, что вектор h задает направление убывания функции f в точке x, если f(x + h) < f(x) при всех достаточно малых > 0. Сам вектор h также называют иногда направлением убывания. Множество всех направлений убывания функции f в точке х будем обозначать через U(х, f).
Таким образом, если любой достаточно малый сдвиг из х в направлении вектора h приводит к уменьшению значения функции f, то h U(x, f).
Заменив неравенство, фигурирующее в определении направления убывания, на противоположное, получим определение направления возрастания.
В дальнейшем нам понадобятся следующие достаточный и необходимый признаки направления убывания.
Лемма 2.1. Пусть функция f дифференцируема в точке х Rn. Если вектор h удовлетворяет условию
f'(х),h < 0, (2.13)
то h U(х, f). Если h U(х, f), то
f'(х),h 0, (2.14)
Геометрически условие (2.13) означает, что вектор h составляет тупой угол с градиентом f'(х).
Метод (2.3) называется методом спуска, если вектор hk задает направление убывания функции f в точке xk:
hk U(хk, f), k = 0, 1, 2, ...,
а число k положительно и таково, что
f(xk+1) < f(xk), k = 0, 1, 2, ...
Простейшим примером метода спуска является градиентный метод, в котором hk = –f'(хk) (если f'(х) 0, то –f'(х) U(х, f) в силу леммы 2.1).
2.5. Выбор длины шага из условия минимизации функции вдоль заданного направления
Коэффициенты k в методе (2.3) можно определять из условия
, (2.15)
где для методов спуска, т. е. при hk U(хk, f), минимум берется по 0. Такой способ выбора k является в некотором смысле наилучшим, ибо он обеспечивает достижение наименьшего значения функции вдоль заданного направления. Однако он требует решения на каждом шаге одномерной задачи минимизации. Эти задачи решаются, как правило, приближенно с помощью численных методов, что приводит к значительному объему вычислений.
В простейших случаях величины k, удается найти в явном виде.
Адаптивный способ отыскания коэффициентов k, не требующий дополнительных вычислений характеристик целевой функции
Ранее рассмотрен способ выбора коэффициентов k, требующий решения вспомогательных одномерных задач. В процессе их решения приходится, как правило, производить дополнительные вычисления характеристик целевой функции f в точках, отличных от x0, х1, ..., xk.
Ниже приводятся явные формулы для k. В них используются лишь значения f'(xk) и некоторые константы, характеризующие глобальные свойства функции f. Эти формулы выбраны с целью обеспечить при соответствующих предположениях о f выполнение неравенства
, (2.17)
где (0, 1), направление hk таково, что f'(xk), hk < 0 и, стало быть, hk U(хk, f). Неравенство (2.17) необходимо для обоснования сходимости многих методов минимизации. Из него, в частности, следует, что f(xk+1) < f(хk), и соответствующий метод минимизации является, таким образом, методом спуска.
Лемма 2.2. Пусть функция f дифференцируема на Rn, а ее градиент удовлетворяет условию Липшица
||f'(x) – f'(x')|| M||x – x'||, x, x' Rn, (2.18)
где М > 0.
Тогда для произвольных xk Rn, (0, 1) и xk, удовлетворяющего неравенству f'(xk), hk < 0, условие (2.17) выполнено при
. (2.19)