- •Основные понятия.
- •Соответствие методов и множеств.
- •Общая схема безусловной оптимизации
- •Методы первого порядка (градиентные методы)
- •Градиентный метод с постоянным шагом
- •Выпуклые функции и множества
- •Cвойства выпуклых функций
- •2.Теорема:
- •4.Теорема:
- •5.Теорема:
- •Градиентные методы (продолжение)
- •2. Градиентный метод с дроблением шага.
- •3.Метод наискорейшего спуска.
- •4.Масштабирование.
- •1.2 Метод Ньютона.
- •Сравнительная таблица достоинств и недостатков градиентного метода и метода Ньютона:
- •Число обусловленности локального min.
- •1.3. Многошаговые ( двухшаговые ) методы.
- •1.4.Квазиньютоновские методы
- •1. Методы апроксимации
- •2. Метод покоординатного спуска
- •3.Метод симплексов (Нелдера- Нида)
- •4 .Метод Пауэлла (сопряженных направлений)
Градиентный метод с постоянным шагом
Пусть tk = t (т.е. не зависит от к-пост.)
xk+1 = xk - tf(xk)
Видно, что останавливаемся в любой точке, где f(xk)=0.
Пример:
f(x) = ax2, a>0, x-скаляр
xk+1=xk - 2taxk = (1- 2at)xk
Отсюда
1-2at<1 at<1- необходимое и достаточное условие существования предела
Если 0<tk<1/a - сходится,
tk>1/a - расходится,
tk=1/a - зацикливается.( tk=1/a x1=x0-2x0= -x0 x2=x1-2x1= -x1=x0 и т.д.)
Выбор постоянного шага приводит к осложнениям. Оценим сходимость этого метода в общем случае.
Теорема (о сходимости метода градиентов)
Пусть f(x)- дифференцируема на Rn, f(x) удовлетворяет условию Лифшица:
|| f(x)-f(y) || L ||x-y || (*)
(||x2|| = xi2 ), f(x)- ограничена снизу
f(x) f* >- (**) и 0< t< 2/L(***), L -const.
Тогда в методе xk+1= xk-tf(xk), градиент стремится к нулю,
т.е. limf(xk) =0, при k, а функция f(x) монотонно убывает f(xk+1)f(xk). Точнее f(xk+1) f(xk)-t(1-tL/2)||f(xk) ||2(градиент характеризует скорость убывания и множитель)
Доказательство
Известно из мат.анализа:
(1)
Пусть x=xk, y= -tf(xk) (2)
Подставим (2) в(1):
f(xk+1)=f(xk)-t||f(xk)
||2-t
-f(xk),f(xk))dT
f(xk)-t+Lt2||f(xk)
||2
=f(xk)-t(1-Lt/2)
||f(xk)
||2
Обозначим a = t(1-Lt/2); a>0, так как (***)
Отсюда f(xk+1) f(xk)-a||f(xk) ||2
Выразим f(xk+1) через f(x0)
Пусть k=0: f(x1) f(x0)- a||f(x0) ||2
k=1: f(x2) f(x1)- a||f(x1) ||2 f(x0)- a||f(x0) ||2 - a||f(x1) ||2.........
f(xk+1)
f(x0)-a
2
так как a>0, то 2 a-1(f(x0)-f(xs+1)) a-1(f(x0)-f*), для любого S
то
есть
<
( сумма ограничена)
||f(xk)
||0,
то есть теорема доказана.
Замечание:
Сходимость градиента к нулю не гарантирует сходимости к минимуму.
Пример:
, градиентсходится к нулю,
но функция не имеет минимума.
Равенство градиента нулю- необходимое условие минимума, достаточное условие- положительность второй производной.
Таким образом доказана принципиальная сходимость метод при определенных условиях. Оценить скорость сходимости в общем случае можно для более узкого класса функции.
Выпуклые функции и множества
Определение
Множество X называется выпуклым, если x1,x2X, [0,1], выполняется



x1+(1-)x2X,
то есть вместе с любыми двумя точками
оно содержит и отрезок их соединяющий.
На рис 1 изображено выпуклое множество, на рис 2 - невыпуклое.
рис 1 рис2
Определение
Точка Z называется выпуклой комбинацией точек x1,x2,...,xm, если
,
,
,![]()
Теорема (о выпуклом множестве)
Выпуклое множество X содержит все выпуклые комбинации своих точек.
Определение
Функция f(x) называется выпуклой если ее область определения выпукла и для любого x1,x2X, (0,1) выполняется f(x1+(1-)x2) f(x1)+(1-)f(x2)
(

функция
выпукла, если ее график под хордой )
Определение
Функция f(x), для которой -f(x) выпукла называется вогнутой.
Определение
Функция f(x) на Rn называется строго выпуклой, если xy, 0<<1 выполняется
f(x+(1-)y)<f(x)+(1-)f(y),
сильно выпуклой с константой l>0, если при 0 1 выполняется
f(x+(1-)y)f(x)+(1-)f(y)-l(1-)||x-y||2/2
