Скачиваний:
79
Добавлен:
01.05.2014
Размер:
309.76 Кб
Скачать
  1. Градиентный метод с постоянным шагом

Пусть tk = t (т.е. не зависит от к-пост.)

xk+1 = xk - tf(xk)

Видно, что останавливаемся в любой точке, где f(xk)=0.

Пример:

f(x) = ax2, a>0, x-скаляр

xk+1=xk - 2taxk = (1- 2at)xk

Отсюда

1-2at<1 at<1- необходимое и достаточное условие существования предела

Если 0<tk<1/a - сходится,

tk>1/a - расходится,

tk=1/a - зацикливается.( tk=1/a x1=x0-2x0= -x0 x2=x1-2x1= -x1=x0 и т.д.)

Выбор постоянного шага приводит к осложнениям. Оценим сходимость этого метода в общем случае.

Теорема (о сходимости метода градиентов)

Пусть f(x)- дифференцируема на Rn, f(x) удовлетворяет условию Лифшица:

|| f(x)-f(y) || L ||x-y || (*)

(||x2|| = xi2 ), f(x)- ограничена снизу

f(x) f* >- (**) и 0< t< 2/L(***), L -const.

Тогда в методе xk+1= xk-tf(xk), градиент стремится к нулю,

т.е. limf(xk) =0, при k, а функция f(x) монотонно убывает f(xk+1)f(xk). Точнее f(xk+1)  f(xk)-t(1-tL/2)||f(xk) ||2(градиент характеризует скорость убывания и множитель)

Доказательство

Известно из мат.анализа:

(1)

Пусть x=xk, y= -tf(xk) (2)

Подставим (2) в(1):

f(xk+1)=f(xk)-t||f(xk) ||2-t-f(xk),f(xk))dT

 f(xk)-t+Lt2||f(xk) ||2 =f(xk)-t(1-Lt/2) ||f(xk) ||2

Обозначим a = t(1-Lt/2); a>0, так как (***)

Отсюда f(xk+1) f(xk)-a||f(xk) ||2

Выразим f(xk+1) через f(x0)

Пусть k=0: f(x1) f(x0)- a||f(x0) ||2

k=1: f(x2) f(x1)- a||f(x1) ||2 f(x0)- a||f(x0) ||2 - a||f(x1) ||2.........

f(xk+1) f(x0)-a2

так как a>0, то 2 a-1(f(x0)-f(xs+1)) a-1(f(x0)-f*), для любого S

то есть < ( сумма ограничена) ||f(xk) ||0, то есть теорема доказана.

Замечание:

Сходимость градиента к нулю не гарантирует сходимости к минимуму.

Пример:

, градиентсходится к нулю, но функция не имеет минимума.

Равенство градиента нулю- необходимое условие минимума, достаточное условие- положительность второй производной.

Таким образом доказана принципиальная сходимость метод при определенных условиях. Оценить скорость сходимости в общем случае можно для более узкого класса функции.

Выпуклые функции и множества

Определение

Множество X называется выпуклым, если x1,x2X, [0,1], выполняется

x1+(1-)x2X, то есть вместе с любыми двумя точками оно содержит и отрезок их соединяющий.

На рис 1 изображено выпуклое множество, на рис 2 - невыпуклое.

рис 1 рис2

Определение

Точка Z называется выпуклой комбинацией точек x1,x2,...,xm, если

, ,,

Теорема (о выпуклом множестве)

Выпуклое множество X содержит все выпуклые комбинации своих точек.

Определение

Функция f(x) называется выпуклой если ее область определения выпукла и для любого x1,x2X, (0,1) выполняется f(x1+(1-)x2) f(x1)+(1-)f(x2)

(функция выпукла, если ее график под хордой )

Определение

Функция f(x), для которой -f(x) выпукла называется вогнутой.

Определение

Функция f(x) на Rn называется строго выпуклой, если xy, 0<<1 выполняется

f(x+(1-)y)<f(x)+(1-)f(y),

сильно выпуклой с константой l>0, если при 0  1 выполняется

f(x+(1-)y)f(x)+(1-)f(y)-l(1-)||x-y||2/2

Соседние файлы в папке Конспект по методам оптимизации в формате doc