Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
конспект-градієнтні_методи_оптимізації.docx
Скачиваний:
25
Добавлен:
25.04.2019
Размер:
101.14 Кб
Скачать

2. Градієнтні методи оптимізації

Як відомо, градієнт функції в деякій точці xk спрямований в бік найшвидшого локального зростання функції й перпендикулярний лінії рівня (поверхня постійного значення функції f(x), що проходить через точку xk). Вектор, протилежний градієнту , називається антиградієнтом, що спрямований убік найшвидшого спадання функції f(x). Вибираючи як напрямок спуска pk антиградієнт - у точці xk, ми приходимо до ітераційного процесу виду:

Усі ітераційні процеси, у яких напрямок руху на кожному кроці збігається з антиградієнтом функції, називаються градієнтними методами. Вони відрізняються один від одного тільки способом вибору кроку . Існує багато різних способів вибору , але найпоширенішими є: метод з постійним кроком, метод із дробленням кроку та метод найшвидшого спуску.

2.1 Градієнтний метод з постійним кроком

В загальному випадку, число у формулі (2) може на кожному кроці (тобто для кожного k) обиратися заново. Якщо ж при всіх k, то отриманий метод називається градієнтним методом з постійним кроком (з кроком ).

Подамо графічну інтерпретацію даного методу:

На кожному кроці ми зміщуємося за вектором антиградієнта, зменшеному в – разів.

Є функції, для яких даний метод не збігається навіть при якнайменшому можливому кроці, і є функції, для яких він збігається тільки при достатньо малих кроках.

Теорема про умовну збіжність градієнтного методу з постійним кроком. Нехай f(x)  min, де f: RmR таке, що починаючи з деякого x0Rm будується послідовність {xn}  Rm така, що f(xn+1) < f(xn) при всіх nN. І нехай функція f обмежена знизу, неперервно-диференційована і більше того, задовольняє умові Ліпшиця:

||f (x)  f (y)||   ||xy|| при всіх x, yRm.

Тоді при   (0, 2/) градієнтний метод з постійним кроком умовно збігається.

Доведення. Нехай zn = f (xn) і позначимо f(xn + tzn) через (t). Тоді легко побачити, що (t) = (f (xn + tzn), zn) і тому за формулою Ньютона-Лейбніца для функції 

f(xn+1)  f(xn) = f(xn + zn)  f(xn) = (1)  (0) =

1 0

(s) ds =

1 0

(f (xn+ szn), zn) ds. 

Додавши і віднявши (f (xn), zn) = 01(f (xn), zn) ds і використавши нерівність (x, y)  ||x|| · ||y||, отримаємо:

f(xn+1)  f(xn) = (f (xn), zn) +

1 0

(f (xn + szn)  f (xn), znds  

 (f (xn), f (xn)) + 

1 0

||f (xn + szn)  f (xn)|| · ||zn|| ds. 

Враховуючи умову Ліпшиця для f  цю послідовність можна продовжити:

 f(xn+1)  f(xn)  ||f (xn)||2 +  ||zn||2

1 0

s ds =

=  ||f (xn)||2 + 

2

2

||f (xn)||2 = ||f (xn)||2

 

1  



2

 

.

Оскільки, 1  /2 > 0, послідовність {f(xn)} не зростає. А оскільки виходячи з умов теореми f ще й обмежена знизу, послідовність {f(xn)} збігається. Тому, f(xn+1)  f(xn)  0 при n  Звідси:

 ||f (xn)||2  1

 

1 –



2

 

–1

[f(xn)  f(xn+1)]  0 при n . 

Теорему доведено.