Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ВМиМОвЭ Очное Шестакович 2011 / ВМиМОвЭ Шестакович 2011 модифицированный.doc
Скачиваний:
24
Добавлен:
13.05.2023
Размер:
4.32 Mб
Скачать

7.6. Методы второго порядка

7.6.1. Обобщенный метод Ньютона – Рафсона

Эти методы основаны на квадратичной аппроксимации целевой функции и как следствие для своей реализации требуют вычисления производных первого и второго порядков. Одним из таких методов является обобщенный метод Ньютона – Рафсона, в котором на каждой к-й итерации производится одномерный поиск минимума целевой функции (хk+pk) относительно шага  в направлении pk=-Hk-1gk, где Нk-1 – матрица, обратная матрице Гессе (матрицы вторых производных) в точке хk, а gk – градиент целевой функции в той же точке. Одним из преимуществ этого метода по сравнению с градиентными методами состоит в том, что он не реагирует на «овражный» характер минимизируемой функции. Градиентные методы, по существу, используют линейную аппроксимацию целевой функции и поэтому менее точно определяют направление на точку минимума. Поэтому метод Ньютона – Рафсона позволяет достичь заданной точности за меньшее число итераций, чем градиентные методы. Однако каждая итерация метода Ньютона – Рафсона связана с вычислением матрицы вторых производных Нk и последующим её обращением, что требует большего объема вычислений по сравнению с одной итерацией градиентного метода. Кроме того, в ряде случаев производные не могут быть получены в виде аналитических выражений, а вычисление их численными методами осуществляется с ошибками, которые зачастую сводят на нет преимущества этого метода. Поэтому широкое распространение получила группа методов называемая методами переменной метрики или квазиньютоновскими, базирующихся на аппроксимации обратной матрицы Гессе на основе только первых производных. В этих методах вектор направления рk рассчитывается по формуле рk=-Аkgk, где матрица Аk называемая иногда матрицей направлений, представляет собой аппроксимацию матрицы Нk-1. Один из методов переменной метрики, полученный Дэвидоном и модифицированный Флэтчером и Пауэллом, получил название метода Дэвидона – Флэтчера – Пауэлла (ДФП).

7.7. Методы переменной метрики

7.7.1. Метод Дэвидона – Флэтчера – Пауэлла

Основной трудностью реализации обобщенного метода Ньютона – Рафсона является необходимость вычисления матрицы вторых производных Н (матрицы Гессе) и ее обращения на каждой итерации. В методе ДФП эта трудность преодолевается благодаря использованию определенного приближения Ак для матрицы, обратной гессиану Н. Матрица Ак – положительно определенная симметричная матрица, которая обновляется на каждой итерации. В пределе матрица Ак становится равной обратному гессиану Нк-1. Начальное значение матрицы А0 принимается равным единичной матрице Е. На каждой итерации текущее значение матрицы направлений пересчитывается в соответствии с рекуррентным соотношением:

где vk=kpk, uk=gk+1 gk.

Алгоритм метода.

  1. Задается начальная точка х0 и погрешность .

  2. Задается начальное значение матрицы А0 (единичная матрица).

На каждой к-й итерации (к=0, 1, 2, …) вычисляется:

  1. Градиент целевой функции

  1. Вектор направления поиска рk=-Аkgk.

  2. Находится k в результате решения задачи одномерной минимизации целевой функции (хk+pk) одним из ранее рассмотренных методов.

  3. Вычисляется вектор перемещения в пространстве n переменных

vk=kpk.

  1. Вычисляется новая точка xk+1=xk+vk.

  2. Вычисляется целевая функция k+1=(хк + 1) и градиент gk+1=(xk+1) во вновь полученной точке xk+1.

  3. Завершить процедуру поиска, если ||gk+1|| < или ||vk|| < .

В противном случае:

  1. Вычислить uk=gk+1gk.

  2. Пересчитать матрицу Аk

  1. Увеличить к на единицу и вернуться к п. 3.