- •Расширенный конспект по методам минимизации функций
- •1. Общая классификация методов минимизации
- •2. Классификация основных методов
- •3. Подробное описание методов
- •3.1. Метод наискорейшего спуска
- •3.2. Метод с дроблением шага
- •3.3. Метод с убыванием длины шага
- •3.4. Метод Ньютона
- •3.5. Квазиньютоновы методы
- •3.6. Овражный метод
- •4. Ответы на вопросы классификации
- •2.1 Классификация по порядку и количеству шагов
- •2.2 Сходимость для квадратичной функции
- •2.3 Двухшаговые методы безусловной минимизации
- •2.4 Методы второго порядка
- •2.5 Нелокальные методы
- •5. Итоговые замечания
Расширенный конспект по методам минимизации функций
1. Общая классификация методов минимизации
Методы минимизации функций можно классифицировать по следующим критериям:
Критерий |
Варианты |
|
|
|
|
По типу производных |
Методы нулевого, первого, второго порядка |
|
|
|
|
По числу используемых |
Одношаговые, двухшаговые, многошаговые |
|
предыдущих точек |
||
|
||
|
|
|
По области применения |
Локальные (поиск локального минимума), нелокальные |
|
(поиск глобального минимума) |
||
|
||
|
|
|
|
|
2. Классификация основных методов
Метод |
Порядок |
Количество |
Сходимость |
Характер |
|
шагов |
метода |
||||
|
|
|
|||
|
|
|
|
|
|
Метод |
|
|
|
|
|
наискорейшего |
Первый |
Одношаговый |
Линейная |
Локальный |
|
спуска |
|
|
|
|
|
|
|
|
|
|
|
Метод с |
Первый |
Одношаговый |
Линейная |
Локальный |
|
дроблением шага |
|||||
|
|
|
|
||
|
|
|
|
|
|
Метод с |
|
|
|
|
|
убыванием длины |
Первый |
Одношаговый |
Медленная |
Локальный |
|
шага |
|
|
|
|
|
|
|
|
|
|
|
Метод Ньютона |
Второй |
Одношаговый |
Квадратичная |
Локальный |
|
|
|
|
|
|
|
Квазиньютоновы |
Приближённо |
Двухшаговый |
Сверхлинейная |
Локальный |
|
методы |
второй |
||||
|
|
|
|||
|
|
|
|
|
|
Овражный метод |
Первый |
Двухшаговый |
Быстрее |
Локальный |
|
линейной |
|||||
|
|
|
|
||
|
|
|
|
|
|
Симплекс-метод |
Нулевой |
Многошаговый |
Эмпирическая |
Нелокальный |
|
|
|
|
|
|
|
|
|
|
|
|
3. Подробное описание методов
3.1.Метод наискорейшего спуска
•Суть: движение вдоль антиградиента функции в направлении наибыстрейшего убывания.
•Формула: xk+1 = xk − αk f(xk) , где αk = argminα f(xk − α f(xk)) .
1
•Сходимость: линейная; сильно зависит от числа обусловленности матрицы Гессе.
•Для квадратичной функции: не сходится за один шаг, требует n шагов (в n-мерном пространстве).
•Тип: метод первого порядка, одношаговый, локальный.
3.2.Метод с дроблением шага
•Суть: шаг αk выбирается адаптивно — уменьшается до тех пор, пока не выполнено условие уменьшения функции:
f(xk − αk f(xk)) < f(xk) − cαk f(xk) 2.
•Преимущества: автоматическая стабилизация сходимости.
•Сходимость: линейная, гарантируется для сильно выпуклых функций.
•Для квадратичной функции: не сходится за один шаг.
•Тип: первый порядок, одношаговый, локальный.
3.3.Метод с убыванием длины шага
•Суть: шаг αk заранее уменьшается по закону: αk = k+1c .
•Преимущества: обеспечивает сходимость даже при плохом начальном приближении.
•Недостатки: медленная сходимость.
•Для квадратичной функции: требует n и более шагов.
•Тип: первый порядок, одношаговый, локальный.
3.4.Метод Ньютона
•Суть: использует вторую производную для учёта кривизны поверхности функции:
xk+1 = xk − [ 2f(xk)]−1 f(xk).
•Преимущества: очень высокая скорость сходимости (квадратичная).
•Недостатки: вычислительно затратен (нужно обращать матрицу Гессе).
•Для квадратичной функции: сходится за один шаг (если начальная точка не слишком далека от минимума).
•Тип: второй порядок, одношаговый, локальный.
3.5.Квазиньютоновы методы
•Суть: аппроксимируют обратную матрицу Гессе, обновляя её итерационно:
Bk+1 = Bk + Bk, xk+1 = xk − Bk f(xk).
•Преимущества: избегают прямого вычисления H−1 , приближаясь к методу Ньютона.
•Сходимость: сверхлинейная.
•Для квадратичной функции: сходятся за n шагов (при идеальной аппроксимации Гессе).
•Тип: второй порядок (приближённо), двухшаговый (зависит от текущего и предыдущего приближения), локальный.
2
