Добавил:

Studfiles2 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный электротехнический университет "ЛЭТИ"

Предмет:

Методы оптимизации

Файл:

Конспект по методам оптимизации в формате doc / LEC1.DOC

Скачиваний:

Добавлен:

01.05.2014

Размер:

309.76 Кб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 67 / 87 8 > Следующая >>>

1.4.Квазиньютоновские методы

общая структура: x_k+1= x_k - _k_kf(x_k)

Если H_k=I , то это градиентный метод.
Если H_k= (²f(x_k))^-1, то это метод Ньютона.
Если H_k= H_k (f(x_i), i=1..k)  (²f(x_k))^-1, т.е. матрица H_k пересчитывается рекурентным способом на основе информации, полученной на k-й итерации.

Достоинство:

Не надо вычислять обратную матрицу вторых производных.

Обозначим p_k= H_kf(x_k)

y_k= f(x_k+1) -f(x_k),

,A>0

Тогда для квадратичной функции имеем

y_k= A(x_k+1-x_k) = _kAp_k

_kp_k = y_kA^-1,

поэтому матрицу H_k+1 (необязательно для квадратичной функции) выбирают так, чтобы выполнялось так называемое квазиньютоновское условие:

H_k+1y_k= _kp_k(H_k- должна стремиться к (²f(x_k))^-1

етод Давидона- Флетчера- Пауэлла (ДФП)

Проверим выполнение квазиньютоновского условия:

Для квадратичной функции метод сходится за n шагов, где n – размерность пространства состояний. Скорость сходимости этого метода сверхлинейная (быстрее любой геометрической прогрессии).Сходимость глобальная.

Объединяет достоинства градиентных методов и метода Ньютона.

Процедура применения:

На очередном шаге, имея H_k, делаем шаг в направлении p_k. Получаем _k (например, по методу наискорейшего спуска) , получаем x_k+1, вычисляем y_k и пересчитываем H_k+1 для следующего шага .

Недостаток:

(по сравнению с методом сопряженных градиентов)

Надо хранить и пересчитывать H_kразмерности mn.

Метод Бройдена-Флетчера –Шенно.

где

Примечание:

Последовательности x_k,генерируемые каждым вариантом, для квадратичной функции совпадают. Существует много других модификаций приведенных квазиньютоновских методов.

Методы нулевого порядка

1. Методы апроксимации

В их основе лежит апроксимация градиента и матрицы вторых производных с помощью конечных разностей.

Пусть e_j- орт j-й оси.

f (x + e_j)  f(x) + f/x_j + O(²)

f/x_j= ( f(x + e_j) - f(x) )/   ( f(x + e_j) - f(x - e_j) )/ (2)

Здесь под градиентом понимается конечная разность. Если  слишком мала, то слишком велики погрешности при вычислении производных. Если  велика, то из-из O(²) погрешности тоже велики. Таким образом проблема этих методов- выбор .

2. Метод покоординатного спуска

Нужны направления. Раньше их задавал градиент, теперь его нет. Возможен случайный выбор, а можно по координатным осям.

Алгоритм:

j :=1
min f(x^’-e_j)=f(x^’’), x^’’:= x’- *e_j
j:=j+1, x^’= x^’’
if j  n then goto 2)
if not (условие окончания цикла) then goto 1

Достоинство:

Требуется min функции вдоль только одной прямой.

3.Метод симплексов (Нелдера- Нида)

Алгоритм:

1.Фиксируем x_o…x_n( n+1- точка)

Если n =2 , то  (выбир. равнобедренный треугольник)

вычисление отраженной точки

x_j

x_j’

Если f(x_j^’) < f(x_j), то x_j:= x_j^’; k:=0, иначе k:=k+1

k- количество идущих подряд неудачных отражений

3. Если k<n, то (если j<n, то j:=j+1 , иначе j:=0) goto 2.

4.Иначе сжатие : x_l = argmin f(x_j), 0 j  n - ищем вершину, в которой функция минимальна (то есть наименьшее значение из всех существующих вершин

5. Cжатие : x_j= x_l+ ( x_j- x_l), j (сжатие в  раз)

Существует много модификации метода.

Особенность: метод в ряде случаев позволяет найти глобальный минимум, т.е. позволяет перескакивать через хребты.

<<< < Предыдущая 1 2 3 4 5 67 / 87 8 > Следующая >>>

Соседние файлы в папке Конспект по методам оптимизации в формате doc

#
01.05.2014309.76 Кб75LEC1.DOC
#
01.05.2014589.82 Кб25LEC2.DOC