Добавил:

mihail1000 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Воронежский государственный технический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Оптимизация в системах автоматизированного проектирования. Львович Я.Е., Литвиненко Ю.В.doc

Скачиваний:

Добавлен:

01.05.2022

Размер:

23.89 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 1112 / 1512 13 14 15 > Следующая >>>

3.3.2. Градиентные методы спуска

Предположим, что минимизируемая функция Q(x) является унимодальной многопараметрической, для которой в каждой точке х может быть вычислено значение градиента:

(3.81)

Рассмотрим класс алгоритмов , осуществляющих последовательный поиск точки локального минимума х* функции Q(x) из заданного начального приближения х° по итерационной формуле:

(3.82)

где х^k — решение задачи оптимизации:

, (3.83)

полученное на k-й итерации; ∆^k = (х^k^+
1- х^k) — приращение варьируемых переменных; s^k — единичное направление, вдоль которого значение функции Q(x) может быть уменьшено; — длина шага вдоль направления s^k.

Последовательность точек испытаний (х⁰, х¹, ..., x^k), полученная по формуле (3.82) и удовлетворяющая цепочке неравенств:

Q(x⁰) > Q(x¹) > ... > Q(x^k), (3.84)

называется релаксационной последовательностью.

Разложим функцию Q(x) относительно точки х^k в ряд Тейлора, ограничиваясь членами первого порядка:

Q(x^k⁺¹) = Q(x^k) + ( Q^T (х^k),∆^k). (3.85)

Из условия (3.84) следует, что на каждой итерации приращение ∆^k следует выбирать таким образом, чтобы выполнялось неравенство:

Q(x^k⁺¹) – Q(x^k) < 0. (3.86)

Тогда, учитывая неравенство (3.86), из соотношения (3.85) получаем:

(3.87)

Из (3.85) с учетом неравенства (3.87) следует, что единичное направление s^k, обеспечивающее наибольшую скорость уменьшения функции Q(x), является оптимальным решением задачи оптимизации:

(3.88)

при условии, что (s^T, s) = 1.

Построим для сформулированной задачи функцию Лагранжа:

Значения s и а должны удовлетворять системе уравнений:

откуда

(3.89)

где — обычная норма в n-мерном евклидовом пространстве.

Таким образом, для обеспечения наибольшей скорости уменьшения функции Q(x) вдоль единичного направления s^k, последнее должно совпадать с нормированным значением антиградиента.

Алгоритмы построения релаксационной последовательности (3.84) с помощью итерационной формулы (3.82), в которой направление поиска зависит от значения антиградиента (), образуют класс алгоритмов , называемых градиентными методами спуска.

При заданном направлении поиска s^k выбор точки очередного испытания согласно итерационной формуле (3.82) сводится к определению положительного значения шага вдоль этого направления. Реализация градиентного метода спуска, в котором оптимальная длина шага вдоль направления антиградиента (3.89) является решением одномерной задачи оптимизации:

(3.90)

называется методом наискорейшего спуска .

Достоинство метода наискорейшего спуска — его простота. Однако он имеет ряд существенных недостатков, среди которых необходимо отметить следующее. Во-первых, это — одношаговый алгоритм, в котором при выборе точки очередного испытания х^k^{+ 1}не используется информация о предыдущих испытаниях, кроме испытания в точке x^k. Во-вторых, если гессиан G(x) минимизируемой функции Q(x) является плохо обусловленной матрицей, наибольшее и наименьшее собственные значения которой сильно отличаются друг от друга, то процесс поиска замедляется в связи с зигзагообразностью траектории поиска (х⁰, х¹, ..., х^k) (рисунок 3.10). При этом может потребоваться недопустимо большое число итераций, прежде чем будет получена требуемая точность локализации точки минимума x*.

Для устранения недостатка алгоритма F₁₀, связанного с игнорированием информации о предыдущих испытаниях, рассмотрим алгоритм , реализующий градиентный метод с памятью, в котором при выборе очередного приращения ∆^kучитывается информация о приращении ∆^k^-1, полученном на предыдущей итерации. Для этого потребуем, чтобы на k-й итерации приращение ∆^k выбиралось таким образом, чтобы обеспечивалась наибольшая скорость уменьшения функции Q(x) при условии, что квадрат модуля разности приращения ∆^k и взвешенного приращения , оставался равным постоянной величине К:

(3.91)

при условии, что

Построим для сформулированной задачи функцию Лагранжа:

Рис. 3.10. Зигзагообразная траектория движения к точке

минимума х* при минимизации квадратичной функции

Q(x) = x^TGx + (b^T, x) + a методом наискорейшего спуска

Значения ∆ и а должны удовлетворять системе уравнений:

(3.92)

откуда оптимальное решение задачи (3.91) получаем с помощью следующего выражения:

(3.93)

Нетрудно видеть, что метод наискорейшего спуска F₁₀ является частным случаем алгоритма F₁₁ при .

Значения коэффициентов и в формуле (3.92) могут быть выбраны из условия обеспечения минимального значения функции вдоль направления :

(3.94)

В качестве одного из подходов к решению задачи оптимизации (3.94) рассмотрим метод квазилинеризации решения эквивалентной ей системы нелинейных уравнений, предположив, что для минимизируемой функции Q(x) может быть вычислена матрица вторых производных (гессиан) G(x):

(3.95)

Пусть значения и на k-й итерации вычисляются по итерационной формуле:

(3.96)

где , — начальные значения коэффициентов ; — приращения коэффициентов .

Тогда разлагая левые части уравнений (3.95) в ряд Тейлора относительно точки (,) и вводя постоянный множитель и коэффициент направления , получаем систему линейных уравнений:

(3.97)

Производные, входящие в систему уравнений (3.97), вычисляем в точке:

(3.98)

по следующим формулам:

где - гессиан функции Q(x), вычисленный в точке .

Решая уравнение (3.97), получаем следующие выражения для приращений и :

(3.99)

где

При этом коэффициент направления определяется из условия уменьшения функции Q(x) вдоль направления ∆^k. Для этого необходимо, чтобы вариация функции Q(x) по и была отрицательной. Тогда из условия

получаем, что

где

Если при значение функции Q(x) удовлетворяет условию

, (3.100)

то полученные по итерационным формулам (3.96) значения и выбираем как новые значения и . В противном случае параметр уменьшается до тех пор, пока не выполнится условие (3.100). Процедуру вычисления коэффициентов и считают законченной принимают равными текущим значениям и ), когда приращения и станут меньше заданного значения . На первом шаге рассмотренного метода квазилинеризации можно положить .

В градиентном методе с памятью F₁₁ при описанном подходе к вычислению коэффициентов , требуется на каждой итерации вычислять матрицу вторых производных минимизируемой функции Q(x) — гессиан G(x) = {²Q/x_ix_j}. Поэтому рассмотрим его модифицированный вариант — алгоритм , реализующий метод сопряженных направлений, в котором при поиске минимума функции Q(x) используются только значения первых производных .

Рассмотрим свойства алгоритма F₁₂ на примере квадратичной функции Q(x) = х^T Gx + b^Tх + а, так как полученные при этом результаты легко обобщаются на нелинейные функции Q(x), если их аппроксимировать на каждой итерации разложением в ряд Тейлора:

(3.101)

Градиенты квадратичной функции с положительно определенной матрицей (x^T Gx > 0), вычисленные на k-й и (k+1)-й итерациях, связаны между собой соотношением:

. (3.102)

При этом градиент этой функции в точке х^k^{+ 1}ортогонален предыдущему направлению поиска s^k:

. (3.103)

Подставляя значение градиента, вычисленного в точке х^k^{+ 1}, из (3.102) и значение приращения, полученного на (k - 1)-й итерации, из (3.93) в систему нелинейных уравнений (3.92) можем записать:

(3.104)

Согласно соотношению (3.103) первое слагаемое в (3.104) равно нулю, следовательно, коэффициенты и связаны соотношением:

(3.105)

Тогда, подставляя полученное значение в выражение (3.92) для приращения , получим:

(3.106)

где

(3.107)

Направления поиска s⁰, s¹, ..., s^k, получаемые с помощью соотношения (3.107), являются G-сопряженными к заданной положительно определенной матрице G квадратичной функции Q(x) = х^T Gx + b^T х + а:

(sⁱ)^T G s^j = 0, (3.108)

а градиенты функции Q(x) в точках испытаний , являются взаимно-ортогональными:

(3.109)

Именно свойство G-сопряженности (3.108) направлений поиска s^k, выбираемых в алгоритме F₁₁ согласно формуле (3.107), и определяет его название как метода сопряженных градиентов.

Можно показать, что коэффициент в соотношении (3.107) может быть вычислен с помощью следующего выражения:

(3.110)

Процесс поиска точки локального минимума х* нелинейной функции Q(x) по алгоритму сводится к следующей последовательности действий.

На первой итерации (k = 0) для начального приближения х⁰ вычисляют значение градиента Q (x⁰) определяют направление поиска s⁰ = - Q (х⁰).
Определяют точку очередного испытания:

где — оптимальное решение одномерной задачи оптимизации:

Вычисляют приращение

∆^k = x^{k
+ 1}– x^k

и значение градиента в точке x^k^{+ 1}:

Для каждой последующей (k+1)-й итерации (k := k + 1) находят новое направление поиска:

где

Поиск точки локального минимума х* заканчивается, если выполняется условие . В противном случае все вычисления повторяются с шага 2.

Можно сказать, что поиск точки минимума х* квадратичной функции Q(x) с помощью метода сопряженных направлений заканчивается не более чем за п итераций, т.е. алгоритм F₁₂ обладает квадратичной скоростью сходимости.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 1112 / 1512 13 14 15 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]