
___________________________________________________________________________________________________________
3.5. Итеративные методы поиска оптимума
3.5. Итеративные методы поиска оптимума
Общая характеристика итеративных методов поиска оптимума
Итеративные методы поиска оптимума [12] могут быть использованы в тех случаях, когда:
вид зависимости целевой функции W() от оценок альтернативных вариантов по каждому из критериев не известен;
вид зависимости целевой функции W() от оценок альтернативных вариантов по каждому из критериев известен, но по каким-либо причинам значения целевой функции W() не всегда удается вычислить (из-за большой размерности или неразрешимости задачи).
Для таких методов должно быть характерно следующее. Значение целевой функции (даже если она не имеет аналитического выражения) при тех или иных значениях аргумента можно получить путем проведения некоторого эксперимента, в котором это значение измеряется или оценивается. Этот эксперимент аналогичен подстановке в целевую функцию, имеющую формальное аналитическое выражение через аргументы, значений аргументов (факторов) и вычислению значения целевой функции при данных значениях аргументов. Максимальное или минимальное значение целевой функции может быть получено путем проведения ряда однородных экспериментов, число которых ограничено.
К простейшим задачам поиска относятся случаи одного скалярного аргумента (либо однокритериальная задача, либо в скаляр преобразован вектор критериев). Предположим, что для таких задач целевая функция обладает следующими особенностями:
имеет только один максимум (или минимум) на интервале определения (свойство унимодальности), хотя целевая функция может не и удовлетворять требованиям непрерывности и существования производной во всех точках области определения;
переменная (аргумент) изменяется только в интервале [0,1]. Данное свойство легко обеспечить, т. к. любой другой интервал можно привести к этому интервалу.
Эти свойства исчерпывают необходимые априорные сведения о целевой функции.
Пусть проводится N (N > 2) шагов процесса поиска оптимального значения W. На каждом шаге производится измерение (оценка) W в точке . На рис.3.5.1 приведена схема, отражающая возможные исходы N экспериментов.
Пусть в результате проведения экспериментов получено, что максимальное значение целевая функция принимает в точке q, где q – порядковый номер точки q на оси . Тогда q-1 < * < q+1. Интервал значений переменной [ q-1, q+1] назовем интервалом неопределенности. Его длина LN = q+1 – q-1 зависит от выбранной стратегии поиска оптимального значения целевой функции и от числа N шагов поиска.
Под стратегией поиска оптимального значения целевой функции будем понимать способ выбора точек для оценки в них значений W и вычисления нового интервала неопределенности значений переменной для следующего шага.
Если рассмотреть множество стратегий с их характеристиками LN (длинами интервалов неопределенности перед одним и тем же N-м шагом поиска), то наиболее выгодной нужно признать ту стратегию, которой соответствует наименьшая величина из длин интервалов неопределенности перед N-м шагом поиска. Длина интервала неопределенности перед N-м шагом определяется как длина интервала, содержащего точку * – точку предыдущего шага, в которой целевая функция принимает наибольшее значение.
LN
=(
q+1–
q-1),
q
=
.
Существует два вида стратегий:
пассивные стратегии, в которых еще до проведения экспериментов называют все точки 1,... , N;
активные стратегии, в которых выбор очередной точки i зависит от результатов предыдущих экспериментов.
На практике обычно используются активные стратегии, как наиболее эффективные. Однако каждая из них несет в себе элементы, так называемой двухточечной, пассивной стратегии, заключающейся в следующем.
Пусть 1 и 2 значения переменной в двух различных точках, в которых измеряется (вычисляется) W(), причем 2> 1. Так как функция W() является унимодальной, то из условия W( 1) >W( 2) следует, что 2> * (рисунок 3.5.2а), а из условия W( 2) > W( 1) следует, что 1< * (рисунок 3.5.2б). Интервал неопределенности находится между значением аргумента с меньшим значением функции и дальней от него границей исходного интервала.
W(1)
0 1 * 2 1
Рис. 3.5.2а
0 1 2 * 1
Рис. 3.5.2б
При поиске экстремума итеративными методами на каждом шаге выбирают пару точек 1 и 2, в каждой из которых проводят эксперимент: измеряют (оценивают) значения W. В результате проведения измерений (оценок) значений W( 2) и W( 1) в этих точках должен быть указан такой новый интервал неопределенности значений , меньший исходного, который содержит *. Для определения такого интервала измеренные (оцененные) значения W( 2) и W( 1) сравниваются друг с другом.
В случае поиска максимума целевой функции при 1< 2 возможны 3 исхода этого сравнения и соответствующие им интервалы неопределенности, содержащие *:
если W( 1) < W( 2), то * [ 1, 1];
если W( 1) = W( 2), то * [ 1, 2];
если W( 1) > W( 2), то * [0, 2].
Любой из полученных интервалов меньше исходного интервала неопределенности [0, 1]. Однако равенство значений функции этих точках возможно крайне редко. Таким образом, использование такой процедуры позволяет организовать пошаговый итеративный процесс последовательного сужения интервала значений , который содержит *.
Пусть N=2 и необходимо выбрать такие 1 и 2, чтобы сформировать наилучшую стратегию поиска решения. Точки 1 и 2 разобьют исходный интервал неопределенности [0, 1] на два интервала [0, 2], [ 1,1]. Очевидно, что L2 составляет длину интервала, внутри которого находится точка, в которой целевая функция принимает наибольшее значение:
L2
=
(
2,
1 –
1).
Для выбора оптимальной стратегии необходимо найти такие точки 1 и 2 ( 1 < 2), чтобы L2 было минимальным. Это возможно, когда 2 = 1 = 0,5. Иначе всегда интервал будет иметь длину большую, чем 0,5. Однако по условиям выбора значений переменной : 1 < 2 и 1 2. Для выполнения данного условия введем некоторую величину .
Тогда можно определить 1 = 0,5 – /2; 2 = 0,5 + /2. В этом случае /2 будет означать минимальное расстояние между 1 и 0,5, 2 и 0,5; или будет означать минимальное расстояние между 1 и 2. Каждая из этих точек оказывается одинаково удаленной от одной из границ исходного интервала.
1 = (1 – )/2; 2 =(1 + )/2; L2 = (1 + )/2.
В данной стратегии, называемой двухточечной -минимаксной, точки 1 и 2 располагаются симметрично относительно середины исходного интервала деления. Независимо от полученных результатов эксперимента, остаточный интервал неопределенности будет иметь длину L2 (либо интервал [0, 2], либо интервал [ 1, 1]).
Предположим, что перед N-м шагом (на котором измеряются значения целевой функции в точках i и i+1) длина исходного интервала неопределенности [ i-1, 1] равна LN =1 – i-1. На N-м шаге этот интервал делится на два [ i-1, i+1] и [ i, 1], предполагая, что i – первая, а i+1 – вторая точка N-го шага. Из этих двух интервалов будет выбран тот, который содержит точку с большим значением целевой функции:
LN+1
=(
i+1–
i-1;
1 –
i),
где
i
= 2N
– 1.
Тогда, выбор стратегии Si из множества стратегий S действительно является минимаксной задачей:
Si
=(
i+1–
i-1;
1 –
i),
i
= 2N – 1.
Идея симметрии использована в активных стратегиях поиска экстремума. Далее в лекции рассмотрим три из них: стратегии дихотомии, чисел Фибоначчи и золотого сечения. Вычислим длины интервалов неопределенности за N шагов поиска при использовании каждой стратегии и определим наиболее выгодную стратегию.