Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

2488

.pdf
Скачиваний:
6
Добавлен:
07.01.2021
Размер:
12.38 Mб
Скачать

Так как fj x fj*; j 1,...,k, то задача может быть перезаписана

k

следующим образом: min dp j fj x fj* ; x .

j 1

Произведение j fj* не изменяет ее оптимальное решение, поэто-

му задача эквивалентна следующей:

 

 

 

 

 

 

k

 

 

 

 

 

 

 

x , то

min dp j fj x ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j 1

 

 

 

 

 

 

 

 

 

 

есть при р-норме метод эквивалентен методу взвешенной суммы.

Для p пусть dmax max j

 

fj x fj*

 

. Тогда

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 j k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1/

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

1/

 

k j

 

fj x

fj*

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

d j

 

fj

x fj*

 

 

 

dmax

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

dmax

 

 

 

 

j 1

 

 

 

 

 

 

 

 

 

 

j 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

fj x fj*

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Так как 0

j

 

 

1, то

d dmax max j

 

 

fj x fj*

 

,

 

 

 

 

 

 

 

 

 

 

 

 

dmax

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 j k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

поэтому задача оптимизации становится

mind max j fj x fj* ; x .

1 j k

Так как fj x fj*; j 1,...,k, то задача эквивалентна задаче с ограничениями на целевые функции:

 

min d ;

j fj x fj* d , j 1,...,k;

x ;

где

d рассматривается как вспомогательная

переменная. Если

j

0; j 1,...,k или оптимальное решение задачи с ограничениями

на целевые функции является единственным, то оптимальное решение – эффективное решение первоначальной MOOP.

Программирование целей. Программирование целей требует информацию предпочтения, необходимую для формирования эффективного решения. Метод требует, чтобы ЛПР установило значения цели для достижимых целей. Метод позволяет ЛПР задавать упреждающие веса на цели и определять различные уровни достижения целей.

Программирование целей основано на методе p-нормы. Пусть за-

дан (ЛПР) целевой вектор Fˆ fˆ1 fˆk . Тогда

141

 

 

k

 

 

 

 

p

1/ p

 

 

min d p

 

 

 

fˆj

 

f j x

 

 

 

; х .

 

 

 

 

 

 

j

 

 

 

 

 

 

 

j 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для

программирования

 

 

целей

 

допустим

p 1:

k

min d1 j fˆj f j x ; х , что является задачей негладкой оп-

j 1

тимизации.

Для использования условных алгоритмов оптимизации введем переменные девиации:

dj

 

1

 

 

fˆj fj x

 

fˆj fj x ;

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

dj

 

1

 

 

fˆj fj x

 

fˆj fj x ;

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

; dj dj fj x fˆj ;

dj

dj

 

fˆj fj x

 

 

dj dj 0; dj ,dj 0.

Сформулируем программирование целей как

 

k

 

dj dj

 

fj x dj dj fˆj, j 1, ... ,k ;

min d j

;

 

j 1

 

 

 

 

 

 

 

 

 

dj

dj

0,dj ,dj

0, j 1, ... ,k ; x .

Рассмотрим минимаксный метод опорной точки, который способен к управлению предпочтениями для невыпуклых случаев. Предпо-

ложим, что требуемое значение fˆi для целевой функции fi x обес-

печено. Тогда опорная точка fˆ fˆ1, ..., fˆk T . Предполагается, что лучшее компромиссное решение то, которое является наиболее близким к опорной точке. Используя решающее правило и -норму, лучшее компромиссное решение может быть сформировано как задача

 

min d ;

 

fˆ

f

x

d

 

, i 1, ... ,k;

x ,

 

 

i

i

 

i

 

 

 

 

 

 

где i 0

определены как ˆi

 

; здесь

i – коэффициент нормализа-

 

 

 

 

 

 

 

i

 

 

 

 

ции; ˆi – относительный вес для целевой функции fi x . Если опорная точка дана как идеальная точка лучших значений всех целевых функций, то задача редуцируется к задаче минимакса.

142

Негладкое ограничение i fˆi fi(x) d может быть заменено следующими двумя гладкими ограничениями: i fˆi fi x d и

i fˆi fi x d . Тогда задача оптимизации может быть сформулирована следующим образом:

min d ;

fˆ

f

x d

 

;

fˆ

f

x d

 

, i 1, ... ,k

;

x ,

i

i

i

 

 

i i

i

 

 

 

 

которая является гладкой задачей математического программирования.

Для того чтобы использовать более широкий диапазон предпочтений, введем переменные девиации:

di 1 fˆi fi x fˆi fi x ;

2

di 1 fˆi fi x fˆi fi x ,

2

где di – переменная девиации представляет степень достижения fi x над fˆi ; di – степень достижения fi x под fˆi . Очевидно,

di 0 и di 0, если fi x fˆi; di 0 и di 0, если fi x fˆi ; di 0 и di 0, если fi x fˆi

или, что эквивалентно,

di di fˆi fi x ;

di di fi x fˆi ; di di 0; di ,di 0.

Получаем следующую задачу с гладкими ограничениями, основанную на введении переменных девиации:

min d ; i di di d , i 1, ... ,k ; di di fi x fˆi,

 

 

di di 0, di ,di 0, x .

 

 

Если точка

fˆ fˆ ,

..., fˆ

T соответствует оптимальным значени-

 

 

1

k

 

 

fi x fˆi ,

 

ям

соответствующих

целей,

то

поэтому

di 0;di fˆi fi x ,

задача идеальной точки переформулируется в

виде

 

 

 

 

 

 

143

min d ; i fi x fˆi d , i 1, ... ,k ; x .

Нечеткая логика. В нечеткой логике функция принадлежностивыражает степень правдивости утверждения в диапазоне от 0 (ложь) до 1 (истина).

В задаче оптимизации функция принадлежности дает возможность связать значение i fi x и выражает степень удовлетворения рассматриваемой цели i. Значение fi x фазифицируется значениемi для того, чтобы привести к значению в интервале {0,1}, который определяет, как хорошо решение удовлетворяет требованиям.

После фазификации значения функции принадлежности каждой цели преобразуются в логические значения, которые должны агрегироваться к одному значению для того, чтобы получить проектное значение. В двузначной логике это достигается оператором AND. В нечеткой логике оператор AND мог быть осуществлен различ-

ными правилами. Самое простое – оператор минимума: Ffuzzy x min 1 f1 x ,..., k fk x . Тогда задача нечеткой оптими-

зации: maxFfuzzy x .

Теория полезности. Функция полезности U f1 x ,..., fk x U x

– функция, которая отображает проектные значения на скаляр; Ui fi x выражает проектное значение как функцию, выраженную через fi x ; функции полезности обычно выражаются как показательные функции: Ui fi x a befi x .

Обычно предполагается, что различные функции полезности взаимно независимы. Чтобы объединить различные цели, предполагает-

k

U F x

ся, что функции аддитивна U F x Ui fi x . Если

i 1

 

оценки ЛПР, то максимизация U F x приводит к лучшему решению согласно ЛПР.

Метод функций приемлемости – целенаправленная модель оценки, которая служит тем же целям, которые используются в проектировании для оценивания характеристик каждого решения. Функция приемлемости представляет субъективную вероятность, что конструктор примет проект, основанный на каждой цели. Пусть a z – функция приемлемости, которая определяет вероятность того, как приемлемы различные уровни характеристики z; p z – функция

144

плотности вероятности, которая измеряет характеристики для z. Такая постановка позволяет конструктору измерять характеристики детерминированно или вероятностно. В детерминированном случае функция плотности вероятности – бесконечный импульс с единичной площадью. Вероятность приемлемости Pi на i-й характеристике:

k

Pi a z p z dz; полная вероятность приемлемости: Pacc Pi . То-

z

i 1

гда задача оптимизации может быть сформулирована как max Pacc x .

Лексикографические подходы. При лексикографических под-

ходах ЛПР определяет порядок, в котором должны быть оптимизированы цели; подразумевается, что решения упорядочены первой оценкой на основании передовой цели. Недостаток лексикографического подхода – не все цели могут быть учтены. Лексикографические методы обычно не используются самостоятельно, но используются совместно с другими методами.

3.1.2. Интерактивные методы

Интерактивные методы основаны на компромиссных решениях. Решение многокритериальных задач оптимизации обычно подразумевает поддержку ЛПР при формировании предпочтительных решений, самым предпочтительным решением является Парето-оптимальное решение. Обнаружение самого предпочтительного решения требует участия ЛПР, которое имеет понимание задачи, может определить целевую информацию предпочтения и различные варианты решений.

Винтерактивных методах формируется итерационный алгоритм,

иЛПР определяет информацию предпочтений последовательно в процессе решения. Фаза выявления предпочтения (решения) и фаза оптимизации чередуются до тех пор, пока ЛПР не найдет предпочтительных решений. После каждой итерации некоторая информация дается ЛПР и запрашивается (от ЛПР) информация об оценке предложенных решений или другой тип информации для выражения его предпочтений. Таким образом, ЛПР направляет процесс решений, и только часть Парето-оптимальных решений окончательно формируется. Кроме того, ЛПР может определить и исправить его предпочтения в процессе решений.

145

Основные шаги интерактивного метода: 1) инициализация; 2) формирование Парето-оптимальной исходной точки; 3) запрос информации предпочтения от ЛПР; 4) формирование новых Паретооптимальных решений в соответствии с информацией предпочтения; 5) ЛПР выбирает лучшее пока решение; 6) останов или переход к 3). Интерактивные методы преодолевают слабости априорных и апостериорных методов, потому что из-за структуры итерационного подхода ЛПР может не иметь глобальную структуру предпочтений и может учиться во время принятия решений. Интерактивные методы формируют только те Парето-оптимальные решения, которые предпочтительны для ЛПР.

Цель применения многокритериального метода оптимизации состоит в нахождении единственного, наиболее предпочтительного решения. Однако в некоторых случаях предпочтительнее нахождение нескольких решений. Существует большая разновидность интерактивных методов и трудно указать один метод, который превосходит другие. Самое важное предположение, лежащее в основе успешного применения интерактивных методов, – это доступность для ЛПР и его участие при принятии решений в соответствии с его предпочтениями.

Интерактивные методы отличаются друг от друга типом взаимодействия и техническими элементами, формами представления информации для ЛПР, типами информации предпочтения ЛПР, типами полученных решений, методами решений и др. Важно, что ЛПР находит метод приемлемым, информация предпочтения должна быть простой и интуитивно понятной.

Часто идентифицируют две фазы процесса принятия решений: фазу изучения, когда ЛПР изучает задачу и допустимые решения, и фазу решения, когда находятся предпочтительные решения из области, полученной в первой фазе.

Ниже рассмотрены три типа информации предпочтения в интерактивных методах: информации компромисса, подходы опорной точки и классификационные методы.

Концепции компромиссных решений. Интуитивно компро-

миссное решение – это потеря в одном аспекте задачи для получения выгоды. На языке многокритериальной оптимизации компромиссное решение – это отказ в одной из целей для повышения значений другой, насколько необходимо уступить в определенной цели для получения требуемого выигрыша в другой. Компромиссные решения могут измеряться, отслеживая структуру задачи, связи между целями.

146

Это называется целевыми (объективными) компромиссными решениями. Компромиссные решения могут также измеряться тем, насколько ЛПР считает возможным пожертвовать в значении некоторой целевой функции для улучшения другую, то есть субъективные (ЛПР) компромиссные решения.

Рассмотрим два допустимых решенияx1,x2 и соответствующие целевые векторы f x1 и f x2 . Тогда отношение изменения между

1

2

 

1

2

 

fi x1 fi x2

1

2

 

 

f x и f x

 

:

Tij x ,x

 

 

fj x1 fj x2 .

Tij x ,x

 

 

называется час-

тичным компромиссным решением, включающим

 

fi и fj между

x1,x2 , если

 

fl x1 fl x2 , l 1,...,k;l i,j.

Tij x1,x2

называется об-

щим компромиссным решением, включающим fi

и

fj между x1,x2 ,

если l 1,...,k \ i, j : fl x1 fl x2 .

 

 

 

 

Двигаясь от одного Парето-оптимального решения к другому, найдется по крайней мере пара таких целевых функций, что значение одной из них улучшается, а другой – ухудшается. Для непрерывно дифференцируемых задач частное конечных приращений, представ-

ленное Tij x1,x2 , может быть изменено тенденцией бесконечно малого изменения, двигаясь от определенного оптимального по Парето решения x0 вдоль выполнимого направления d. Это приводит к следующей концепции.

Для заданного допустимого решения x0 и допустимого направления d из x0 определяем общую норму компромиссных решений в x0,

включающих fi

и fj

внаправлениеdкак tij x0,d limTij x0

d,x0 .

 

 

 

 

 

 

 

 

0

 

 

 

Если

d

 

допустимое

направление со

свойством

 

 

0: fi x0

d fi x0 , l i, j , то соответствующая tij x0,d на-

зывается частичной нормой компромиссных решений.

 

 

 

Пусть все целевые функции fi

непрерывно дифференцируемы.

Тогда tij x0,d

fi x0 T d

.

 

 

 

 

 

 

 

 

 

 

fj x0 T d

 

 

Далее рассмотрим субъективные концепции принятия компромиссных решений, то есть предпочтения ЛПР принимаются во внимание. Будем считать, что существует неявная функция стоимости

147

v z1,...,zk , которая определяет субъективные предпочтения ЛПР среди допустимых решений.

Для решений x1,x2 , если

f x1 и f x2 лежат на одной кривой

безразличия, соответствующее

компромиссное решение Tij x1,x2

(полное или частичное) известно как компромиссное решений безразличия, включающее fi и fj между x1,x2 .

Пусть все функции fi непрерывно дифференцируемы, рассмотрим компромиссное решение безразличия между fi и fj в фиксиро-

ванной точке x0 с целевым вектором z0 f x0 , который лежит на кривой безразличия v z1,...,zk v0. Если v z0 zi 0, мы можем вы-

разить zi как неявную функцию оставшихся целей (включая zj ): zi zi z1,...,zi 1,zi 1,...,zk .

Для решения x0 и соответствующего z0 норма компромиссного решения безразличия или предельная норма замещения между fi и fj :

mij x0

v z0

 

 

 

 

 

 

 

z

j

. Если применить цепное правило, то получим

v z0

 

 

zi

 

 

 

 

mij x0

zi z1,...,zi 1,zi 1,...,zk

 

 

 

0 .

 

 

 

 

 

zj

 

z z

 

 

 

 

 

 

Предельная норма замещения между fi и

 

fj в x0 представляет

инфинитезимальный декремент значения целевой функции fi, который компенсирует инфинитезимальный инкремент значения целевой функции fj , в то время как значения всех других целевых функций остаются неизменными.

Получение компромиссных решений на Парето-оптимальном множестве. Решая многокритериальную задачу оптимизации с использованием интерактивного метода, важно знать объективные (целевые) компромиссные решения, когда двигаешься от одних Парето оптимальных решений к другим. Это знание может позволить ЛПР решать, искать ли более предпочтительные Парето-оптимальные решения в определенных направлениях. Ключевой вопрос для компромиссных решений, основанных на интерактивных методах, – получение частичных норм компромиссных решений для Парето-

148

оптимальных решений; при этом задача -ограничений играет ключевую роль.

 

При заданной многокритериальной

задаче,

векторе

Rk 1

и

целевой

функции

fi

рассмотрим

задачу

Pi :

min fl x : fl x j, j 1,...,k, j l.

 

 

 

 

 

Пусть допустимое множество Pi непустое;

x0 – оптимальное

решение; обозначим *ij

оптимальные

KKK (Karush-Kuhn-Tucker)

множители, связанные с ограничениями

fj ; если все оптимальные

KKK множители строго позитивны, то *ij

– частичная норма ком-

промиссных решений между целями fi и fj

в направлении dj :

 

 

 

 

 

*ij

fi x0 tij x0,dj , j i,

 

 

 

x 0

 

zj

 

 

 

dj

 

 

 

где

 

 

– эффективное направление, то есть направление,

j

 

 

 

 

 

 

 

 

 

касательное к

 

фронту Парето-оптимального множества

в x0.

Для

минимизируемых

целевых

функций

вектор

N* x0 *i1,..., *i,i 1, 1, *i,i 1,..., *ik может быть интерпретирован как вектор-нормаль к границе Парето оптимального множества.

Пусть wi

 

1

, i 1,...,k, где z** – идеальный целевой век-

0

**

 

zi

zi

тор; z0 f x0 ;

тогда вектор N w1 *i1,..., wk *ik – нормальный

вектор к границе Парето-оптимального множества в z0 .

3.1.3. Методы, основанные на компромиссе

Метод Z-W основан на кусочных линеаризациях задачи и использовании свойств Парето оптимальных решений линейных задач. Метод предполагает: 1) существует вогнутая неявная функция стоимости v; 2) целевые функции и область допустимых решений выпуклые. Удобным (но не обязательным) свойством является аддитивная сепарабильность целевых функций.

Идея метода следующая: Парето-оптимальные решения находятся с помощью метода взвешенных сумм. Затем идентифицируются смежные к текущему решению Парето-оптимальные вершины, соответствующие компромиссные решения представляются ЛПР для

149

формирования его предпочтений по отношению к текущему решению. По этой информации реализуются веса и находится новое решение.

Метод ISWT (interactive surrogate worth trade-off) является инте-

рактивным вариантом метода замещения стоимости принятия компромиссных решений ценности идентификатора объекта. Основная концепция метода основана на замещении стоимости оценки желательности принимаемых компромиссных решений ЛПР полученных Парето-оптимальных решений. Метод предполагает: 1) существует непрерывно дифференцируемая и монотонно уменьшающаяся неявная функция стоимости υ; 2) все функции дважды непрерывно дифференцируемы; 3) область допустимых решений компактная; 4) оптимальные KKK множители обеспечивают частичные компромиссные решения. Метод выполняется следующим образом: определяют Парето-оптимальные решения, используя ε-ограничения; в текущем решении получают целевые компромиссы и показывают ЛПР для оценивания желательности; эта информация формирует вектор верхних пределов и производит новые решения.

Основная идея алгоритма GDF следующая: предполагается существование неявной функции стоимости v, которую ЛПР желает максимизировать в области допустимых решений; применяется алгоритм Franke-Wolfe для решения промежуточных задач. Метод предполагает: 1) область допустимых решений компактная и выпуклая; 2) целевые функции непрерывно дифференцируемы и выпуклы; 3) неявная функция стоимости непрерывно дифференцируемая, монотонно уменьшающаяся и вогнутая.

В методе GDF запрашивают информацию ЛПР о предельных нормах замещений, которые используются для определения восходящего направления функции стоимости; затем используется аппроксимация оптимальной длины шага при оценивании и формируется следующая итерация.

Метод SPOT (sequential proxy optimization technique) – интерак-

тивный алгоритм, разработанный Сакава. Метод основан на допущении существования неявной функции стоимости v ЛПР, которая должна максимизироваться в область допустимых решений с использованием схемы возможных направлений. Для определения оптимальной длины шага используется представляющая функция для мо-

150

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]