Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

2488

.pdf
Скачиваний:
6
Добавлен:
07.01.2021
Размер:
12.38 Mб
Скачать

делирования локального поведения (неизвестной) функции стоимости.

Используется задача ε-ограничений для определения Паретооптимальных решений и получения информации о компромиссах в текущем решении; запрашивают ЛПР для формирования предельных норм замещения. Метод предполагает: 1) неявная функция стоимости непрерывно дифференцируема, вогнутая и строго монотонно уменьшается; 2) все целевые функции выпуклы и дважды непрерывно дифференцируемы; 3) область допустимых решений компактная и выпуклая; 4) оптимальные KKK множители обеспечивают частичные компромиссные решения. Итерации организованы следующим образом: задача ε-ограничений используется для определения Паретооптимальных решений; запрашивается ЛПР о предельных нормах замещения, которые используются для нахождения направления поиска. Оптимальная длина шага аппроксимируется представляющей функцией и вектор границ обновляется для нахождения следующей итерации.

Метод GRIST (gradient based interactive step trade-off) разработал Янг. Он разработан для решения общих (не обязательно выпуклых) дифференцируемых задач со связным (k−1)-мерным Парето-опти- мальным множеством. В методе проецируется вектор, определенный предельными нормами замещения, задаваемыми ЛПР на плоскость, касательную к Парето-оптимальной границе при текущей итерации. Эта проекция – направление возрастания функции стоимости; опорная точка, полученная в этом направлении, формирует следующую итерацию. Метод предполагает: 1) неявная функция стоимости непрерывно дифференцируемая и строго уменьшается; 2) целевые функции непрерывно дифференцируемы; 3) область допустимых решений компактная; 4) Парето-оптимальное множество связное и имеет размерность (k−1); 5) сформированные решения регулярные. В GRIST запрашивается ЛПР для формирования предельной нормы замещения. Соответствующий вектор проецируется на плоскость, касательную к Парето-оптимальной границе, и оценивается длина шага; полученная точка проецируется на Парето-оптимальное множество, что приводит к новому решению.

Укажем особенности описанных методов.

Сходимость. Может быть доказана сходимость всех методов к оптимуму неявной функции стоимости.

Информация. Информация предпочтений, запрашиваемая от

151

ЛПР, незначительная для метода Z-W (запрашивается желательность предложенных компромиссов), значительная интенсивно для методов SPOT, GDF, GRIST (запрашиваются предельные нормы замещения на текущей итерации) и очень значительная для метода ISWT (запрашивается замещение стоимости для каждого компромисса).

Тип задачи. Метод Z-W имеет дело с выпуклыми задачами, для которых может быть выполнена кусочная линеаризация. Метод GDF проектирован для выпуклых задач. Методы SPOT и ISWT допускают отсутствие выпуклости. Метод GRIST предполагает, что Паретооптимальное множество связное и полноразмерное.

Парето-оптимальность решений не гарантируется в методе GDF; все другие методы гарантируют Парето-оптимальность окончательных решений.

3.1.4. Интерактивные методы опорной точки

Разделение моделей предпочтения и реальных моделей. В

системе поддержки принятия решений необходимо различать субъективную часть, представленную моделями предпочтения, и объективную часть, представленную реальными моделями целей. Реальная модель имеет следующую формулу: y F x,v,a x S; где y – выходной вектор результатов; x – вектор решений, которым управляет пользователь; v – вектор возмущений, которым не управляет пользователь; a

– вектор параметров модели; F – вектор функций (целей и ограничений); S – множество допустимых решений. Форма немного сложнее, чем z f x ; последняя форма – упрощение фактической сложности моделей, включающих множественные цели.

Реальная модель включает спецификации ограничений. Реальная модель не должна представить предпочтения ЛПР, кроме одного аспекта: количество результатов в этой модели должно быть достаточно большим для использования их в представлении структуры предпочтений P x, y ЛПР. Методы опорной точки предполагают, что структура предпочтений должна быть общей, т. к. детализация структуры нарушает право ЛПР изменить предпочтения. Общая специфика содержит отбор (ЛПР) результатов для измерения качества решений, целей или критериев. Второй уровень специфики в методах опорной точки состав опорных точек (желательные значения целевой функции). Детализация предпочтений может включать идентификацию

152

функции стоимости, однако в методах опорной точки акцентируются на изучении вместо идентификации.

Нелинейность предпочтений. Предпочтения ЛПР имеют нели-

нейный характер. Любое линейное приближение предпочтений деформирует их в сторону несбалансированных решений. Возможно линейное агрегирование, но у него есть несколько недостатков: 1) взвешенная сумма имеет тенденцию поддерживать решения с несбалансированными целями (Korhonen парадокс); ЛПР предпочитает сбалансированные решения; 2) взвешенная сумма основана на неявном предположении, что анализ компромисса применим ко всем целевым функциям; в экономических приложениях обычно не сталкиваются с компенсационным характером целей. Линейная взвешенная сумма слишком упрощена в представлении типичных человеческих предпочтений, которые часто нелинейные; используя этот упрощенный подход, можно получить неблагоприятные побочные эффекты.

Целостное восприятие целей. Третье предположение методов опорной точки состоит в том, что ЛПР выбирает решение, используя целостную оценку ситуации решения; DSS должна сообщить ЛПР об области релевантности значений целевой функции: 1) диапазоны це-

левых функций включают определение нижнего zloj и верхнего zupj

пределов допустимых решений; 2) Парето-оптимальные диапазоны целей рассчитываются для Парето-оптимальных решений; нижняя

(идеальная) граница zloj обычно равна z*j ; верхняя znadj – надир целей. Часто используют относительные значения целевых функций:

zrelj fjrel x

f

x zlow

 

j

j

.

 

up

low

 

 

zj

zj

Опорные точки как инструмент целостного изучения. Другое предположение методов опорной точки состоит в том, что опорные точки рассматриваются как инструмент адаптивного, целостного изучения ситуационного пространства.

Функции достижимости предназначены для аппроксимации значений. Учитывая частичную информацию о предпочтениях, их нелинейностях и информацию о положении опорных точек в диапазонах целевой функции, может быть предложена аппроксимация нелинейной функции стоимости, совместимая с этой информацией.

Независимость ЛПР. Функции достижимости имеют свойство полной управляемости: любые Парето-оптимальные решения могут

153

быть выбраны ЛПР модификацией опорных точек и максимизацией функций достижимости. Это обеспечивает независимость ЛПР.

Конечные цели: поддержка интуиции в отличие от рациональной объективности. Основная цель поддержки субъективных ЛПР – усиление его интуиции за счет целостного изучения пространства решений.

Особенности методов опорной точки. Большое несоответствие между противоположными концами спектра методов выявления предпочтений указывает на необходимость среднего подхода, достаточно простого и адаптивного, но не упрощенного. Процесс интерактивного принятия решений с использованием методов опорной точки состоит из следующих шагов: 1) ЛПР определяет опорные точки; DSS вычисляет нейтральные решения, реакцию на опорные уровни, расположенные в центре диапазонов целевой функции; 2) DSS реагирует максимизацией функции достижения нелинейной агрегацией целевых функций, интерпретируемых как адаптивное приближение функции стоимости ЛПР, основанной на информации о диапазонах целевых функций и позиционировании предпочтений в этих диапазонах; 3) ЛПР свободен в возможности изменения опорных точек. Он использует эту свободу для зондирования Парето-оптимального множества.

Для определения функции достижимости найдем достижимости для каждой целевой функции, трансформируя их:

 

 

 

 

a

zj zaj

zloj ;если

 

 

 

 

1 zj

zloj

zj zaj ;

 

 

 

 

zrj zj

 

 

 

 

 

 

 

a

r

 

 

 

 

;если

a

 

r

j zj,zj

,zj

=

 

 

zrj

 

 

zj

zj zj ;

 

 

 

 

 

zaj

 

 

 

 

 

 

 

 

zrj zj

 

 

r

;если

 

r

up

 

 

 

 

up

 

zj zj zj .

 

 

 

 

 

zj

 

zj

 

 

 

 

Коэффициенты , выбираются для формирования вогнутости этой функции. Значение j zj,zaj ,zrj этой функции достижимости (где zj fj x ;x S для данного вектора решения x) выражает уровень удовлетворения с целью j. После преобразования всех значений целевой функции можно использовать следующую форму максимизируемой функции достижения:

z,za,zr min j zj,zaj ,zrj

j zj,zaj ,zrj ,

j 1..k

j 1..k

154

где z вектор целей; za вектор желаемых уровней; zr вектор уровней резервирования; 0 регуляризующий коэффициент.

Функция достижимости имеет важное свойство управляемости; при малых значениях 0 для любой точки z в множестве Паретооптимальных векторов целей можно выбрать такие опорные уровни, что максимум функции достижимости будет достигнут точно в этой точке; если 0, все максимумы функции достижимости соответствуют Парето-оптимальным решениям. Таким образом, поведение функций достижимости соответствует функции стоимости и взвешенным суммам.

3.1.5. Методы, основанные на классификации

Согласно определению Парето-оптимальности движение от одного Парето-оптимального решения к другому подразумевает компромисс: двигаться к другому Парето-оптимальному решению, улучшая некоторые значения целевых функций, при этом другие значения целевых функций могут ухудшаться. Методы, основанные на классификации, подразумевают, что ЛПР указывает свои предпочтения, классифицируя целевые функции. ЛПР представляют текущие Паре- то-оптимальные решения и спрашивают, какие изменения в значениях целевой функции привели бы к более предпочтительному решению. Классификация интуитивный путь для ЛПР к прямому процессу получения для нахождения предпочтительных решений. У ЛПР можно также запросить желаемое количество улучшений и разрешенное количество ухудшений. С методами классификации связана идея выразить предпочтения как опорную точку. Однако классификация предполагает, что некоторым целевым функциям можно позволить ухудшиться, а опорная точка может быть выбрана более свободно.

Критерии останова в методах классификации используют опорные точки так, чтобы удовлетворение ЛПР было самым важным критерием останова. ЛПР классифицирует целевые функции fi: 1) I

чьи значения должны быть улучшены от текущего уровня; 2) I чьи значения должны улучшиться до некоторого желаемого уровня;

3)I чьи значения являются приемлемыми для текущего решения;

4)I чьи значения могут быть ослаблены до некоторого верхнего предела; 5) I чьи значения могут изменяться свободно.

155

Классификация выполнима, только если I I 0 I I 0 и ЛПР должен классифицировать все целевые функции.

Метод STOM основан на концепции, аналогичной подходу опорной точки,нососредоточеннанахожденииудовлетворительных решений.

У ЛПР запрашивают информацию для отнесения целевых функций к одному из трёх классов: 1) значения целевых функций должны улучшиться I ; 2) значения целевых функций могут быть ослаблены

I ; 3) значения целевых функций

являются приемлемыми

I . ЛПР

определяет уровни для функций

в I ,I ,I ;I I I

1,...,k .

Нагрузка (количество информации) на ЛПР должна быть уменьшена.

Собирая информацию о желательных значениях функций, верхних пределах и текущих приемлемых значениях функций, получим опорную точку zih. В STOM могут использоваться различные методы скаляризации, но все методы должны минимизировать норму идеального вектора целей, например:

fi x zi**

k

 

fi x

 

 

 

**

; i 1,...,k .

 

 

 

 

 

 

minimize max

 

 

 

 

 

 

 

 

;x S;zi

zi

 

z

ih zi**

 

z

ih zi**

i 1,...,k

 

 

i 1

 

 

 

 

 

Полученные решения Парето оптимальны.

Процесс решений может быть начат с запроса ЛПР определения опорной точки; затем ЛПР запрашивают классифицировать целевые

функции и определить уровни функций I ,I ,I . Процесс решений продолжается, пока ЛПР не будет улучшать/ухудшать значения целевой функции.

STEM (step method) интерактивный метод, позволяющий ЛПР искать желательное решение. Метод основан на -норме и обеспечивает процедуру, последовательно редуцирующую область поиска. STEM использует базовую минимаксную модель для отыскания эффективногорешения: min d ; j fj x fj* d , j 1,...,k, x 0 .

При использовании STEM для линейных задач

n

, j 1,...,k; x

 

Ax b,x 0

 

 

fj x cjixj

 

 

 

 

 

 

j 1

 

 

 

j

 

веса определяются следующим образом: j

, где

k

i

i 1

156

 

 

 

fjmax fj

x

j

 

 

n

2

1/2

 

 

 

 

 

 

 

 

j

 

 

 

 

 

 

 

 

cji

; fj

x

j

минимальное значение

 

fjmax

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

fj x ;

fjmax максимальное (наихудшее) значение

fj x . Веса долж-

k

ны быть нормализованы: j 1; 0 j 1.

j 1

Если ЛПР удовлетворен оптимальным решением, оно может использоваться как лучшее компромиссное решение. Иначе ЛПР должен оценить результаты, провести анализ компромиссных решений среди целевых функций и определить направление поиска.

Улучшение цели от эффективного решения может быть достигнуто за счет других целей; ЛПР должен пожертвовать по крайней мере одной целью, чтобы улучшить другую цель.

Интерактивный процесс включает две стадии: извлечение привилегированной информации и формирование эффективного решения. Новые ограничения добавляются к первоначальному пространству решений. Решение обновленной задачи приведет к новому эффективному решению.

Предположим, что целевая функция fl x может быть изменена от текущего значения fl xi на fl xi , в то время как все другие целевые функции должны быть сохранены. Тогда новая однокритериальная задача оптимизации может быть сформулирована следующим образом:

 

 

 

min

d ; j fj x fj* d , j 1,...,k, j l; x i 1,

 

 

i 1

 

 

i

, j 1,...,k, j l

 

 

 

 

 

 

где

 

 

 

fj x fj x

 

, решение которой приве-

 

x

 

fl x fl xi fl xi ;x i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

дет к новому эффективному решению.

GAs (GA) имеют три основных направления: исследование в области генетических алгоритмов, оптимизация с использованием генетических алгоритмов и обучение с классифицирующими системами.

GAs появились в результате моделирования процессов, наблюдаемых при эволюции природы (например, биологические процессы). Эволюция отражается на хромосомах устройствах кодирования структур живых существ. Используются следующие особенности теории эволюции: эволюционные процессы воздействует на хромосомы, которые кодируются; процессы естественного отбора формируют

157

«успешные» хромосомы; процессы репродукции – отправная точка эволюции; процесс репродукции может создавать различные хромосомы в следующих поколениях, комбинируя материал от хромосом родителей; мутации могут воздействовать на хромосомы следующих поколений; эволюция не имеет памяти.

Джон Холланд полагал, что GAs могут привести к методике решения проблемы при формировании соответствующего компьютерного алгоритма. Он начал исследование алгоритмов, которые манипулировали строками двоичных цифр, представляющих хромосомы. Алгоритмы Холланда моделировали эволюцию на популяции таких хромосом. Используя механизмы кодирования и репродукции, алгоритмы решали трудные задачи. В настоящее время GAs стохастические глобальные методы поиска, подражающие естественной биологической эволюции. Применяя правило выживания, наиболее пригодного для формирования лучшего приближения к решению, GAs оперируют на популяции потенциальных решений. Новое множество приближений в каждом поколении формируется в процессе селекции хромосом, согласно их уровню приспособленности к проблемной области, и размножению с использованием операций, заимствованных от генетики (скрещивание и мутация).

Рассмотрим два механизма, связывающие GAs с задачами, которые они решают: кодирование хромосомами решений задачи и возвращение меры ценности любой хромосомы в контексте задачи. Функция эволюции – звено между генетическим алгоритмом и решаемой задачей. Функция эволюции имеет хромосому (как вход) и возвращает список чисел, который является мерой характеристик хромосомы.

Предполагается, что заданы следующие начальные данные: задача, механизм кодирования решений и функция, которая измеряет, насколько подходит кодирование. Базовая структура GAs: инициализация популяции хромосом; эволюция каждой хромосомы в популяции; создание новых хромосом скрещиванием текущих хромосом; удаление некоторых элементов популяции для создания пространства для новых хромосом; внесение новых хромосом в популяцию; получение лучшей хромосомы и переход к скрещиванию.

Отличие Gas от традиционных методов оптимизации: GAs ищут на популяции точек, а не на одной точке; GAs не запрашивают вспомогательную информацию о целевой функции; GAs используют веро-

158

ятностные правила перехода; GAs могут работать на различных кодированиях множества параметров.

Многокритериальная оптимизация с GAs. Множественные ха-

рактеристики многокритериальных задач должны быть преобразованы в скалярный критерий перед применением GAs. В задачах, где отсутствует глобальный критерий цели, объединяются посредством агрегирующих функций. Оптимизация агрегированных целей не требует взаимодействия с ЛПР. Однако если решение не является компромиссным, агрегирующая функция требует перестройки. Будут следовать следующие поколения оптимизации до тех пор, пока соответствующее решение не будет найдено; недоминирующие решения обеспечивают требуемые варианты; но такие варианты могут не быть оптимальными, так как алгоритм рассматривает их как квазиоптимальные.

Оптимизация с ограничениями. Учет ограничений в GAs зада-

ет произвольно низкое соответствие подчиненным индивидуумам. Это дает возможность GAs справиться с разрывами, возникающими на границах ограничений. В этом подходе, если выполнимые решения могут быть найдены, любые подчиненные индивидуумы выбираются и на поиск не влияют. Случай, когда выполнимые индивидуумы неизвестны, приводит к тому, что начальные стадии эволюции вырождаются в метод случайного блуждания назначением низкого соответствия подчиненным индивидуумам. Можно сформировать штраф на подчиненные индивидуумы, зависящий от степени нарушения ограничений.

Оптимизация не по Парето. Шаффер указал на необходимость рассмотрения вектора аппроксимирующих решений POF (ParetoOptimal Front). Более ранние алгоритмы пыталась найти только одну Парето оптимальную точку. VEGA (vector evaluated genetic algorithm)

выбирает различные части популяции, основан на различных критериях. В каждом поколении популяция разделена на M групп, каждая группа соответствует своему критерию и селекция применяется к каждой группе отдельно. Результирующие группы рекомбинируются для формирования исходной популяции и применяется скрещивание, как в стандартных GA. Таким образом, индивидуумы выбираются только для одной цели, но, возможно, следующее поколение будет создано от родителей с различными целями. Поскольку селекция основана на индивидуальных целях, VEGA выбирает индивидуумы из «крайних» POF они выступают хорошо для одной цели, они не-

159

удовлетворительны для других. Курсаве использовал «лексическое упорядочение» индивидуумов для отбора в эволюционных алгоритмах. При лексическом упорядочении популяция упорядочена каждым критерием по порядку «важности».

Парето оптимизация. Другой класс методов GAs оптимизации, основанных на ранжировании согласно концепции Парето оптимальности, гарантирует равную вероятность репродуцирования всем недоминирующих индивидуумам. Задачи с невыпуклыми поверхностями принятия компромиссных решений представляют трудности для методов сумм с весами, не вызывают дополнительных результатов при оптимизации Парето. Парето упорядочение комбинирует доминирование с информацией предпочтений для формирования стратегии подходящего назначения. Процесс GAs оптимизации результат взаимодействия между ЛПР и технологий GAs поиска.

Взаимозависимость критериев

Врожденное свойство многокритериального принятия решения интуитивное предположение, что все критерии независимы; такое предположение позволяет получить решение многокритериальной задачи, поскольку не было методов работы со взаимозависимостью. Однако множественные цели обычно представляют противоречивые интересы. Не учитывая взаимозависимости критериев, задачи существенно упрощаются и решения не отражают реальное состояние задачи. Существуют другие обстоятельства, ограничивающие полно-

ценность MCDM (multiple criteria decision making – многокритериаль-

ное принятие решений): 1) нехватка времени сокращает количество учитываемых критериев; 2) чем более полное и точное определение задачи, тем меньше необходимо критериев; 3) автономные ЛПР должны использовать больше критериев, чем ЛПР, которыми управляет иерархическая система ПР; 4) изоляция от возмущений окружения редуцирует потребность во множественных критериях.

Определим взаимозависимости между целями в терминах множе-

ственных целей. Рассмотрим следующую задачу: max f1 x ,...,fk x ,

x X

где fi x целевые функции; x – вектор решений.

Пусть fi x , fj x целевые функции. Будем считать, что:

160

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]