
- •Тема 3. Задачи многокритериальной оптимизации
- •1. Многокритериальная оптимизация
- •2. Определение множества Парето
- •Выбор критерия оптимальности.
- •Любые совпадения имен в приведенном примере – случайны! Претензии к автору книги.
- •Решение задач многокритериальной оптимизации с использованием генетических алгоритмов Matlab Optimtool
Выбор критерия оптимальности.
Сложность постановки оптимизационных проектных задач обусловлена наличием у проектируемых объектов нескольких выходных параметров, которые могут быть критериями оптимальности, но, как было отмечено ранее, в задаче оптимизации целевая функция должна быть единственной. Другими словами, проектные задачи обычно являются многокритериальными, и возникает проблема сведения многокритериальной задачи к однокритериальной, т.е. свертки векторного критерия. Задача поиска его экстремума формулируется как задача математического программирования.
В зависимости от того, каким образом выбираются и объединяются выходные параметры в скалярной целевой функции, различают несколько способов выбора критерия оптимальности: это могут быть критерии частные, аддитивные взвешенные, мультипликативные, минимаксные, статистические и др.
(3.1) Частные критерии
Такие критерии могут применяться в случаях, когда среди выходных параметров можно выделить один основной параметр yi(X), наиболее полно отражающий эффективность проектируемого объекта. Этот параметр принимают за целевую функцию, поэтому такой подход именуют иногда «методом главного параметра». Примерами таких параметров могут служить: для энергетического объекта – мощность, для технологической машины – производительность, для транспортного средства – грузоподъемность. Для многих технических объектов таким параметром служит стоимость. Условия работоспособности для всех остальных выходных параметров относят при этом к числу функциональных ограничений. Оптимизация на основе такой постановки задачи называется оптимизацией по частному критерию.
(3.2) Аддитивный критерий
Аддитивный критерий представляет собой линейную свертку частных критериев, он объединяет (свертывает) все выходные параметры в одну целевую функцию, представляющую собой взвешенную сумму частных критериев
F(X) = j=1m aj yj (X), (1.5)
где m – число выходных параметров, aj – весовой коэффициент, определяющий степень важности j-го выходного параметра (обычно значения aj выбираются проектировщиком и в процессе оптимизации остаются постоянными).
Объединение нескольких выходных параметров различной физической размерности в одной скалярной целевой функции требует предварительного нормирования этих параметров. Способы нормирования будут рассмотрены ниже.
Аддитивный критерий часто применяют в случаях, когда условия работоспособности позволяют выделить две группы выходных параметров: те, значения которых следует увеличивать yj+(X) (произодительность, помехоустойчивость, вероятность безотказной работы и т.п.), и те, значения которых следует уменьшать yj–(X) (расход топлива, длительность переходного процесса и др.).
Предполагая, что все yi(X) безразмерны и среди них нет таких, которым соответствуют условия работоспособности типа равенства, для случая минимизации целевой функции свертка векторного критерия будет иметь вид
F(X) = j=1q aj yj–(X) – j=q+1m aj yj+(X) → min . (1.5.б)
Для случая, когда все или основные условия работоспособности имеют вид равенств, целевую функцию можно записать как среднеквадратичное приближение yj(X) к заданным техническим требованиям TTj.
F(X) = j=1m aj [yj (X) – TTj (X)]2 → min. (1.5.в)
Недостатки аддитивного критерия – субъективный подход к выбору весовых коэффициентов и неучет требований ТЗ, т.к. в (1.5) не входят нормы выходных параметров.
Пример: Применение взвешенного аддитивного критерия при проектировании конической зубчатой передачи [Дитрих-1981].
Возможны различные варианты конструкции передачи, которые различаются типами подшипников (шариковые однорядные или двухрядные, роликовые цилиндрические или конические), способами фиксации подшипников в корпусе и на валу, способами регулировки положения подшипников и шестерни и др.
|
В качестве показателей эффективности вариантов конструкции приняты такие выходные параметры, как простота конструкции, технологичность и ряд других свойств, приведенных в таблице; для каждого из показателей установлены весовые коэффициенты, различные для разных типов производства. Для всех показателей принята шкала оценок 1, 2, 3, а для всех весовых коэффициентов – шкала значений 0, 0.5, 1.
Выходные параметры yj |
Весовые коэффициенты aj |
|
единичное производство |
серийное производство |
|
1. Простота конструкции |
1 |
0.5 |
2. Технологичность |
1 |
0.5 |
3. Возможность точной установки |
0.5 |
0.5 |
4. Удобство регулирования зазора между зубьями |
0.5 |
0.5 |
5. Удобство регулирования зазора подшипников |
0 |
0.5 |
6. Доступность регулируемых элементов |
0 |
1 |
7. Обеспечение одинаковой износоустойчивости подшипников |
0 |
1 |
8. Суммарная масса подшипников |
0 |
1 |
При назначении весовых коэффициентов предполагалось, что простота конструкции более важна при единичном производстве, т.к. в серийном производстве усложнение конструкции может быть компенсировано использованием специальных инструментов; влияние массы подшипников (и их стоимости) возрастает с увеличением серийности производства и т.д.
Различные варианты конструкции подверглись экспертной оценке со следующими результатами:
Вариант |
Значения показателей yj для вариантов |
|||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
а |
2 |
2 |
2 |
2 |
2 |
1 |
2 |
3 |
б |
3 |
3 |
2 |
3 |
2 |
1 |
1 |
1 |
в |
2 |
2 |
3 |
2 |
3 |
2 |
2 |
3 |
г |
2 |
2 |
1 |
1 |
3 |
1 |
3 |
3 |
Результаты взвешенной оценки:
Вариант |
Оценка R = (aj yj) для вариантов |
|
единичное производство |
серийное производство |
|
а |
6.0 |
11.0 |
б |
8.5 |
9.5 |
в |
6.5 |
13.0 |
г |
5.0 |
11.5 |
Т. обр., вариант конструкции (б) в наибольшей степени отвечает условиям единичного производства, а вариант (в) – условиям серийного производства.
Весовые коэффициенты являются результатом экспертизы и отражают представление лиц, принимающих решение (ЛПР), о содержании компромисса, который состоит в ранжировании целей разработки.
(3.3) Мультипликативный критерий
Мультипликативный критерий может применяться в тех случаях, когда отсутствуют условия работоспособности типа равенств и выходные параметры не могут принимать нулевые значения. Целевая функция в этом случае имеет вид
F(X) = Пj=1m aj yj (X), (1.6)
Нетрудно видеть, что если прологарифмировать (1.6), то мультипликативный критерий превращается в аддитивный.
Если в задаче можно выделить две группы выходных параметров: yj+(X), значения которых следует увеличивать, и yj–(X), значения которых следует уменьшать, то минимизируемая мультипликативная целевая функция будет иметь вид
F(X) = Пj=1q yj–(X) / Пj=q+1m yj+(X) → min . (1.6.б)
Одним из наиболее существенных недостатков мультипликативного критерия, как и аддитивного, является неучет в постановке задачи технических требований, предъявляемых к выходным параметрам.
(3.4) Максиминные (минимаксные) критерии
Критерии этого типа обеспечивают максимизацию минимально возможного результата или минимизацию максимально возможных потерь. Они широко распространены в задачах исследования операций, в частности в теории игр.
[Вентцель Е.С. Введение в исследование операций, 1964]: Целью теории игр является выработка рекомендаций для разумного поведения противоборствующих сторон в состязательных (конфликтных) ситуациях, т.е. определение оптимальной стратегии каждого из игроков. Оптимальной считается стратегия, которая при многократном повторении игры обеспечивает данному игроку максимально возможный средний выигрыш или, что то же, минимально возможный средний проигрыш.
При выборе этой стратегии предполагается, что противник является вполне разумным и делает все, чтобы помешать нам достичь своей цели. Основной принцип теории игр можно сформулировать так: поведение игрока должно быть рассчитано на наихудший для него образ действий противника.
Решить игру – это значит указать для каждого игрока оптимальные стратегии, гарантирующие при систематическом их применении в среднем наилучший возможный для него результат.
В играх результат действий каждого игрока определяется не только выбором некоторого варианта решения, но и внешними условиями, например, в задачах моделирования боевого применения средств противовоздушной обороны (ПВО) это скорость и высота цели, ее ракурс, дальность стрельбы и др. При сравнении различных вариантов решений по некоторому показателю эффектвности W значения этого показателя зависят от совокупности условий и составляют Wij, где i – номер варианта решения, j – номер варианта условий.
Эти значения можно представить в виде «матрицы эффективности»:
-
Варианты решения
Варианты условий
B1
B2
…
Bn
A1
W11
W12
…
W1n
A2
W21
W22
…
W2n
…
…
…
…
…
Am
Wm1
Wm2
…
Wmn
Эта матрица может быть изображена в виде диаграммы:
Вентцель-1964
|
|
Вентцель-1964
|
|
Для разнообразных условий далеко не всегда один и тот же вариант решения оказывается эффективным во всем диапазоне условий. Возникает задача выбора компромиссного решения, т.е. такого, которое, не будучи оптимальным ни для одного из условий, обладает приемлемой эффективностью во всем их диапазоне.
Важнейшим из условий является вариант поведения, избранный противником.
Пример: Игра «вооружение и самолет».
В распоряжении противника имеются самолеты трех типов С1, С2, С3, в нашем распоряжении – три вида вооружения В1, В2, В3. Ход противника – выбор самолета для боевого задания. Наш ход – выбор вида оружия. Элемент случайности вносится при применении оружия – вооружением В1 самолеты С1, С2, С3 поражаются соответственно с вероятностями 0.5, 0.6, 0.8, вооружением В2 – с вероятностями 0.9, 0.7, 0.8, вооружением В3 – с вероятностями 0.7, 0.5, 0.6. Наша цель – максимизировать вероятность поражения самолета, цель противника – минимизировать ее. Матрица игры имеет вид:
-
Сj
С1
С2
С3
αi – минимумы строк
Вi
В1
0.5
0.6
0.8
0.5
В2
0.9
0.7
0.8
0.7
В3
0.7
0.5
0.6
0.5
βj – максимумы столбцов
0.9
0.7
0.8
Максимальный из минимумов по строкам – максимин, максимальный выигрыш, который гарантирован нам в игре против разумного противника; это нижняя цена игры α. Минимальный из максимумов по столбцам – минимакс, минимальный проигрыш, которого может ожидать противник в расчете на наше наихудшее для него поведение; это верхняя цена игры β.
Здесь нижняя цена игры равна верхней α = β = 0.7. Игры с α = β называются играми с седловой точкой. В матрице такой игры существует элемент, который является одновременно минимальным в своей строке и максимальным в своем столбце. Общее значение нижней и верхней цены игры α = β называют чистой ценой игры.
|
Минимаксные стратегии В2 и С2 являются устойчивыми, т.е. если один из игроков придерживается своей минимаксной стратегии, то другой игрок не может улучшить свое положение, отступая от своей – такое отступление либо не изменит положения, либо ухудшит его. Так, выбор противником самолетов С1 или С3 только повысит вероятность их поражения с 0.7 до 0.9 или 0.8. Пара минимаксных стратегий, соответствующих седловой точке, являются оптимальными стратегиями, а их совокупность называется решением игры.
Методы условной многокритериальной оптимизации
После нахождения множества Парето, если количество точек в нём ≥2, встаёт вопрос о выборе единственного решения. Так как точки на множестве Парето обладают таким свойством, что каждая из них лучше по одному критерию, но хуже по другому, то объективно предпочесть эти точки невозможно. Условная оптимизация предполагает введение условия согласованности в компонентах критерия, которое всегда является хотя и разумным, но субъективным. Подобные условия еще называют схемой компромиссов. Рассмотрим несколько простейших из них.
Принцип равенства критериев. Оптимальным считается вариант, принадлежащий области компромиссов, при котором все значения локальных критериев равны между собой (см. рис. 5.6). Однако случай k1=k2=…=kL может не попасть в область компромиссов или вообще не принадлежать к области допустимых вариантов.
Рис. 5.6
Принцип максимина. Алгоритм выбора включает 2 этапа.
Для каждого варианта i выбирается минимальное значение локального критерия j.
Выбирается тот вариант, для которого наихудший результат (минимум) имеет наилучшее (максимальное) значение.
Кроме указанных простейших приемов применяются более сложные.
1) Метод скаляризации. Здесь формируется некоторая скалярная функция многих переменных:
.
K0 - это скалярная величина, которая обобщает все критерии. Наиболее распространённой разновидностью функции f является линейная функция
ai -вес каждой компоненты критерия, чем эта величина больше, тем большее влияние оказывает этот критерий. Для нестандартных критериев веса могут иметь размерность, причем если Ki→max, то ai≥0, а когда Ki→min, то ai≤0. Подобная комплексная оценка зачастую затруднительна. На практике часто используют и другие способы искусственного объединения нескольких показателей в один обобщённый показатель (критерий). В качестве обобщённого критерия, например, берут дробь:
,
где k1 ... km – увеличиваются,
km+1.. kL - уменьшаются.
Вольное использование подобных критериев чревато тем, что может привести к неправильным рекомендациям.
Общим недостатком «составных критериев» является то, что недостаток эффективности по одному показателю всегда можно скомпенсировать за счёт другого (например, малую вероятность выполнения боевой задачи – за счёт малого расхода боеприпасов и т.п.).
На этот счет известна шутка Л.Н.Толстого, что если представить оценку человека в виде дроби:
Достоинство человека ,
Мнение о себе
то можно получить самую высокую оценку в случае
2) Метод главного
критерия.
В этом методе сначала выбирают главный
критерий и объявляют его единственным
критерием. Все остальные критерии
становятся управляемыми переменными,
на которые накладываются ограничения,
что бы они были не хуже заданной величины
.
Например, если все ki→min
и главный k1,
то получаем однокритериальную задачу
математического программирования
Тогда, эти ограничения войдут в комплекс заданных условий.
Например, в промышленности можно потребовать, что бы прибыль → max, план по ассортименту – выполнен, а себестоимость – не выше заданной.
При бомбардировке – понесённый ущерб противника максимальный, потери и стоимость операции не выходили за известные пределы.
Здесь все показатели эффективности, кроме одного, переводятся в разряд ограничений. Варианты решения, не укладывающиеся в заданные границы, сразу же отбрасываются как недопустимые.
Такой метод чаще всего используется при оптимизации сложных технических систем (самолетов, автомобилей, бытовой техники и т.д.).
3). Метод последовательных уступок. Проранжируем все критерии и расположим их в порядке убывающей важности: k1, k2 …. kL.. Пусть все критерии нужно максимизировать. Сначала отбросим все критерии, кроме k1 и найдем допустимое решение, обращающее в максимум k1 . Как правило при этом другие критерии не получают своих наилучших значений. Поэтому исходя из практических соображений и точности, с какой известны исходные данные, назначается уступка ∆k1 , которую мы согласны допустить для того, чтобы обратить в максимум k2 . Наложим на k1 ограничение, чтобы он был не меньше чем k1*- ∆k1 (k1* - максимально возможное значение k1), и при этом ограничении ищем решение, обращающее в максимум k2. Далее снова назначается уступка в показателе k2, ценой которой находится максимум k3 и т.п.
На втором этапе решаем задачу
И так далее.
Такой способ хорош тем, что здесь сразу видно, ценой какой «уступки» в одном показателе приобретается выигрыш в другом. Заметим, что иногда даже при малом ∆k «свобода» выбора позволяет достичь существенной оптимизации k2 . Это зависит от вида границы критериального пространства (см. рис. 5.8).
Рис. 5.8
4. Метод последовательной оптимизации. В некоторых случаях критерии системы не слишком связаны друг с другом, т.е. улучшение одного критерия, по крайней мере в ограниченных пределах, не «мешает» другому. Это характерно для сложных систем, состоящих из отдельных достаточно автономных подсистем (например: процессор компьютера, система электропитания, система отображения), когда отдельные критерии относятся к этим подсистемам. Расположим все критерии в порядке убывания важности. Сначала оптимизируют систему по важнейшему показателю, отбросив все остальные, затем по второму, и т. д.
Следует отметить, что в вышеприведенных методах используется процедура упорядочения критериев по важности. Эта самостоятельная проблема является достаточно сложной и поэтому решается на основе методов экспертных оценок.
4) Примеры. Пример1 – оптимизация в задаче подбора кандидатуры невесты в брачной конторе [Португал В.М. Беседы об АСУ, 1977].