Теория принятия решений / pdf / Dec_make1
.pdfоптимальности является совершенно иным, чем в математическом программировании. Этим занимается теория игр.
7.Во многих задачах принимаются групповые решения, при этом на основе экспертизы выявляется желание этой группы, т.е. исследователь отделяется
от эксперта. В результате обработки мнений экспертов исследователь получает критерий. Кроме этого, принятие решения является многократным.
Если в какой-то задаче присутствуют все семь проблем – она неразрешима.
1.2.1. Задача принятия решения
Задачей принятия решения назовем пару (Ω, Ρ), где: Ω – множество вариантов (альтернатив);
Р – принцип оптимальности.
Решением задачи является множество ΩР Ω, получающееся в соответствии с
принципом оптимальности Р.
Отсутствие хотя бы одного из элементов (Ω, Ρ) лишает задачу смысла. Математическим выражением принципа оптимальности Р служит функция
выбора Ср, которая сопоставляет со всеми подмножествами Х Ω подмножество Ср(х). Таким образом, решением исходной задачи является Ср(Ω).
Тип задачи принятия решения различается в зависимости от информации о множестве Ω и принципе оптимальности Р:
1.Общая задача принятия решения: Ω, Р – неизвестны, необходимо ΩР получить в процессе самого решения.
2.Задача с известными Ω называется задачей выбора.
3.Задача, в которой Ω и Ρ известны, называется общей задачей оптимальности.
1.3.Принятие решений в условиях определенности
В качестве методов математического моделирования задач принятия решений в условиях определенности традиционно используются критериальный анализ, линейное и нелинейное программирование. Все эти подходы основаны на систематизированном анализе, в процессе которого используемые количественные оценки должны помочь ЛПР уяснить для себя, какой курс действий ему следует выбрать.
Линейное и нелинейное программирование используется в задачах с одним критерием выбора решения и набором ограничений на веденные переменные. В курсе ТПР эти задачи рассматриваются как задачи однокритериального анализа, то есть как частный случай многокритериального анализа.
1.3.1. Постановка задачи. Основные понятия
При постановке задачи критериального анализа предполагается, что у ЛПР есть несколько вариантов выбора, несколько альтернатив u U, где U – множество возможных альтернатив, включающее не менее двух элементов. В зависимости от характера задачи множество U может быть как непрерывным, так и дискретным. Если решается задача стратегического плана, то под u обычно понимается стратегия, то есть набор правил, определяющих состав и порядок действий в любой из возможных ситуаций, а множество U в этом случае дискретно и конечно.
11
При решении задач тактического плана, например, выборе варианта какого-либо проекта, распределения средств между объектами, определения состава различных видов городского транспорта множество U может быть как непрерывным, так и дискретным.
Внашем курсе будем полагать, что U дискретно и счетно, а u – эмпирический объект, задаваемый "своим именем" (например, названия банков).
Выбор из множества альтернатив происходит на основании заранее заданной системы или отношения предпочтений Р. В критериальном анализе предпочтения задаются в виде некоторого набора характеристик, которые обозначаются k и называются (частными) критериями.
Вобщем виде k естьфункция от альтернативы u: k(u);
U = (u1, u2, … un), n – число альтернатив.
Векторный критерий K(u) = (k1(u), k2(u), … km(u)), где m – число частных критериев ki(u).
1.Если m = 1. то получается однокритериальная задача, то есть задача математического программирования.
2.Если m > 1, но k(u) P k(v) , то имеем тривиальный вариант, так как u всегда лучше v.
3.Если по одним критериям вариант u предпочтительнее варианта v, а по другим – наоборот, то это задача критериального анализа, способы решения
которой будут рассмотрены в этом курсе.
Введем обозначения: K (u) P K (v) – вариант u предпочтительнее v, K (u) I K (v) – варианты одинаковы по предпочтению, K(u) N K(v) – варианты несравнимы.
1.3.2. Формирование критериальной системы
Для формулировки задачи критериального анализа необходимо:
1.Четко сформулировать цель, задачу и требуемый результат.
2.Классифицировать характеристики вариантов.
3.Беспристрастно выбрать критерии.
Требования к критериальной системе:
1.Соответствие критериев цели и задаче.
2.Критичность. Критерий должен быть "чувствительным" к изменению варианта выбора.
3.Вычислимость критериев.
4.Полнота и минимальность. С одной стороны, критериальная система должна как можно полнее описывать варианты выбора, но чем векторный критерий меньше, тем проще решается задача. Полнота критериальной системы формально означает, что введение дополнительного частного критерия не изменит вариант выбора, все частные критерии должны быть учтены.
5.Декомпозируемость. Векторный критерий должен допускать упрощение задачи путем перехода к рассмотрению отдельных частных критериев вне зависимости от других. Это требование сводится к вопросу о независимости частных критериев по предпочтению.
В каждом конкретной задаче необходимо проводить проверку критериев на независимость, которая сводится к следующему.
12
Если есть U = (u,v,s,t) - множество альтернатив - и варианты u и v такие, что дляj ≠ i верно kj(u) = kj(v), а ki(u) ≠ ki(v), причем К(u)PК(v); варианты s и t такие, что для j ≠ i верно kj(s) = kj(t) ≠ kj(u), при ki(s) = ki(u), ki(t) = ki(v). Если отсюда следует, что К(s)РК(t), то говорят, что i-тый векторный критерий независим по предпочтению от всех частных критериев. В противном случае методически удобнее при решении таких задач перейти к новой постановке, где предпочтительным было бы изменение всех частных критериев, например в сторону увеличения. При этом, если в исходной постановке задачи для части критериев предпочтительнее меньшее значение, то в новой постановке значения таких критериев рассматриваются с противоположным знаком.
Независимость по предпочтению частных критериев дает возможность перейти от задачи сравнения векторных критериев с m частными критериями к решению m однокритериальных задач сравнения частных критериев между собой. В реальных задачах допущение о независимости частных критериев по предпочтению зависит от характера решаемого вопроса. Например, если в качестве частных критериев используют затраты, надежность, прибыль, льготы, то для них всегда наиболее предпочтительным будет экстремальное значение (min или max) вне зависимости от других частных критериев.
Если частные критерии определяют структуру сравниваемых объектов, например, рост и вес человека, количество наземного и подземного транспорта в городе, количество тепловых, атомных и гидроэлектростанций, то они обычно зависимы по предпочтению.
Необходимо отметить, что переход от зависимых частных критериев к независимым иногда связан с более "тонким" анализом самих предпочтений.
1.3.3. Аксиома Парето и эффективные варианты
Сравнение между собой векторных критериев представляет собой достаточно сложную проблему.
Пример. U = (u,v,s, t) – множество альтернатив
|
k1 |
k2 |
k3 |
u |
5 |
3 |
7 |
v |
4 |
3 |
6 |
s |
5 |
2 |
7 |
t |
6 |
3 |
1 |
k(u) ≥ k(v), i =1,2,3, поэтому K(u)PK(v).
k(u) ≥ k(s), i =1,2,3, поэтому K(u)PK(s), варианты s и v оказались доминируемыми, а остальные векторные оценки сравнить невозможно: k(u)Nk(t). Таким образом все множество векторных оценок делится на два подмножества: эффективных {k(u), k(t)} и неэффективных {k(v), k(s)} векторных оценок. Из приведенного примера можно сделать важный вывод: если некоторый вариант имеет абсолютный экстремум по какому-либо показателю, то он не может быть доминирован.
Аксиома Парето: Пусть даны две векторные оценки:
K(u) = (k1(u), k2(u), ... km(u)) и K(v)= (k1(v), k2(v), … km(v))
K(u)PK(v), если существует хотя бы одно j от 1 до m такое что:
i ≠ j ki(u) I ki(v), или ki(u)Pki(v), а kj(u)Pkj(v).
Отношение P называется "предпочтительность в смысле Парето".
13
Все векторные оценки, для которых не существует более предпочтительных в смысле Парето векторных оценок, образуют множество H0 эффективных векторных оценок, а соответствующие варианты – множество v0 эффективных вариантов.
Для предыдущего примера: H = {K(u), K(v), K(s), K(t)}, H0 = {K(u), K(t)} –
множество эффективных векторных оценок. Определение множеств эффективных векторных оценок обычно не позволяет получить в чистом виде решение задачи, но является важным и обязательным этапом, так как практически всегда происходит сокращение имеющихся вариантов. Кроме того, для H0 и v0 могут выполняться допущения, неверные для H и v, то есть задача в дальнейшем может упрощаться за счет дополнительных правил или информации, полученной после сокращения списка вариантов.
Принадлежность полученного решения к v0 – некоторая гарантия правильности результата. Полученное множество оптимальных векторных оценок последовательно сужается с использованием дополнительной информации, искусственных методов или с помощью введения новых правил. Рассмотрим некоторые из применяемых для этого подходов.
1.3.4. Важность частных критериев и использование дополнительной информации для принятия решения
Если при выборе того или иного варианта использование принципа Парето не дает единственного решения, необходимо найти способы сужения возможного выбора из множества эффективных вариантов. До сих пор предполагалось, что все критерии одинаковы по важности и одинаково влияют на предпочтительность векторного критерия. На самом деле часто превосходство по наиболее важным частным критериям ведет к предпочтительности векторной оценки в целом. Понятие относительной важности частных критериев возможно будет определить, только когда они будут сравнимы (иначе как определить, что лучше - 200 тонн или 10 км). Чтобы разрешить эту проблему, используют процедуру нормализации.
Частные критерии считаются нормализованными, если области их изменения совпадают.
Нормализацию проводят различными способами - от применения более грубых шкал при измерении оценок до вычисления разного рада статистик. Наибольшее распространение получила статистика вида:
ki(v) - min ki(v)
ki' (v) = --------------------------
maxi k(v) - mini k(v)
Она удобна тем, что все ki(v) [0; 1], причем min k'i(v) = 0, max k'i(v) = 1. Таким образом, нормализованный частный критерий показывает, на какую часть всего диапазона изменений [0; 1] текущее значение этого критерия превосходит его минимальное значение.
Пример.
|
|
Исходные значения |
Нормированные значения |
||||
|
k1 |
|
k2 |
k3 |
k’1 |
k’2 |
k’3 |
K(u) |
80 |
|
0,12 |
0,0030 |
0,10 |
0,60 |
0,77 |
K(v) |
70 |
|
0,06 |
0,0107 |
0 |
0 |
1 |
K(w) |
170 |
|
0,16 |
0,0007 |
1 |
1 |
0 |
14
После нормализации частных критериев векторные критерии приобретают некоторые полезные свойства. Главное из них - любая перестановка частных критериев приводит к векторной оценке, которая входит во множество значений исходной векторной оценки.
Важным качеством дополнительной информации является ее полнота и непротиворечивость. Графически полнота информации хорошо иллюстрируется с помощью графа отношений по важности на множестве вершин, соответствующих частным критериям, с ориентированными (B) или неориентированными (S) ребрами, в котором (в случае полноты) должна быть возможность построить путь между любой парой вершин. Графически противоречивость информации отображается наличием циклов (замкнутых путей) с ориентированными ребрами.
1.3.5. Методы сравнения векторных оценок с использованием дополнительной информации
С помощью нормализации частных критериев строятся пошаговые математические алгоритмы сужения исходного множества векторных критериев до единственного решения, которое можно оценить с заданной точностью. На каждом новом шаге обычно требуется новая уточняющая информация о важности критериев, что делает эти (многошаговые) методы трудоемкими. Более удобными для использования на практике, но менее точными являются одношаговые методы.
В одношаговых методах вся исходная информация задается сразу при постановке задачи. Как правило, одношаговые методы позволяют получить единственное решение, но принимаемые при этом допущения настолько сильны, что использовать их разумно только для первичных оценок, прикидок или при принятии не ответственных решений.
Одношаговые методы делятся на две подгруппы: эвристические (не имеют строгого обоснования, применяются только для конкретных типов задач) и аксиоматические (базируются на некоторой системе аксиом).
Среди эвристических одношаговых методов наиболее наглядным является метод главного критерия. Суть этого метода заключается в том, что среди частных критериев выбирается один, который назначается главным. На остальные частные критерии налагаются ограничения с помощью порогов допустимых значений. После этого задача сводится к задаче линейного программирования на отыскание условного экстремума. При этом нормализация исходных данных необязательна.
1.4. Основы многокритериальной оптимизации
Во многих задачах одного критерия качества недостаточно, приходится назначать много критериев. Часто оказывается, что изменение одного критерия влечет за собой изменение другого критерия. Существует принципиальная трудность в оценке двух или более вариантов. Особенно если их оценивать безусловно. Векторная оптимизация обычно состоит из двух этапов:
1.Безусловная оптимизация, когда пытаются определить безусловно лучшее решение. Это обычно не удается, но после этапа безусловной оптимизации можно отсеять заведомо невыгодные решения, т.е. безусловно сравнимые и худшие. Поэтому несравнимые, но и не плохие остаются, они образуют множество эффективных решений – множество Парето.
15
2.Условная оптимизация: для нахождения наилучшего решения приходится вводить некоторые условия, например, предпочтения, или выбирать из всех критериев наиболее важный.
1.4.1. Определение множества Парето |
|
|||
Непрерывный случай |
|
|||
Пусть X R |
|
= f (X1, X 2 , , X n )−множество |
точек, в котором небольшое |
|
W |
||||
улучшение |
X влечёт за собой небольшое изменение W . Пусть есть два показателя |
|||
(критерия) |
(W1 ,W2 ). |
|
||
Сравним безусловную пару вариантов: третий |
безусловно лучше второго и |
|||
первого. На дуге AB находятся лучшие точки при W1 = const , а на дуге CD лучшие точки при W2 = const . Поэтому точками множества Парето будут являться точки, находящиеся на дуге CB .
W2 |
C 3 |
|
|
A |
|
|
2 |
B |
|
1 |
|
|
|
|
|
|
D |
W1
Метод отбора конусом. Конус – часть телесного угла, ограниченного областью, соответствующей направлениям оптимизации конкретного критерия. Если критерии независимы, то угол между образующими конуса – 90°.
Если для двух критериев: k1 ↑ и k2 ↓, то конус будет таким:
k1
k2
Конус устанавливают на границу критериального множества и обходят все ее точки. Тогда, если ни один луч не пересекает область допустимых значений критериев, то вершина конуса стоит на точке Парето.
Пример: k1 → min k2 → min
k2
k1
16
Дискретный случай
Существует несколько алгоритмов нахождения множества Парето для дискретного множества точек. Они зависят от того, в каком виде задано множество вариантов критериев. В практических заданиях приходится сначала получать само множество критериев. Основной метод нахождения множества Парето - метод прямоугольников.
k2
k1
Запишем алгоритм для случая, когда k1 → min и k2 → min:
1)Фиксируем самые левые точки, если их несколько, выбираем среди них нижнюю.
2)Через эту точку проводим вертикаль и горизонталь.
3)Фиксируем самые нижние точки, если их несколько – выбираем самую левую. Проводим вертикаль и горизонталь.
4)Отбрасываем все точки, лежащие на границе прямоугольника.
5)Выбрасываемые точки являются точками множества Парето.
6)К внутренним точкам прямоугольника применяем алгоритм с пункта №1.
1.4.2.Методы условной оптимизации
После нахождения множества Парето, если количество точек в нём ≥ 2 , встаёт вопрос о выборе единственной точки, которую необходимо выбрать для проведения операций. Так как точки на множестве Парето отбираются так, что каждая из них лучше по одному критерию, но хуже по другому, то совместное улучшение по двум критериям невозможно. Условная оптимизация предполагает введение условия согласованности между компонентами векторного критерия.
1)Метод скаляризации. Здесь формируется некоторая скалярная функция многих переменных:
W0 = f (W1 ,W2 , ,Wk ).
Это скалярная величина. Наиболее распространённый метод – метод скользящей суммы:
k
W0 = ∑αiWi ,
i=1
где αi −вес каждого компонента критерия.
2)Метод главного критерия. Критерии располагаются в порядке убывания важности: W1 объявляется собственно критерием, а остальные становятся управляемыми переменными (ограничениями):
17
W1 → max
W2 ≤C3
W3 ≥C3
Wk ≤Ck
Такой метод чаще всего используется при оптимизации технических систем (в
системах оптимизации и проектирования). |
|
3)Метод уступок. Критерии располагают в |
порядке убывания важности: |
W1 ,W2 , . Рассматривается только критерий W1 , |
остальные отбрасываются и |
вычисляется W1max . Назначается уступка на критерий W1 − W1 , которую можно отдать в пользу других критериев. Далее то же выполняется для всех остальных критериев.
W2 → max
W1max − W1 <W1 <W1max
далее:
W3 → max
W1max − W1 <W1 <W1max
W2 max − W2 <W2 ≤W2 max
и т.д.
Очевидно, успех такого метода зависит от того, насколько «тупой» максимум имеют критерии. Процедура может быть повторена для других W .
4)Метод последовательной оптимизации. В некоторых случаях критерии системы не слишком связаны друг с другом. Поэтому сначала оптимизируют систему по важнейшему показателю, отбросив все остальные, затем по второму, и т.д. Затем выполняют оптимизацию в другом порядке.
1.5.Методы и задачи исследования операций
1.5.1.Динамическое программирование
Этот метод специально приспособлен для оптимизации динамических задач, в которых операция состоит из элементов, сильно влияющих друг на друга. Динамическое программирование связано с именем Ричарда Беллмана, который сформулировал принцип Беллмана, позволяющий существенно сократить перебор решений в многоэтапных нелинейных задачах.
1 2 |
|
m лет |
|||||||
P1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
P2 
Xij
…
Pn
18
Рассмотрим экономическую задачу распределения ресурсов: пусть есть начальный капитал k0 . Его можно потратить на несколько предприятий P1 , P2 , , Pn .
X ij −количество средств, вкладываемых в i −ом году, в j − ое предприятие. В результате получается эффект:
Wij = f (X ij ).
В общем случае это нелинейная функция.
W= ∑f (X ij )→ max
∑X ij ≤ k0
Так как функция W нелинейная, то получаем задачу нелинейного программирования. Решать её сложно, кроме того, часто X ij принимают дискретные
значения. Поэтому возникает вопрос, нельзя ли решить задачу последовательно, т.е. найти поочередно оптимальное вложение для первого года, второго и т.д. В большинстве задач так нельзя, т.к. решение, принятое на одном из шагов, оказывает влияние на последующие шаги.
Принцип оптимальности Беллмана
Принцип оптимальности Беллмана ставит вопрос о том, что такое оптимальность отдельного элемента системы с точки зрения оптимальности всей системы. Принимая решение на отдельном этапе, необходимо выбирать управление на этом этапе с прицелом на будущее, т.к. нас интересует результат в целом за все шаги. Беллман предложил рассматривать величину выигрыша от i −го шага и до конца, если i −ый шаг начинается с некоторого состояния S . Такую величину называют условным
оптимальным выигрышем Wi (S ).
Тогда, принимая решение на i −м шаге, необходимо выбирать X i так, чтобы
условный оптимальный выигрыш был максимальным от i −го шага и до конца. Определение: оптимальность в малом понимается через оптимальность в
большом.
Любой процесс где-то заканчивается, т.е. имеет горизонт планирования. Тогда
последний этап "не имеет будущего". Вот именно его можно оптимизировать только из |
||||||||
условий данного |
этапа. |
После |
этого |
приступают |
к оптимизации (m −1)−го этапа. |
|||
Выбирают |
такое |
X m−1 , |
чтобы |
при применении |
этого X m−1 учесть |
и управление |
||
последнего |
шага. |
При этом необходимо задать состояние, с которого начинается |
||||||
(m −1)−ый |
шаг. |
Поэтому функцию |
Wi (S ) |
называют условным |
оптимальным |
|||
выигрышем. Таким образом, процесс оптимизации разворачивается от конца к началу, и начальное состояние становится известно. Принцип Беллмана нашёл применение в методе программно-целевого планирования (любое действие планируется некоторым проектом).
1.5.2. Задача о наборе высоты и скорости летательного аппарата
Летательный аппарат находится на высоте h0 и летит со скоростью v0 . Необходимо перевести его на высоту h1 со скоростью v1 . Причём h1 > h0 , v1 > v0 . Разобьём участок от h0 до h1 на n частей:
19
h = h1 −n h0 v = v1 m−v0
Известен расход горючего при переводе системы на h при v = const и на v при h = const . Таким образом, из каждого состояния есть лишь два управления.
За каждое такое управление получим расход горючего (выигрыш и потери). Суммарные потери равны сумме всех выигрышей на всех шагах. Дойдя до конца и получив 22, получаем минимальную величину потерь горючего.
Любая задача такого типа сводится к поиску минимального пути в графе и решается методом динамического программирования.
H |
|
|
|
|
|
|
|
|
|
Sk |
|
|
5 |
|
6 |
|
4 |
|
|
2 |
|
|
17 |
12 |
6 |
|
2 |
|
||||
|
|
|
|
|
|
|
||||
|
3 |
1 |
2 |
3 |
4 |
3 |
3 |
|
4 |
4 |
|
12 |
11 |
8 |
|
5 |
4 |
||||
|
|
|
|
|
|
|||||
|
2 |
4 |
1 |
6 |
3 |
7 |
4 |
|
5 |
7 |
|
14 |
12 |
11 |
|
9 |
11 |
||||
|
|
|
|
|
|
|||||
|
3 |
5 |
6 |
7 |
8 |
7 |
6 |
|
2 |
5 |
|
17 |
18 |
19 |
|
15 |
16 |
||||
|
|
|
|
|
|
|||||
|
5 |
4 |
6 |
4 |
1 |
3 |
4 |
|
5 |
3 |
h0 |
22 |
24 |
20 |
|
19 |
19 |
||||
|
S0 |
|
|
|
|
|
|
|
|
|
|
v0 |
|
|
|
|
|
|
|
|
V |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Рис.1.1. |
|
|
||
1.5.3. Функциональное уравнение Беллмана |
|
|
|
|
||||||
Назовём состоянием системы вектор S =(ξ1 ,ξ2 ,...,ξL ). Полностью
определяющий поведение системы. Тогда работу системы можно представить как движение в фазовом пространстве – пространстве состояний. Назовём шаговым управлением – управление на i −ом шаге. Рассмотрим процесс управления системой за
m шагов. Функция Wi (S,Ui ) называется выигрышем на i-ом шаге. Здесь S − состояние перед i −ым шагом, а Ui − управление на i −ом шаге.
Величина Wi (S,Ui ) должна быть известна до начала динамического программирования. Если состояние перед i −ым шагом было S и применено какое-то управление Ui , то система перейдёт в новое состояние S′=ϕi (S,Ui ). Эта функция должна быть также известна. Пусть Wi (S )−условный оптимальный выигрыш. Это выигрыш на всех этапах от i -го до последнего, если i −ый шаг начинается с состояния
S .
Рассмотрим m шагов. Начнём с (i +1)−го шага. Если после этого шага системой
20
