Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Konspekt_lektsy_nepolnyy_UR_2011.doc
Скачиваний:
6
Добавлен:
30.04.2019
Размер:
544.26 Кб
Скачать

4.3. Дзпр вариационного типа

Более сложными в вычислительном отношении являются ДЗПР, в котором принятие решения состоит в выборе некоторого параметра (аргумента функции эффективности ), который может принимать непрерывный ряд значений. В этом случае ДЗПР сводится к вычислению такого значения параметра, при котором показатель эффективности обращается в максимум. Такие задачи относятся к классу простейших вариационных задач ("задачам на максимум и минимум").

Методы решения таких задач подробно разработаны в математике: для нахождения экстремума функции эффективности нужно продифференцировать ее по аргументу (или аргументам, если их несколько), приравнять производные к нулю и решить полученную систему уравнений.

Практическим примером такой ЗПР в маркетинге является задача выбора цены на товар с эластичным спросом, оптимальной относительно цели "достижение максимальной текущей прибыли". В этом случае показателем эффективности является величина прибыли, а аргументом - цена на товар, назначаемая ЛПР.

Пусть магазин покупает некоторый товар с эластичным спросом по оптовой цене О за ед. и продает его по розничной цене Р за ед. Прибыль от продажи единицы товара составляет П1 =Р – О. Суммарная прибыль Псум составит Псум=(Р–О)*С, где С=f(Р) -величина спроса, который зависит от розничной цены Р, т.е. Псум=(Р–О)*f(Р). Оптовая цена О фиксирована; розничную цену Р назначат магазин. Задача оптимизации состоит в том, чтобы найти такое значение Р (аргумента), что бы суммарная прибыль (показатель эффективности) была максимальной.

4.4. Модели исследования операций.

Особый класс ДЗПР составляют задачи исследования операций, характерной особенностью которых является большое число аргументов функции эффективности. Термин "исследование операций" возник в годы второй мировой войны применительно к военным операциям. В настоящее время под исследованием операций понимают комплекс научных математических методов, применяемых для анализа и обоснования выбора "наилучших" решений в различных областях человеческой деятельности. Под операцией при этом понимается любое целенаправленное действие, мероприятие и т.п.

Методы исследования операций не представляют собой единого универсального аппарата, пригодного для выработки и анализа решений "на все случаи жизни". Исследование операций - это объединенный общей задачей обоснования наилучших решений набор различных математических методов, каждый из которых имеет свою область применения.

При исследовании операций используются методы математического программирования, которые подразделяются на методы линейного, нелинейного и динамического программирования. Нелинейное программирование применяется тогда, когда эти условия носят нелинейный характер (2-й и более степени). Динамическое программирование используется для выбора многоэтапных решений, когда результат каждого последующего этапа зависит от предыдущего.

Линейное программирование используется в тех случаях, когда зависимость показателя эффективности от аргументов линейна, а ограничения, накладываемые на значения аргументов имеют вид линейных неравенств. Типичными примерами ДЗПР, решаемых методами линейного программирования, являются задачи «о пищевом рационе", «о планиpовании пpоизводства, «о загpузке обоpудования», «о снабжении сыpьем», тpанспоpтная и др. [2]. Подобные задачи pешаются с использованием ЭВМ [3].

Особенность всех этих задач состоит в том, что они решаются "чисто" математическими методами (без учета субъективных предпочтений ЛПР).

Методы и модели анализа и принятия решений в условиях риска

Задача принятия решений в условиях риска. Критерий Байеса (критерий ожидаемого значения). Модальный критерий (наиболее вероятного исхода). Критерий максимизации вероятности распределения ОФ. Критерий минимума дисперсии оценочного функционала

Задача принятия решений в условиях риска

При анализе задач принятия решений в условиях риска (стохастических ЗПР) предполагаются заданными:

1)множество решений А={ai}k, одно из которых может принять ЛПР;

2)множество ситуаций S={sj}k, в одной из которых будет находиться среда в момент реализации выбранного решения;

3)оценочный функционал F, элементы которого представляют собой количественную оценку полезности исходов решений;

4)вероятности Рj=Р(s=sj ), j=1,...,m ситуаций (состояний "природы"), P1+P2+...+Pm = 1.

Пример:F=F+

Табл. 1

Решения

S1

S2

S3

S4

а1

1

4

5

9

а2

3

8

4

3

а3

4

6

6

2

Рj

0.1

0.2

0.5

0.2

При решении ЗПР в условиях риска используются четыре основных критерия (правила), каждый из которых отображает особый подход к логическому обоснованию выбора решения: критерий Байеса; модальный, максимизации вероятности распределения оценочного функционала; минимума дисперсии оценочного функционала.

Кроме того, могут использоваться комплексные критерии (подходы) к определению предпочтительного решения. Различные критерии принятия решения в одних и тех же условиях могут иногда приводить к выбору различных решений.

Критерий Байеса (критерий ожидаемого значения).

Название этого критерия связано с именем математика Томаса Байеса (18 в.).

Критерий Байеса основывается на концепции "оптимизации в среднем", в соответствии с которой оптимальным является решение, максимизирующее средний "выигрыш" (или минимизирующее средний "проигрыш") ЛПР с учетом заданных вероятностей состояний среды. Сущность критерия состоит в максимизации математического ожидания ОФ при F+ (или минимизации ОФ при F-). Для каждого решения аi определяется "Байесово значение"

 m

В (р,аi)=   рj *fij  = (р1* fi1 +...+ рj *fij  +...+рm *fim )

 j=1

Оптимальным считается такое решение аo, дл0я которого выполняется:

В(р,аo)= max В(р,аi), при F = F+

и

В(р,аo)= min В(р,аi), если F = F-

Т.о. в соответствии с критерием Байеса выбирается решение, имеющее максимальное математическое ожидание, если ОФ выражает "выигрыши", "доходы", и минимальное математическое ожидание, если ОФ выражает потери, затраты и т.п.

Пример:F=F+ Табл. 2

Решения

S1

S2

S3

S4

В(р,аi)

а1

1

4

5

9

5,2

а2

3

8

4

3

4,5

а3

4

6

6

2

5,0

Рj

0.1

0.2

0.5

0.2

1) Вычисляем байесовы значения ОФ В(р,аi) для всех аi из А :

В (р,а1)= 0,1*1+0,2*4+0,5*5+0,2*9 = 5,2

В (р,а2)= 0,1*3+0,2*8+0,5*4+0,2*3 = 4,5

В (р,а3)= 0,1*4+0,2*6+0,5*6+0,2*2 = 5,0

2) Результаты расчета сведены в графу В(р,аi) таблицы 2.

3) ОФ F=F+, поэтому оптимальным по критерию Т.Байеса ("байесовским решением") является решение а1 с математическим ожиданием В(р,а1)= 5,2.

При выборе оптимального решения можно исходить не только из условия максимизации среднего выигрыша, но и минимизации среднего риска.

Решение, максимизирующее средний выигрыш, совпадает с решением, минимизирующим средний риск R(р,аi):

R (р,аi) = (р1*ri1 +...+ рj*rij +...+рm*rim)

Покажем это для условий примера, заданного табл.1. Для этого построим матрицу рисков и определим значения R(р,аi)

Матрица рисков Табл. 3

Решения

S1

S2

S3

S4

В(р,аi)

а1

3

4

1

0

1,6

а2

1

0

2

6

2,3

а3

0

2

0

7

1,8

Рj

0.1

0.2

0.5

0.2

R (р,а1)= 0,1*3+0,2*4+0,5*1+0,2*0 = 1,6

R (р,а2)= 0,1*1+0,2*0+0,5*2+0,2*6 = 2,3

R (р,а3)= 0,1*0+0,2*2+0,5*0+0,2*7 = 1,8

Оптимальным является решение а1 с ожидаемым риском R(р,а1)= 1,6. Таким образом, решение, обеспечивающее максимизацию среднего "выигрыша", совпадает с решением, минимизирующим средний риск.

 

Графический метод решения

Для двух ситуаций S ={S1, S2} выполняется p(S1)= 1- p(S2) . В этом случае ЗПР с использованием критерия Байеса может решаться графическим методом. Рассмотрим пример

Решения

S1

S2

а1

0

8

а2

8

0

а3

6

6

Рj

p

1-p

Графический метод решения состоит в следующем.

1) Для a1 и a2 в координатах p - В(р,а1) строятся прямые

В(р,а1) = p*f11 + (1-p)*f12 = p*(f11-f12)+f12,

В(р,а2) = p*f21 + (1-p)*f22 = p*(f21-f22)+f22

В(р,а3) = p*f31 + (1-p)*f32)= p*(f31-f32)-f32

2) Определяется функция В(р) = max [В(р,аi)]

B(p)

8

6

0 P1 P2 P=1

Рис.

Если вероятность р находится в интервале [0,P1], то оптимальным по Байесу является решение а1, если в диапазоне [P1,P2]- решение а3, в диапазоне [Р2,1] - решение а2.

Множество P(аi) значений вектора априорных вероятностей, для которого оптимальным по Байесу решением является аi, называется "байесовым множеством априорных вероятностей для решения аi". Для рассматриваемого примера

P(а1)= [0,P1]; P(а2 )=[P2,1]; P(а3)=[P1,P2].

Критерий Байеса обеспечивает получение максимального  среднего (ожидаемого)  выигрыша. Использование ожидаемых значений ОФ предполагает возможность многократного решения одной и той же задачи и его применение обосновано тогда, когда одно и то же решение приходится принимать достаточно большое число раз. Для решений, которые принимаются редко, ориентация на критерий Байеса может приводить к неверным результатам.

Популярность критерия Байеса обусловливается тем, что он является наиболее обоснованным в теоретическом плане и полностью соответствует концепции теории рационального поведения Неймана-Моргенштерна (принципу максимизации ожидаемой полезности).

Модальный критерий ( критерий наиболее вероятного исхода)

ЛПР исходит из того, что среда будет находиться в наиболее вероятном состоянии. В этом случае целесообразно рассматривать эффективность наиболее вероятных исходов решений, т.е. тех исходов, которые будут иметь место при наиболее вероятном состоянии среды.

Оптимальным считается решение, которому соответствует максимальное значение ОФ для наиболее вероятной ситуации.

Для примера табл. 1 наиболее вероятна ситуация S3 с Р3=0.5. Оптимальным является решение а3, поскольку для ситуации S3

f33= max {f13,f23,f33} = 6

Преимущества модального критерия определяются тем, что:

- для определения оптимального решения достаточно определить только наиболее вероятные ситуации, не уточняя при этом их численных значений,

- расчет ОФ может быть произведен только для самых вероятных ситуаций,

- выбор решения может осуществляться на основе анализа профиля предпочтений ЛПР без их количественной оценки.

Применение такого критерия не обосновано в тех случаях, когда множество состояний среды велико, а вероятности каждого из состояний малы.

Критерий максимизации вероятности распределения ОФ

Пусть значения ОФ выражают прибыль ЛПР. В соответствии с критерием максимизации вероятности распределения оценочного функционала следует принимать решение, которое обеспечивает наибольшую вероятность получения прибыли, не меньшей некоторой наперед заданной величины .

1) ЛПР задается величина :

min min fij max max fij

2) Для всех решений аi определяются значения ОФ, удовлетворяющие условию fij.

3) вероятности соответствующих условию fij. ситуаций Sj суммируются по строкам, соответствующим решениям аi,

4) Выбирается такое решение ao, которому соответствует максимальная суммарная вероятность того, что значение оценочного функционала будет не менее заданной величины 

Пример. Пусть =4. Вычислим вероятности P(f ij>4):

Для а1: Р(f1j>4)= 0,2 + 0,5 + 0,2 = 0,9

а2: Р(f2j>4)= 0,2 + 0,5 = 0,7

а3: р(fj3>4)= 0,1 + 0,2 + 0,5 = 0,8

Результаты расчетов приведены в табл.2.

Табл. 2

Решения

S1

S2

S3

S4

PM(р,аi )

А1

1

4

5

9

0.2+0,5+0.2=0,9

А2

3

8

4

3

0.2+0.5=0.7

А3

4

6

6

2

0.1+0,2+0.5=0,8

Рj

0.1

0.2

0.5

0.2

Рациональным является решение а1, обеспечивающее получение "выигрыша" не менее =4 ед. с вероятностью 0.9.

Если величину  уменьшить до 3, то рациональным будет решение а2, приняв которое ЛПР со 100% гарантией "выигрывает" не менее 3 ед., в то время как при принятии а1 в случае выбора средой состояния S1 с вероятностью 0.1 возможен "выигрыш" всего в 1 ед., а при выборе а3 - с вероятностью 0.2 "выигрыш" в 2 ед.

Если значения ОФ выражают "убытки", то в соответствии с критерием максимизации вероятности распределения ОФ следует принимать такое решение, которое обеспечивает наименьшую вероятность получения убытков,  превышающих  заданную величину , или наибольшую  вероятность того, что убытки будут меньше  наперед заданной величины.

Критерий минимума дисперсии оценочного функционала

Для каждого решения определяется дисперсия значений оценочного функционала и выбирается то решение, для которого дисперсия минимальна.

m

D(р,аi)= рj * ( fij- В(р,аi)2

j=1

Оптимальным считается решение аo, для которого выполняется

D(р,аo)= min D(р,аi),

A

Для примера табл.1 величины дисперсий составят:

D(p,а1) = (0,1*[1-5,2]2+0,2*[4-5,2]2+0,5*[5-5,2]2+ 0,2* [9-5,2]2)=4.96

D(p,а2) = 5,25; D(p,а3)= 2,6.

Рациональным является решение а3, для которого D(p,а3)=min{D(p,аi)}=2,6

Этот критерий обычно используется как вспомогательный. Его целесообразно дополнить, например, критерием максимизации вероятности распределения оценочного функционала:

m

D(р,аi)= max [ рj * ( fij- В(р,аi)2]

j=1

P(foj.a) > C

или критерием Байеса в виде системы

m

D(р,аi)= max [ рj * ( fij- В(р,аi)2]

j=1

В(р,аo)>Вo

Методы и модели анализа и принятия решений в условиях неопределенности

Критерий Лапласа, максиминный (минимаксный) критерий Вальда, критерий минимального риска Сэвиджа, критерий оптимизма-пессимизма Гурвица.

Неопределенность условий выбора решений означает, что известны лишь возможные ситуации (множество состояний "природы") и ЛПР не может определить априорные вероятности ситуаций.

Наиболее известны четыре критерия принятия решений в условиях неопределенности:

  • Критерий Лапласа,

  • максиминный (минимаксный) критерий Вальда,

  • критерий минимального риска Сэвиджа,

  • критерий оптимизма-пессимизма Гурвица.

Основные различия между этими критериями определяются различием стратегий поведения ЛПР в условиях неопределенности, поскольку критерии, несмотря на их количественную природу, отображают субъективную оценку ЛПР ситуации, в которой необходимо принять решение. Общих правил оценки применимости того или иного критерия не существует.

Критерий Лапласа

Этот критерий основывается на известном принципе недостаточного обоснования Бернулли- Лапласа (впервые был сформулирован Я.Бернулли), который является наиболее известным и логически обоснованным методом оценки априорных вероятностей ситуаций.

Поскольку вероятности ситуаций не известны, информация, необходимая для вывода о том, что эти вероятности различны, отсутствует (в противном случае эти вероятности можно было бы определить и задачу уже не следовало бы рассматривать как задачу принятия решений в условиях неопределенности)

В соответствии с принципом "недостаточного обоснования" тогда, когда нет оснований считать, что одно из состояний среды из S более вероятным, чем любое другое состояние, их следует считать равновероятными, т.е. вероятности всех состояний оцениваются величиной

Pj=1/m (j=1,...,m),

где m - число элементов множества S возможных ситуаций. Таким образом, задача принятия решений в условиях неопределенности сводится к задаче принятия в условиях риска. При этом выбирается решение, дающее наибольший ожидаемый выигрыш при предположении равной вероятности всех ситуаций

m

L(ао) = max{1/m* fij}

A j=1

где 1/m - вероятности состояний sj, j=1,...,m, определенные в соответствии с принципом “недостаточного обоснования”.

Табл.

S1

S2

S3

S4

L(a)

a1

2

3

4

5

3,5

a2

5

4

1

2

3

a3

7

2

8

1

4,5

Пример.

L (a1)= 1/4*(2+3+4+5)= 3,5; L (a2)= 1/4*(5+4+1+2)= 3; L(a3) = 1/4*(7+2+8+1)= 4,5

Оптимальным по критерию Лапласа является решение а3.

Критерий Вальда (критерий "крайнего пессимизма)

Этот критерий является наиболее "осторожным": ЛПР исходит из того, что наступит "наихудшая" ситуация и выбирает "наилучшую из наихудших" возможностей. Если ОФ выражает "выигрыш" ЛПР, то выбирается решение, дающее

max [min{fij}]

A S

Если ОФ выражает потери ЛПР, решение выбирается исходя из условия

min [max{fij}].

A S

Пример. 2.1. ОФ F+(выражает выигрыши)

Решения

S1

S2

S3

S4

V(a)

a1

2

3

4

5

2

a2

5

4

1

2

1

a3

7

2

8

1

1

Для данных табл. Примера 2.1. выполняется: V(a1)=2;V(a2)=1;V(a3)=1. Следовательно, оптимальным по критерию Вальда является решение a1, которое в "наихудшей" ситуации s1 обеспечивает получение выигрыша f11= 2

Критерий Вальда в ряде случаев может быть чрезмерно "пессимистичным" и приводить к нелогичным выводам.

Пример 2.2. ОФ принадлежит к классу F- (выражает потери)

S1

S2

V(a)

A1

$102

$1

$102

А2

$100

$98

$100

Поскольку ОФ F- выражает потери, выбор решения производится исходя из условия min[max{fij}]. В этом случае оптимальным по Вальду является решение а2, гарантирующее, что размер потерь будет не более $100. Однако возможна ситуация s2, в которой потери при выборе решения а1 составят всего $1, а в «худшей» ситуации - $102.

Критерий Сэвиджа (критерий минимаксного риска)

Критерий Сэвиджа, как и критерий Вальда, является "пессимистичным", однако пессимизм проявляется не в стремлении избежать минимального проигрыша, а в том, что бы избежать максимальных потерь выигрыша (т.е. минимизировать максимальные риски принимаемого решения).

Согласно Сэвиджу, следует определить риски (потери), вызванные незнанием истинной ситуации, в условиях которой будут осуществляться решения, и минимизировать максимальный риск. Решение выбирается исходя из условия

min [max{rij}].

A S

Пример. 3.1.Матрица ОФ F+выражает выигрыши.

На ее основе строится матрица рисков (сожалений). Поскольку ОФ принадлежит к классу F+, риски определяются в соответствии с выражением rij= βj – fij= max{fij}-fij.

Матрица ОФ Матрица рисков (сожалений)

S1

S2

S3

S4

S1

S2

S3

S4

SEV(a)

A1

2

3

4

5

а1

5

1

4

0

5

A2

5

4

1

2

a2

2

0

7

3

7

A3

7

2

8

1

a3

0

2

0

4

4

βj

7

4

8

5

Оптимальным по Сэвиджу является решение а3, гарантирующее величину риска не более 4.

Для рассмотренного выше примера 2.2 ОФ выражает потери. В этом случае риски определяются как выражением rij= fij - min{fij}. Оптимальным по Сэвиджу является решение а1, более «оптимистическое», чем оптимальное по Вальду решение а1:

S1

S2

SEV(a)

а1

$2

$0

$2

a2

$0

$97

$97

Критерий Гурвица (критерий оптимизма-пессимизма)

Критерий Гурвица охватывает целый ряд различных подходов к выбору решений: от "крайне пессимистического" до "крайне оптимистического".

При наиболее пессимистическом предположении о состоянии среды решение выбирается исходя из условия

max [min{fij}]

A S

а при наиболее оптимистическом - из условия

max [max{fij}].

A S

Критерий Гурвица устанавливает баланс между этими крайними подходами путем "взвешивания" оптимистического и пессимистического способов поведения посредством введения соответствующих коэффициентов (весов) λ и 1-λ , где 0 < λ<1.

В том случае, когда элементы оценочного функционала F+ характеризуют "прибыль", "доход" и т.п. показатели, выбирается решение, дающее

max { λ *max {fij} + (1- λ)*min {fij})

A S S

Если же оценочный функционал определяет потери, затраты и т.п. характеристики, выбирается решение, для которого

min { λ *min {fij} + (1- λ)*max {fij})

A S S

Коэффициент λ называется коэффициентом «оптимизма-пессимизма» ЛПР. Параметр λ определяется как показатель оптимизма: при  λ=1 критерий "крайне" оптимистический, а при  λ =0 -"крайне пессимистический" (совпадает с критерием Вальда). Выбор величины λ субъективен: значение   коэффициента λ  между 0 и 1 определяется в зависимости от склонности ЛПР к пессимизму или оптимизму при прогнозировании будущего «состояния дел». Предположим, что ОФ принадлежит к F+ и

задано значение λ=0,5 (случай "умеренного оптимизма" ЛПР)

Пример 4.1

S1

S2

S3

S4

Min fij

Max fij

G(ai)

a1

2

3

4

5

2

5

3.8

a2

5

4

1

2

1

5

3.4

a3

7

2

8

1

1

8

5.2

G(а1) = 0.6*5 + (1-0,6)*2 = 3 + 0,4*2 = 3,8;

G(а2) = 0,6*5 + 0,4*1 = 3,4;

G(а3) = 0,6*8 + 0,4*1 = 5,2.

Оптимальным является решение а3 с G(а3)=5,2. Если принять значение λ=0 ("крайний пессимизм"), получим: G(а1)=2; G(а2)=1; G(а3)=1; оптимальным будет решение а1. При  λ=1 ("крайний оптимизм"): G(а1)=5; G(а2)=5; G(а3)=8;оптимальным является решение а3 с G(а3)=8.

Критерий Гурвица может вычисляться графическим методом. Для рассматриваемого примера 4.1 графическое решение имеет следующий вид:

G(аi)

G(а1)

8

7

6

5

G(а1)

4

G(а2)

3

2

1

0

0,1

0,2

0,3

0,4

0,5

0,5

0,7

0,8

0,9

λ=1,0

Таким образом, показатель "оптимизма-пессимизма" является существенным параметром критерия Гурвица: различные значения  a приводят к выбору различных решений. Следовательно, при применении критерия Гурвица необходимо указывать величину показателя "оптимизма-пессимизма" λ.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]