Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Метод_лаб_2011_ТПР_стац_pdf

.pdf
Скачиваний:
12
Добавлен:
07.06.2015
Размер:
1.4 Mб
Скачать

11

Ожидаемая полезность события – сумма произведений вероятностей возникновения данного события на значение полезности последствий этих

событий

 

n

p W .

W

 

 

 

i 1

i i

Выбор ЛПР в условиях риска формализуется при помощи понятия потери, при этом ЛПР проявляет свои индивидуальные вкусы и склонность к риску. Решение ЛПР может быть найдено на основе следующего алгоритма:

1 Присваиваются произвольные значения полезности выигрышу для лучшего и худшего последствия, причем худшему из последствий ставится в соответствие меньшее значение полезности.

2 Игроку предоставляется выбор:

- получить определенную гарантированную сумму W, которая находится в промежутке между худшим (s) и лучшим (S) значениями выигрышей s W S ;

- принять участие в игре, т.е. получить с вероятностью р наибольшую денежную сумму S и с вероятностью (1-р) получить наименьшую денежную сумму s, при этом вероятность следует изменять (уменьшать или повышать) до тех пор пока ЛПР не станет безразличным к отношению выбора между гарантированной суммой и игрой.

Функция полезности имеет вид: W p U(S)

(1- p )U(s), где р0 – заданная

0

0

вероятность.

 

Безусловный денежный эквивалент (БДЭ) – максимальная сумма денег,

которую ЛПР готов заплатить за участие в игре (лотерее) или минимальная сумма денег, за которую он готов отказаться от игры.

Ожидаемая денежная оценка (ОДО) – средний выигрыш в игре.

Вывод: если БДЭ = ОДО

 

 

ЛПР – объективист. Если БДЭ ≠ ОДО ЛПР

– субъективист (если БДЭ > ОДО

ЛПР – склонен к риску; если БДЭ < ОДО

ЛПР – не склонен к риску).

 

 

 

 

 

 

Основные функции полезности используются для изучения, анализа и

оценки поведения субъектов риска:

 

1

U(x)

a

bx; (b

0) - функция, отражающая нейтральность к риску.

2

U(x)

 

log a (x

b); (x

-b, a

1)

- функция, выражающая убывающую

несклонность к риску.

 

 

 

 

 

 

3

U(x)

-e-cx ; (c

 

0) - постоянная несклонность к риску.

4

U(x)

-ecx ; (c

 

0) - постоянная склонность к риску.

5

U(x)

a

bx - cx2 ; (c

0; x

 

b

)

- возрастающая несклонность к риску.

 

 

 

 

 

 

 

 

 

2c

 

6

U(x)

-x2 ; (x

0) - возрастающая склонность к риску.

7

U(x)

a

bx

cx2 ; (c

0; x

 

b

)

- убывающая склонность к риску.

 

 

 

 

 

 

 

 

 

 

2c

 

8 Функция с интервальной нейтральностью к риску.

Одним из основных видов функции полезности, характеризующей финансовое поведение людей, является функция U(x) lnx , т.е. полезность

12

бесконечно малого выигрыша прямо пропорциональна этому выигрышу и обратно пропорциональна денежной сумме, которой игрок обладает. Из этого следует, что если полезность описывается функцией U(x) lnx , то потери более ощутимы, чем выигрыш.

Детерминированный эквивалент лотереи L – это гарантированная сума

 

, получение которой эквивалентно участию в лотерее, т.е.

 

L . Итак

 

x

x

x

определяется из уравнения

 

 

 

 

 

 

 

 

1

 

 

(1)

 

U(x)

M[U(x)],или x

u MU(x) .

 

 

Премия за риск – это сумма, которой субъект готов пожертвовать из среднего выигрыша за то, чтобы избежать риска, связанного с лотерей. Премию за риск определяют таким образом:

 

 

 

(2)

 

(x) M [x( )] x

x x .

Страховая сумма – величина детерминированного эквивалента с противоположным знаком.

13

ЛАБОРАТОРНАЯ РАБОТА № 3 Принятие оптимального решения на основе теории игры

Цель: научиться осуществлять выбор альтернативы на основе теории игры и применять полученные знания при создании программных продуктов.

Постановка задачи. Предприятие

выпускает определенную

продукцию

партиями фиксированного размера. Из-за

случайных сбоев в производственном

процессе возможный выпуск партий

с недопустимо высоким

процентом

бракованной продукции. Определяют состояния внешней среды: 1 – пригодная партия изделий, 2 – бракованная партия изделий.

Пусть бракованные изделия в пригодной партии составляют %б( 1 ), в непригодной – %б( 2 ). Проведенные на предприятии расчеты показывают, что вероятность производства бракованной партии составляет p( 2 ) .

Предприятие отправляет партии товаров m потребителям, для которых контрактом обусловленный возможный предельный процент бракованных деталей – %б-потреб-l соответственно. За один процент превышения установленных границ предполагается штраф размером P тыс.грн. С другой стороны, производство партии товаров более высокого качества увеличивает затраты предприятия на V тыс.грн. за каждый процент.

В результате проверки двух изделий из всей партии может быть установлено, что: 1) оба изделия пригодны; 2) одно из изделий пригодно; 3) оба изделия бракованы. Пусть 1 , 2 , 3 – эти три возможные события соответственно.

Задание. Построить программный модуль, позволяющий:

1)принять оптимальное решение в условиях отсутствия риска (гарантированный результат);

2)принять оптимальное решение, используя априорные вероятности

событий;

3)принять оптимальное решение, используя апостериорные вероятности

событий.

Исходные данные представлены в таблице 1. Процент брака выбирается студентом случайным образом в заданных границах, используя генератор случайных чисел.

Предусмотреть возможность ввода задаваемого пользователем количества альтернатив (покупателей), величин процента бракованной продукции и вероятностей пребывания внешней среды в одном из своих состояний.

Программа должна выдавать сообщение о выборе оптимальной альтернативы в каждом конкретном случае (при использовании различной информации и при указанных результатах контрольной проверки деталей), а также критерий, с помощью которого принималось решение.

14

Таблица 1 – Исходные данные

 

Процент брака

 

 

 

 

 

Количество

относительно требований

 

 

 

 

 

%б( 1 )

%б( 2 )

p( 2 )

P

V

покупателей

варианта

покупателя %б-потреб-l

 

 

 

 

 

l 1..m

 

min

max

 

 

 

 

 

 

 

 

 

 

 

 

1

5

8

4

13

0,2

100

80

2

2

6

10

5

15

0,3

120

100

3

3

4

10

3

16

0,15

130

110

4

4

5

9

4

12

0,25

115

95

5

5

6

9

5

13

0,3

125

105

2

6

4

10

3

14

0,2

145

125

5

7

5

11

4

15

0,2

140

120

4

8

6

11

5

15

0,15

135

115

3

9

4

9

3

14

0,25

130

110

6

10

5

10

4

12

0,2

125

105

6

11

5

9

4

13

0,15

120

95

5

12

6

10

5

15

0,3

115

100

4

13

6

11

5

16

0,2

110

80

5

14

4

8

3

15

0,15

110

85

4

15

4

9

3

16

0,1

105

75

3

16

5

9

4

14

025

100

80

2

17

6

10

5

14

0,25

105

85

2

18

4

7

3

13

0,3

115

90

4

19

4

9

3

16

0,2

120

100

3

20

6

10

5

15

0,2

125

95

4

21

5

10

4

14

0,15

125

100

5

22

6

11

5

16

0,15

130

100

2

23

6

9

5

15

0,3

115

80

3

24

4

10

3

16

0,25

105

70

3

25

5

11

4

16

0,3

110

85

5

Краткие теоретические сведения

Статистическая игра – это основная модель теории принятия решений в условиях частичной неопределенности.

Статистическая игра – игра с природой, модель ситуации принятия решений в условиях неопределенности и риска.

Природа – совокупность внешних обстоятельств, в которых приходится принимать решения или совокупность неопределенных факторов влияющих на эффективность принимаемых решений.

Человек – лицо, принимающее решение (ЛПР), или статистик.

Задача ЛПР – принятие наилучшего управленческого решения в каждой конкретной ситуации с учетом имеющейся информации.

Под стратегией природы понимают полную совокупность внешних условий, в которых приходится принимать решение. Данную совокупность назовем состоянием природы (П). В общем случае существует некоторое множество возможных состояний природы: ={ 1, 2,…, j,…, n}, которое называется пространством состояния природы, а элементы j – чистыми стратегиями природы.

15

Обычно известен только перечень чистых стратегий природы (нет полного знания о состоянии природы), и из прошлого опыта известно, как часто природа применяет ту или иную из своих чистых стратегий, т.е. известно априорное

распределение вероятностей qj(

j) на пространстве состояний природы . Отсюда

смешанная стратегия природы – априорное распределение вероятностей q( ).

Критерии принятия решений (для F )

1 Критерий Байеса.

Используется при известном распределении

вероятностей различных состояний природы. Оптимальной считается стратегия

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Аi,

при

которой

 

максимальный

средний

выигрыш

статистика

 

ai ,

т.е.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

opt max ai ,

 

 

 

 

 

 

 

 

 

 

q j

 

 

 

 

 

 

 

 

 

где

ai

 

 

aij q j

( i

1, m ), где

вероятность j-го

состояния

 

 

 

i

 

 

 

 

 

 

 

 

 

 

j 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

природы.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 Критерий Лапласа (принцип недостаточного основания). Используется

в

случае

когда

все

 

состояния

природы полагаются

равновероятными,

т.е.

q

q

 

...

 

q

 

 

...

q

 

 

 

1

. Оптимальной считается

стратегия, обеспечивающая

2

 

j

n

 

 

1

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

максимум среднего выигрыша opt

 

max ai , где ai

 

aij ( i 1, m ).

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

j 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Применяя этот критерий, отступают от условий полной неопределенности (отсутствия информации о состоянии природы), считая, что возможным состояниям природы можно приписать определенную вероятность их появления. В этом случае, определив математическое ожидание выигрыша для каждого решения, выбирают то, которое обеспечивает наибольшее значение выигрыша.

Принцип Байеса–Лапласа можно применять, если состояния природы, которые изучаются, и решения, которые принимаются, многократно повторяются. Тогда, например, статистическими методами, базируясь на частотах появления отдельных состояний природы в прошлом, можно оценивать вероятности их появления в будущем.

Перечисленные критерии не исчерпывают всего многообразия критериев выбора решения в условиях неопределенности, в частности, критериев выбора наилучших смешанных стратегий.

Оптимальное поведение по большей части зависит от принятого критерия оптимизации. Поэтому выбор критерия является вопросом ответственности в исследовании операций. Каждый выбор критерия предопределяет одобрение решения, которое может отличаться от решения, принятого в соответствии с другим критерием. Однако ситуация никогда не бывает настолько неопределенной, чтобы нельзя было получить хотя бы частичную информацию о вероятностях распределения состояний природы в ситуации, которая анализируется. В этом случае, оценив распределение вероятностей состояний природы, применяют критерий Байеса–Лапласа или проводят эксперимент, который дает возможность уточнить поведение природы.

 

 

16

3

Максиминный критерий Вальда. Оптимальной считается

стратегия,

которая

в наихудших условиях гарантирует максимальный

выигрыш

opt max min aij .

 

i

j

 

4

Критерий Севиджа (критерий минимального риска). Оптимальной

считается стратегия минимального риска в наихудших условиях opt

min max rij .

 

 

i j

Суть этого критерия заключается в выборе такого решения, чтобы не допустить излишне больших потерь, к которым может привести принятие ошибочного решения. Для этого строится «матрица рисков», элементы которой показывают, какой убыток понесем, если для каждого состояния природы не выберем наилучшего решения.

Риском игрока при выборе некоторого решения (стратегии) А называется разница между максимальным выигрышем, который можно получить в этих условиях, и выигрышем, который получит игрок в тех же условиях, применяя стратегию Аi. Обозначим эту величину через rij. Если бы игрок знал заранее будущее состояние природы Пj, то выбрал бы стратегию, которая отвечала максимальному элементу в указанном столбце: mахаij. Тогда, по определению,

риск равняется Rij = maxaij–aij. Матрица рисков строится так:

1)определяется для каждого состояния природы (столбика) наибольший

элемент;

2)элемент матрицы рисков получается вычитанием соответствующего элемента платежной матрицы из максимального элемента этого столбика.

Критерий Севиджа рекомендует в условиях неопределенности выбирать решение, которое обеспечивает минимальное значение максимального риска.

Критерии Вальда и Севиджа ориентируют статистика на самые неблагоприятные состояния природы, т.е. выражают пессимистическую оценку ситуации.

5 Критерий Гурвица (критерий пессимизма–оптимизма). Оптимальной

считается

стратегия,

для

которой

выполняется

следующее

соотношение:

opt max (

min aij

(1

) max aij ) , где

– уровень риска, 0

1 .

 

 

i

j

 

j

 

 

 

 

 

 

Если

0 , то имеем критерий крайнего оптимизма opt

max (max aij ) .

 

 

 

 

 

 

 

i

 

j

Если

1 , то имеем критерий умеренного пессимизма

opt

max (min aij ) .

 

 

 

 

 

 

 

 

i

j

В общем

случае

выбирают исходя из

опыта

или

субъективных

соображений

0,6...0,8 .

 

 

 

 

 

 

Пример

Предприятие выпускает определенную продукцию партиями фиксированного размера. Из-за случайных сбоев в производственном процессе возможен выпуск партий с недопустимо высоким процентом бракованной продукции. Определяют состояния экономической среды: 1 – пригодная партия изделий 2 – бракованная партия изделий. Пусть бракованные изделия в пригодной партии составляют 4%( 1 ), в непригодной – 15%( 2 ). Проведенные на

17

предприятии расчеты показывают, что вероятность производства бракованной партии равняется p( 2 ) =0,2.

Предприятие отправляет партии товаров m =2 потребителям, для которых контрактом обусловленный возможен предельный процент бракованных деталей: 5% и 8% соответственно. За один процент превышения установленных пределов предусматривается штраф размером P =100 тыс. грн. С другой стороны, производство партии товаров высшего качества увеличивает расходы предприятия на V =80 тыс. грн. за каждый процент.

В результате проверки двух изделий из всей партии может быть установлено, что: 1) оба изделия пригодны; 2) одно из изделий бракованное; 3) оба изделия бракованные. Пусть 1 , 2 , 3 – три возможные события

соответственно. Принять оптимальное решение: 1) в условиях гарантированного результата; 2) используя априорные вероятности; 3) используя апостериорные вероятности событий.

Решение. Функционал оценивания целесообразно представить в виде матрицы затрат F f (xk , j ) . Решение допускает, что потребитель А примет

партию продукции (5% брака без штрафа). Если партия имеет 4% брака ( 1 ), то производитель понесет убытки (5 4) 80 80 тыс. грн. Но, если партия товаров имеет 15% брака ( 2 ), то штраф составит (15 5) 100 1000 тыс. грн. Аналогично рассчитываются элементы матрицы затрат относительно второго покупателя – Б. Матрица затрат примет вид:

 

 

 

1

2

F

f (xk , j )

x1

80

1000 .

 

 

x2

320

700

Если производитель принимает решение гарантированного результата (критерий Вальда),

отправить второму покупателю:

 

~

min max f k

min 1000;700

f ko

 

xk X j

xk X

в

условиях

получения

то

необходимо

продукцию

700 тыс.грн.

Если производитель принимает решение, используя априорную информацию относительно p( 2 ) =0,2, то, используя критерий Байеса, продукцию необходимо отправить первому покупателю:

~

min

n

~

p j

min 80 0.8 1000 0.2;320 0.8 700 0.2

min 264;396 264 тыс.грн.

fko

 

fkj

 

xk

X

j

1

 

xk X

xk X

 

 

 

 

 

 

Так как решение производителя должно зависеть от результата эксперимента, то необходимо использовать апостериорные вероятности. Учитывая, что детали могут выбираться как из качественной партии, так и из бракованной, то определены условные вероятности p( v / j ) .

Апостериорные вероятности находятся по формуле:

p( j /

v )

p(

j , v )

 

 

p( v

/ j

) p( j

)

,

p(

v )

 

n

 

 

 

 

 

 

 

 

p(

v /

j ) p(

j )

 

 

 

 

 

 

 

 

 

 

 

 

 

j

1

 

 

 

 

18

n

 

n

де

p( v / j ) p( j )

p( j , v ) p( v ) – вероятность каждого отдельного

j

1

j 1

результата эксперимента;

p( v / j ) – условные вероятности; p( j ) – априорные вероятности; p( j , v ) – общие вероятности.

Условные вероятности определяются на основе использования биномиального закона распределения и условий проведения эксперимента:

P(n, k) Cnk pk qn k ; q 1 p; k 0..n;Cnk

n!

 

,

 

 

k!(n

 

 

k)!

де n – объем выборки.

Условные вероятности в зависимости от качества партии деталей для выборки из двух деталей составят:

p(

1

/

1

)

C2

(0.96)2 (0.04)0

 

0.922;

p(

2

/

1

)

C1

(0.96)1 (0.04)1

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

p(

3

/

1

)

C 0 (0.96)0

(0.04)2

0.0016; p(

1

/

2

)

C2

(0.85)2 (0.15)0

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

p( 2 / 2 )

0.255;

p(

3 /

2 )

0.0225 .

Таблица условных вероятностей p( v /

j ) :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

2

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

0,922

 

 

 

0,0768

 

 

0,0016

 

 

 

 

 

 

 

 

 

 

 

 

2

 

0,7225

 

 

0,255

 

 

0,0225

 

 

 

Таблица общих вероятностей p(

 

 

j , v ) :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

2

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

0,73760

 

 

0,06144

 

 

0,00128

 

 

 

 

 

 

 

 

 

2

 

0,14450

 

 

0,05100

 

 

0,00450

 

Определяем вероятности каждого результата эксперимента:

p( 1 ) 0.73760 0.14450

0.8821 ; p(

2 ) 0.11244 ;

p( 3 ) 0.00578 .

Таблица апостериорных вероятностей p(

j /

v ) :

 

 

1

2

3

 

 

 

 

 

 

 

 

 

1

0,83619

0,54642

0,22145

 

 

2

0,16381

0,45358

0,77855

 

0.0768;

0.7225;

Окончательный результат зависит от результатов контрольной проверки. По критерию Байеса общая формула для расчета затрат имеет вид:

 

 

 

 

n

 

 

B (xk , p j / v )

M (xk

/ v )

f (xk , j ) p( j / v ), k 1..n;v 1..N; N 3 .

 

 

 

 

j

1

Ситуация 1. Результат эксперимента показал, что два изделия

качественные:

 

 

 

 

M (x1 /

1 )

80 0.83619

1000

0.16381

230.7 тыс. грн.

M (x2 /

1 )

320 0.83619

700

0.16381

382.25 тыс. грн.

Минимум ожидаемых затрат достигается при реализации первой стратегии

– отправить продукцию необходимо первому покупателю.

19

Ситуация 2. Результат эксперимента показал, что одно изделие качественное:

M (x1 /

2 )

80 0.54642 1000 0.45358

497.29 тыс. грн.

M (x2 /

2 )

492.46 тыс. грн.

 

Минимум ожидаемых затрат достигается при реализации второй стратегии

– отправить продукцию необходимо второму покупателю.

Ситуация 3. Результат эксперимента показал, что два изделия бракованные:

M (x1 /

3 )

80 0.22145 1000 0.77855

796.266 тыс. грн.

M (x2 /

3 )

615.85 тыс. грн.

 

Минимум ожидаемых затрат достигается при реализации второй стратегии – отправить продукцию необходимо второму покупателю.

20

Лабораторная работа №4 Принятие многоцелевых решений

Цель: научиться осуществлять выбор альтернативы в условиях наличия множества целей, критериев и нескольких информационных ситуаций, применять полученные знания при создании программных продуктов.

Задание. Пусть субъект управления имеет

Q(Q

0) ситуаций принятия

решений

X , , F1 , X , , F 2 , X , , F Q ,

которые

отличаются функционалом

оценивания в заданной информационной ситуации

I .

Необходимо определить

оптимальное решение для всех Q ситуаций принятия решений одновременно.

Использование основных факторов

v, u, w принятия

многоцелевых решений

позволяет получить ситуацию принятия решений с одним скалярным функционалом оценивания для заданной информационной ситуации I и критерия принятия решений.

Заданы множество решений органа управления – X

x1..xk , множество

возможных ситуаций –

1 ,..., q , тип функционала

оценивания и

информационная ситуация.

 

 

Определить в соответствии с исходными данными (таблица 1) оптимальное решение. Функционалы оценивания строятся таким образом, чтобы не было идентичного повторения матриц, используя генератор случайных чисел в пределах заданного диапазона.

Использовать при определенном типе информационной ситуации:

1)

I1

– критерий Байеса (при q =2 p1 0.45 ; при q =3 p2 0.25, p1 0.35 ; при

q =4 p2

0.2, p1

0.25, p3 0.3);

2)I 4 – критерий Лапласа;

3)I 5 – критерий Вальда;

4)I 6 – критерий Гурвица ( 0.6 ).

Приоритет задается студентом самостоятельно с помощью соответствующих весовых коэффициентов.

Построить программный модуль для принятия многоцелевых решений, предусмотреть возможность ввода исходных данных пользователем, информативность алгоритма, вывод по результатам оценки альтернатив по критерию.