Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Тырсин А.Н. - Системный анализ. Модели и методы (без обложки)

.pdf
Скачиваний:
96
Добавлен:
28.11.2019
Размер:
3.68 Mб
Скачать

определенности, только принятое решение является оптимальным не в каждом отдельном случае, а в среднем.

Пример 6.9. Пусть планируется операция в заранее неизвестных

метеорологических условиях с вариантами 1, 2, 3,

4. Согласно данным

метеосводок за много лет вероятности этих

вариантов равны

соответственно: P( 1 ) 0,1,

P( 2 ) 0,2 ,

P( 3 ) 0,5,

P( 4 ) 0,2 .

Проведение операции в различных условиях влечет за собой различную выгоду, представленную матрицей (см. табл. 6.4). Видим, что оптимальной стратегией является A1.

Таблица 6.4. Расчет средней выгоды ai использования стратегий Ai

 

1

2

3

4

ai

A1

1

4

5

9

5,2

A2

3

8

4

3

4,5

A3

4

6

6

2

5,0

P( j)

0,1

0,2

0,5

0,2

 

При выборе оптимальной стратегии в условиях с известными вероятностями состояний природы вместо среднего выигрыша можно использовать средний риск

n

ri rij P( j ) , i 1, ..., m ,

j 1

который надо обратить в минимум. В данной формуле rij – элемент матрицы риска R, равный

rij max aij aij j aij , i 1, ..., m ,

j 1, ..., n .

 

 

i

 

 

 

 

 

Покажем, что стратегия, максимизирующая средний выигрыш ai ,

совпадает со стратегией,

минимизирующей средний риск

 

. Для этого

ri

выразим средний риск через средний выигрыш

 

 

n

n

n

n

 

 

rij P( j ) ( j aij )P( j ) j P( j ) aij P( j ) C ai .

ri

 

 

j 1

j 1

j 1

j 1

Таким образом, средний риск отличается от среднего выигрыша на константу, а значит, они одновременно достигают своих оптимальных значений.

Важным обстоятельством является тот факт, что при решении статистической игры можно обойтись одними чистыми стратегиями. Действительно, если мы будем применять какую-либо смешанную стратегию SA ( p1, ..., pm ) , тогда средний выигрыш, осредненный и по

стратегиям, будет равен

111

m

a ai pi .

i 1

Это взвешенное среднее средних выигрышей ai , соответствующих чистым

стратегиям Ai. Очевидно, что любое среднее не может превосходить максимальной из усредняемых величин. Поэтому в статистической игре применение смешанной стратегии не может быть выгоднее, чем применение оптимальной чистой стратегии.

Пример 6.10. Выбор оптимального варианта капиталовложений при строительстве электростанций.

Пусть необходимо построить в регионе электростанцию. При этом в регионе имеются следующие возможности:

-строительство большого водохранилища и гидроэлектростанции (A1);

-сооружение тепловой электростанции (A2);

-сооружение атомной электростанции (A3).

Затраты складываются из затрат на строительство и эксплуатационных расходов. На эксплуатационные расходы гидроэлектростанции влияют климатические условия, поскольку от погодных условий зависит уровень воды в водохранилищах. На экономическую эффективность тепловой электростанции влияют цены на газ и мазут, срывы поставок мазута из-за неритмичности работы транспорта, вызванной плохими климатическими условиями. Экономическая эффективность атомной электростанции зависит от больших затрат на строительство, а также от устойчивости агрегатов и системы управления во время эксплуатации. Случайные факторы, от которых зависит экономическая эффективность вариантов капиталовложений, объединим в четыре возможных состояния природы: 1

цены на газ и мазут – низкие, климатические условия – благоприятные;

2 – цены на газ и мазут – высокие, климатические условия – благоприятные; 3 – цены на газ и мазут – низкие, климатические условия

неблагоприятные; 4 – цены на газ и мазут – высокие, климатические условия – неблагоприятные.

Представим возможные выигрыши в виде платежной матрицы:

Таблица 6.5. Платежная матрица эффективности капиталовложений при строительстве электростанций

 

1

2

3

4

i

A1

50

50

25

25

25

A2

40

25

35

20

20

A3

30

30

30

30

30

j

50

50

35

30

 

112

Рассмотрим задачу как матричную игру, считая, что дополнительная статистическая информация отсутствует. Очевидно, минимаксной стратегией является A3, т.е. строительство атомной электростанции.

Теперь предположим, что существует многолетняя статистика, позволяющая оценить вероятности состояний природы. Пусть они равны следующим значениям: P( 1 ) 0,15, P( 2 ) 0,3 , P( 3 ) 0,2 , P( 4 ) 0,35 .

Тогда можно определить средний выигрыш для каждого из решений: a1 36,25, a2 27,5 , a3 30 . При этом максимальный средний выигрыш

соответствует первой стратегии A1, т.е. оптимальным решением будет инвестирование средств в строительство гидроэлектростанции.

Выше была рассмотрена ситуация, когда появление дополнительной статистической информации о состояниях природы привело к изменению ранее принятого решения. Можно сказать, что дополнительная информация всегда появляется в результате некоторого эксперимента. Зададимся вопросом, в каких случаях целесообразно проведение эксперимента для увеличения количества имеющейся информации? Естественно, этот вопрос возникает только тогда, когда затраты на проведение эксперимента существенны и сравнимы с тем увеличением выигрыша, которое можно получить, узнав более точно обстановку. Если затраты на проведение эксперимента меньше дополнительного увеличения выигрыша, то эксперимент является целесообразным.

6.4.3. Идеальный эксперимент

Рассмотрим случай идеального эксперимента E, приводящего к точному знанию состояния природы. Пусть задана матрица выигрышей A {aij }m n . Пусть также известны вероятности P( 1), P( 2 ), ... , P( n ) состояний природы 1, 2, 3, 4, а затраты на проведение эксперимента равны C. Если не проводить эксперимента, то нужно выбрать стратегию с максимальным выигрышем

 

 

n

a max ai max aij P( j ) .

i

i

j 1

 

 

Теперь

предположим, что мы провели эксперимент E и точно

выяснили действительное состояние природы. Если это состояние k, то

надо применять стратегию, для которой достигается max aik k . Нужно

i

заранее решить, будем ли мы производить эксперимент E или нет, и нам заранее неизвестно, какое состояние на самом деле имеет место, а значит, и какой будет выигрыш. Поэтому осредним возможный средний выигрыш

n

j P( j ) .

j 1

113

Таким образом, потребность в эксперименте должна определяться по правилу: C a . Представим это неравенство в более удобном виде. Раскроем и a :

n

 

n

 

n

 

 

 

 

 

C j P( j ) max aij P( j ) min

( j aij )P( j ) min

 

 

 

,

ri

r

j 1

i

j 1

i

j 1

i

 

 

 

 

 

 

 

т.е. C r .

Пример 6.11. Рассмотрим игру с природой из примера 6.9. Определим целесообразность идеального эксперимента, если его стоимость C = 2. Перейдем к матрице рисков

 

3

4

1

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

R

1

0

2

6

.

 

 

 

 

 

 

 

 

0

2

0

7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Отсюда

получим

 

 

 

 

 

 

 

 

 

1,6 .

 

r1 1,6 ,

r2 2,3 ,

r3 1,8, следовательно,

r

Поскольку C r , то эксперимент следует признать нецелесообразным.

6.4.4. Неидеальный эксперимент

Рассмотрим случай неидеального эксперимента E, который не приводит к выяснению в точности состояния природы, а лишь дает какието косвенные свидетельства в пользу тех или иных состояний. В общем случае неидеальный эксперимент E приводит к появлению одного из k несовместных событий B1, B2 , ... , Bk . Причем вероятности этих событий

(исходов эксперимента) зависят от состояний, при которых проводится эксперимент. Обозначим условную вероятность появления события Bl при состояниях j через P(Bl / j ) , j 1, ... , n , l 1, ... , k . Будем считать, что эти

вероятности нам известны.

После осуществления неидеального эксперимента E, давшего, например, исход Bl, придется пересмотреть вероятности состояний природы. Они будут характеризоваться не прежними (априорными)

вероятностями

P( 1 ), ... , P( n ) ,

а

новыми

(апостериорными)

вероятностями

P( 1 / Bl ), ... , P( n / Bl ) , определяемыми по формуле Байеса.

Пример 6.12. Продолжим пример 6.11, но в предположении, что проводимый эксперимент неидеальный и может иметь три исхода B1, B2, B3. Условные вероятности P(Bl / j ) этих исходов для разных состояний

известны и приведены в табл. 6.6.

Пусть в эксперименте имел место исход B1. Вычислим по формуле полной вероятности вероятность его появления

114

 

 

n

 

 

 

 

 

P(B1 ) P( j )P(B1 / 1 ) 0,46 .

 

 

 

j 1

 

 

 

 

 

Отсюда вычислим по формуле Байеса

 

P(

 

/ B )

P( j )P(B1 / j )

 

,

j 1, ..., n ,

 

j

 

 

 

1

P(B1 )

 

 

 

 

 

 

 

 

 

апостериорные вероятности:

 

P( 1 / B1) 0,0435 ,

P( 2 / B1 ) 0,3913,

P( 3 / B1 ) 0,4348, P( 4 / B1) 0,1304 .

На основе этих апостериорных вероятностей вычислим значения средних выигрышей ai1 : a11 4,957 , a21 5,391, a31 5,391.

Таблица 6.6. Условные вероятности исходов экспериментов Bl для разных состояний природы j

P(Bl / j)

1

2

3

4

B1

0,2

0,9

0,4

0,3

B2

0,1

0,1

0,5

0,3

B3

0,7

0

0,1

0,4

Таким образом, с учетом результата эксперимента, оптимальными стратегиями являются стратегии A2 и A3, а не A1. При этом

a1 max ai1 5,391.

i

Пример 6.13. Продолжим пример 6.12, но в другой постановке задачи. Определим целесообразность проведения неидеального эксперимента E. Для этого надо произвести аналогичные расчеты для остальных исходов B2 и B3, а также сопоставить средний выигрыш при выполнении эксперимента и без его исполнения. Результаты расчетов:

P(B2 ) 0,34, P( 1 / B2 ) 0,0294 , P( 2 / B2 ) 0,0588, P( 3 / B2 ) 0,7353, P( 4 / B2 ) 0,1765 ;

P(B3 ) 0,2, P( 1 / B3 ) 0,35 ,

P( 2 / B3 ) 0 ,

 

 

 

 

P( 3 / B3 ) 0,25 , P( 4 / B3 ) 0,4 ;

 

 

 

 

a 2

5,529 ,

a 2 4,029

, a 2 5,235, отсюда a 2 max a 2

5,529

;

1

 

2

3

 

i

i

 

 

 

 

 

 

 

 

 

 

a 3

5,2 , a 3

3,25, a 3

3,235

, отсюда a 3 max a 3

5,2 .

 

1

2

3

 

i

i

 

 

 

 

 

 

 

 

 

 

 

В результате получим полный средний выигрыш

k

a * a l P(Bl ) 5,391 0,46 5,529 0,34 5,2 0,2 5,4 .

l 1

Сравнивая это значение с выигрышем в случае не проведения эксперимента, видим, что оно больше на 0,2. Значит, если стоимость эксперимента меньше 0,2, то его надо проводить.

115

6.5. Формальная структура принятия решений в условиях неопределенности

6.5.1. Матрица решений

Принятие решения представляет собой выбор одного из некоторого множества E рассматриваемых вариантов: Ei E. Каждым вариантом Ei однозначно определяется некоторый результат (например, выигрыш, полезность или надежность) ei. Эти результаты должны допускать количественную оценку [47].

Идет поиск варианта с наибольшим значением результата, то есть

целью выбора является max ei . Таким образом, выбор оптимального

i

варианта производится с помощью критерия

E0

 

: Ei0 E ei0

 

 

 

Ei0

max ei .

(6.10)

 

 

 

i

 

 

 

 

 

 

 

При рассмотрении сложных структур и систем каждому допустимому варианту решения Ei могут соответствовать различные внешние условия (состояния) Fj и результаты eij решений.

Под результатом решения (полезностью решения) eij понимают оценку, соответствующую варианту Ei и условиям Fj и характеризующую экономический эффект, полезность, надежность и т.д.

Семейство решений описывается некоторой матрицей (табл. 6.7). Увеличение объема семейства по сравнению с детерминированной ситуацией (одному варианту соответствует одно решение) связано, как с недостатком информации, так и с многообразием возможностей. Первоначальная задача максимизации (6.10) должна быть заменена другой, учитывающей все последствия любого из вариантов решения Ei.

Таблица 6.7. Матрица решений {eij}

 

Fj

F1

F2

 

Fn

Ei

 

 

 

 

 

 

E1

 

e11

e12

 

e1n

E2

 

e21

e22

 

e2n

 

 

 

 

 

 

Em

 

em1

em2

 

emn

6.5.2. Оценочная функция

Чтобы прийти к однозначному и по возможности оптимальному решению даже в том случае, когда каким-то вариантам решений Ei могут соответствовать различные условия Fj, можно ввести подходящие оценочные (целевые) функции. При этом матрица решений {eij} сводится к

116

одному столбцу. Каждому варианту Ei приписывается некоторый результат eir, характеризующий в целом все последствия этого решения.

Процедуру выбора можно представить по аналогии с применением критерия (6.10). Однако возникает проблема: какой смысл вложить в результат eir. Способ построения оценочных функций приведен в табл. 6.8.

Таблица 6.8. Способ построения оценочных функций

E1

e1r

E2

e2r

 

 

Em

emr

Ниже приведены различные оценочные функции, а также

соответствующие им исходные позиции.

 

Оптимистическая позиция:

 

max eir max(max eij ) .

(6.11)

i

i

j

 

Из матрицы решений {eij} (табл. 6.7) выбирается вариант (строка), содержащий в качестве возможного решения наибольший из всех возможных результатов. Делается ставка на то, что выпадет наивыгоднейший случай, и исходя из этого выбирается решение.

Позиция нейтралитета:

 

 

1 n

 

 

 

 

 

 

 

 

 

max eir max

 

eij .

i

i n j 1

 

ЛПР исходит из того, что все встречающиеся решения от «среднего» случая допустимы, и оптимальный с этой точки зрения.

Пессимистическая позиция:

max eir max(min eij ) .

i

i

j

(6.12)

отклонения результата выбирает результат,

(6.13)

ЛПР исходит из того, что надо ориентироваться на наименее благоприятный случай и приписывает каждому из альтернативных вариантов наихудший из возможных результатов. При этом выбирается самый выгодный вариант, то есть ЛПР ожидает наилучшего результата в наихудшем случае.

Позиция относительного пессимизма:

 

min eir min max(max eij eij ) .

(6.14)

i

i j

i

 

Для каждого варианта решения ЛПР оценивает потери в результате по сравнению с определенным по каждому варианту наилучшим результатом, а затем из совокупности наихудших результатов выбирает наилучший согласно представленной оценочной функции.

Примеры оценочных функций можно продолжить и далее.

117

Всякое техническое или экономическое решение в условиях неполной информации – сознательно или неосознанно – принимается в соответствии с какой-либо оценочной функцией. Как только это бывает признано явно, последствия соответствующих решений становятся лучше обозримыми, что позволяет улучшить их качество. При этом выбор оценочных функций всегда должен осуществляться с учетом количественных характеристик ситуации, в которой принимаются решения.

6.6. Классические критерии принятия решений в условиях неопределенности

6.6.1. Максиминный критерий Вальда

Максиминный критерий Вальда (ММ-критерий) использует оценочную функцию (6.13), соответствующую позиции крайней

осторожности.

 

 

 

 

 

При ZMM

max eir

и eir min eij справедливо соотношение

 

 

i

 

j

 

 

 

 

: Ei0 E ei0

 

 

,

(6.15)

E0 Ei0

max min eij

 

 

 

i j

 

 

 

где ZMM – оценочная функция ММ-критерия.

Правило выбора решения в соответствии с ММ-критерием можно интерпретировать следующим образом.

Матрица решений {eij} дополняется еще одним столбцом из наименьших результатов eir каждой строки. Выбрать надлежит те варианты Ei0, в строках которых стоят наибольшие значения eir этого столбца.

Выбранные таким образом варианты полностью исключают риск. В соответствии с этим критерием из всех самых неудачных результатов выбирается лучший. Это перестраховочная позиция крайнего пессимизма, рассчитанная на худший случай. Такая стратегия приемлема, например, когда ЛПР не столь заинтересован в крупной удаче, но хочет себя застраховать от неожиданных проигрышей, то есть ЛПР не может столкнуться с худшим результатом, чем тот, на который он ориентируется. Это свойство позволяет считать максиминный критерий одним из фундаментальных. В приложениях он применяется чаще всего. Однако положение об отсутствии риска стоит различных потерь.

Применение ММ-критерия целесообразно, если ситуация, в которой принимается решение, характеризуется следующими обстоятельствами:

-о возможности появления внешних состояний Fj ничего не известно;

-приходится считаться с появлением различных внешних состояний Fj;

-решение реализуется лишь один раз;

118

-необходимо исключить какой бы то ни было риск, т.е. ни при каких условиях Fj не допускается получать результат, меньший, чем ZMM.

6.6.2. Критерий Байеса Лапласа

При построении оценочной функции ZMM (по ММ-критерию) каждый

вариант Ei

представлен лишь одним из своих результатов eir min eij .

 

j

Критерий Байеса Лапласа (BL-критерий), напротив, учитывает каждое из возможных следствий.

Пусть qj – вероятность появления внешнего состояния Fj. Тогда для BL-критерия

 

n

 

 

 

 

 

ZBL max eir , eir eij q j ,

 

 

 

 

i

j 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

n

 

 

E0 Ei0

: Ei0 E ei0

max eij q j & q j 1 .

(6.16)

 

 

i

j 1

j 1

 

 

 

 

 

Правило выбора решения в соответствии с BL-критерием следующее.

Матрица решений {eij} дополняется еще одним столбцом, содержащим математическое ожидание значений каждой из строк. Выбираются те варианты Ei0, в строках которых стоит наибольшее значение eir этого столбца.

При этом предполагается, что ситуация, в которой принимается решение, характеризуется следующими обстоятельствами:

-вероятности появления внешних состояний Fj известны и не зависят от времени;

-решение реализуется (теоретически) бесконечное число раз;

-для малого числа реализаций решения допускается некоторый риск. При достаточно большом количестве реализаций среднее значение

постепенно стабилизируется. Поэтому при полной (бесконечной) реализации какой-либо риск практически исключен.

Исходная позиция при применении BL-критерия оптимистичнее, чем в случае ММ-критерия, однако она предполагает более высокий уровень информированности и достаточно длинные реализации.

6.6.3. Критерий минимаксного риска Сэвиджа

Критерий минимаксного риска Сэвиджа реализует оценочную функцию (6.14). С помощью обозначений

aij max eij eij ,

(6.17)

i

 

eir max aij max(max eij eij )

j

j

i

формируется оценочная функция

119

Z

 

min e

min

max(max e

e

)

,

(6.18)

 

S

i

ir

i

 

j

i

ij

ij

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и строится множество оптимальных вариантов решения

 

E0

 

: Ei0 E

ei0

 

 

 

 

 

 

Ei0

min max aij .

 

 

 

 

 

 

 

 

 

i

j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для понимания этого критерия определяемую соотношением (6.17) величину aij можно трактовать по-разному:

-как максимальный дополнительный выигрыш, который достигается,

если в состоянии Fj вместо варианта Ei выбрать другой, оптимальный для этого внешнего состояния вариант;

-как потери (риск), возникающие в состоянии Fj при замене оптимального для него варианта на вариант Ei.

Соответствующее критерию Сэвиджа правило выбора решения выглядит так.

Каждый элемент матрицы решений {eij} вычитается из наибольшего

результата max eij соответствующего столбца. Разности aij образуют

i

матрицу остатков (рисков) {aij}. Эта матрица пополняется столбцом наибольших разностей eir. Выбираются те варианты Ei0, в строках которых стоит наименьшее для этого столбца значение.

По выражению (6.18) оценивается значение результатов тех состояний, которые вследствие выбора соответствующего распределения вероятностей, оказывают одинаковое влияние на решение. С точки зрения матрицы решений {eij} критерий Сэвиджа связан с риском, однако, с позиций матрицы {aij}, он от риска свободен. В остальном, к ситуации принятия решений предъявляются те же требования, что и в случае ММкритерия.

6.6.4. Критерий азартного игрока

Критерий азартного игрока использует оценочную функцию (6.11), соответствующую позиции крайнего оптимизма.

При Z A max eir и eir

max eij справедливо соотношение

 

 

i

j

 

 

E0

 

: Ei0 E ei0

 

 

,

Ei0

max max eij

 

 

 

i j

 

 

 

 

 

 

 

где ZA – оценочная функция критерия азартного игрока. Правило выбора решения по данному критерию следующее.

Матрица решений {eij} дополняется еще одним столбцом из наибольших результатов eir каждой строки. Выбрать надлежит те варианты Ei0, в строках которых стоят наибольшие значения eir этого столбца.

120