Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теория игр_раздел 7.DOC
Скачиваний:
21
Добавлен:
25.12.2018
Размер:
256.51 Кб
Скачать

4. Критерий Сэвиджа.

В смысле степени пессимизма этот критерий сходен с критерием Вальда, но сам пессимизм здесь понимается по-другому;

Иногда целесообразно выбирать стратегию по критерию, определяемому применительно не к значениям элементов {aij} матрицы А выигрышей ЛПР, а к элементам {rij}матрицы R рисков (по иной терминологии – матрицы сожалений, дополнительных потерь или выигрышей), определяемых из соотношений:

rij = aij - или rij = aij - (7.5)

где - максимальный выигрыш ( - минимальный проигрыш), который получил бы игрок А, если бы он знал состояние природы; aij – выигрыш (проигрыш), который он получит, применяя стратегию Ai в условиях неопределенности.

То есть, в задачах с минимизацией потерь величина aij для каждого состояния природы определяет те минимальные потери, которые ЛПР несет обязательно даже при своем наилучшем действии, то есть даже если бы он знал состояние природы, это необходимые или неизбежные потери.

Таким образом, риск или сожаление выступает как плата за отсутствие информации.

Критерий Сэвиджа запишется в виде:

или Sa = rij (7.6)

Минимаксные критерии Вальда и Сэвиджа, исходящие из предположения, что природа действует наихудшим для человека образом, являются оправданными в стратегических играх, но в статистических играх они выражают точку зрения очень осторожного человека, старающегося получить доступное и не гоняющегося за несбыточным, чтобы не потерпеть случайно большего ущерба. То есть, это весьма перестраховочный подход, применение которого, тем не менее, в ряде случаев оправдано. Недостатком минимаксных принципов следует считать также то, что они не учитывают априорной информации о состояниях природы и тем самым ограничивают тот выигрыш, который эта информация может дать.

Поэтому минимаксные принципы можно рекомендовать в тех случаях, когда отсутствует априорная информация о состояниях природы или есть основания сомневаться в достоверности этой информации.

5. Критерий Гурвица. Этот критерий рекомендует при принятии решений не руководствоваться ни крайним пессимизмом, ни безудержным оптимизмом (который присущ, например, максимаксному критерию применительно к матрице А). Для реализации этих рекомендаций назначается коэффициент 0<L<1, который называется коэффициентом оптимизма. Критерий Гурвица имеет вид:

Hu = (L·аij + (1-L)·аij) (7.7)

При L=0 этот критерий вырождается в критерий Вальда (критерий перестраховщика, принцип осторожности); при L=1 – в максимаксный критерий абсолютного оптимиста. Коэффициент L в реальности назначают, исходя из достаточно субъективных соображений на основе экспертных оценок складывающейся ситуации, базируясь на статистических данных. Чем опаснее ситуация, чем меньше склонность к риску, то есть чем больше желание подстраховаться, тем ближе к 0 назначается L, и наоборот.

Существует модификация этого критерия, в которой он формируется не на основе матрицы выигрышей А, а на основе матрицы рисков R.

В заключение можно отметить, что если мы имеем дело с ситуацией, характеризующейся наличием априорной информации о состояниях природы, или многократно повторяющимися состояниями и многократно повторяющимися решениями, то целесообразно применять принцип Байеса или Гурвица. В случае разового решения или отсутствия априорной информации применяют обычно критерий Лапласа или минимаксный принцип Вальда, или критерий минимальных потерь Севиджа.

Пример 7.1. Задана матрица А (таблица 7.1) игры человека с природой и вектор априорных вероятностей q1=0,3; q2=0,5; q3=0,2; q3=0,4.

Таблица 7.1.

P1

P2

P3

P4

А1

35

35

3

10

3

А2

24

1

6

90

1

А3

40

60

10

15

10

40

60

10

90

Требуется выбрать предпочтительную для ЛПР стратегию по критериям Байеса, Лапласа, Вальда, Сэвиджа и Гурвица.

Решение.

1. По критерию Байеса

Ba = qj·аij = (0,335+0,135+0,23+0,410=18,6 0,324+0,11+0,26+0,490=44,5; 0,340+0,160+0,210+0,415=26) = 44,5;

i* = arg Ba = 3.

2. По критерию Лапласа:

La = (35+35+3+10=83; 24+1+6+90=121; 40+60+10+15=125) = 125/4);

i* = arg La = 3.

3. По критерию Вальда:

Wa = аij = (3; 1; 10) = 10;

i*=arg Wa=3.

4. По критерию Сэвиджа.

Для нахождения наилучшего решения по критерию Сэвиджа рекомендуется в платежной таблице определить наиболее благоприятные элементы аij, которые получил бы игрок А, если бы он заранее знал состояния природы.

Так, если бы игрок А знал, что природа будет "использовать стратегию" P1, то он бы выбрал стратегию А3. Поэтому в столбце P1 для стороны А наибольший элемент 40. Аналогично, в столбце P2 наибольший элемент 60 (стратегия А3), в столбце P3 - элемент 10 (стратегия А3), в столбце P4 - элемент 90 (стратегия А2).

Затем эти "благоприятные" элементы вычитаем из элементов соответствующих столбцов. В результате получим преобразованную матрицу выигрышей (таблица 7.2), которую называют матрицей рисков или матрицей сожалений.

Таблица 7.2.

P1

P2

P3

P4

А1

-5

-25

-7

-80

А2

-16

-59

-4

0

А3

0

0

0

-75

К этой таблице применяется принцип минимакса (принцип осторожности). Для удобства преобразуем платежную матрицу (таблица 7.2) в матрицу с положительными элементами, добавив к каждому элементу максимальное положительное число, равное по модулю минимальному отрицательному (-80). Получим табл. 7.3.

Таблица 7.3.

P1

P2

P3

P4

i

А1

75

55

73

0

0

А2

64

21

76

80

21

А3

80

80

80

5

5

j

80

80

80

80

=21

=80

Определим нижнюю и верхнюю цены игры =max (min (aij)) = 21

= min (max(bij)) = 80.

Седловая точка отсутствует, следовательно, решение игры находится в области смешанных стратегий, а цена игры, удовлетворяет условию 21≤’≤80, истинная цена игры (вычтем добавленную величину 80) – условию -59≤  ≤0.

5. По критерию Гурвица при L1 = 0,4; L2 = 0,2

Пусть с1i = minj aij - наименьший выигрыш при использовании стратегии Ai, с2i = maxj aij - наибольший выигрыш при этой же стратегии. Вычислим значения критерия Гурвица для i=1,3: Hui = L ×с2i + (1 - L) ×с1i,

Результаты расчетов приведены в таблице 7.4.

Таблица 7.4.

Аi

Pj

с1i

с2i

Hui при:

P1

P2

P3

P4

L=0,4

L=0,2

А1

35

35

3

10

3

35

15,8

9,4

А2

24

1

6

90

1

90

36,6

18,8

А3

40

60

10

15

10

60

30

20

Для каждого значения L выбирается стратегия, обеспечивающая max Hui. Так, в нашем примере при L=0,4 целесообразно использовать стратегию А2, обеспечивающую выигрыш, равный 36,6 единицам; при L=0,2- стратегию A3 с выигрышем 20 единиц.

Пример 7.2. Возможно строительство четырех типов электростанций: A1 (тепловых), A2 (приплотинных), A3 (бесшлюзовых) и A4 (шлюзовых). Эффективность каждого из типов зависит от различных факторов: режима рек, климатических условий, стоимости топлива и его перевозки и т.п. Предположим, что выделено четыре различных состояния «природы» (Р1, Р2, Р3 и Р4), каждое из которых означает определенное сочетание факторов, влияющих на эффективность энергетических объектов. Экономическая эффективность строительства отдельных типов электростанций изменяется в зависимости от состояний природы и задана матрицей Таблица 7.5.

Р1

Р2

Р3

Р4

maxjaij

minjaij

А1

5

2

8

4

8

2

А2

2

3

4

12

12

2

А3

8

5

3

10

10

3

А4

1

4

2

8

8

1

Cогласно критерию Вальда следует выбрать решение А3, т.е. предусмотреть строительства бесшлюзовой ГЭС.

Воспользуемся критерием Севиджа. Построим матрицу рисков: Таблица 7.6.

Р1

Р2

Р3

Р4

maxi rij

А1

3

3

0

8

8

А2

6

2

4

0

6

А3

0

0

5

2

5

А4

7

1

6

4

7

Покажем, например, как были получены элементы первого столбца матрицы R. Имеем mах a11 = a31 = 8, поэтому r11 = a31 - a11 = 3, r21 = a31 - a21 = 6, r31 = а31 - a31=0, r413141=7. Согласно критерию Севиджа определяем .

В соответствии с этим критерием также предполагается решение Аз - строительства бесшлюзовой ГЭС.

Воспользуемся критерием Гурвица. Положим L = 0,5; тогда

т.e. следует принять решение А2 - строительство приплотинных ГЭС.

Рассмотрим принцип Байеса - Лапласа. Если предположить известным распределение вероятностей для различных состояний природы, например считать эти состояния равновероятными (q1 = q2 = q3 = q4 = 1/4), то для принятия решения следует найти математические ожидания выигрыша:

Так как максимальное значение имеет М3, то следует выбрать решение Аз - строительство бесшлюзовой ГЭС.