Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теоретико-игровые методы принятия решений (Еремеев А. П.).doc
Скачиваний:
415
Добавлен:
28.06.2014
Размер:
1.24 Mб
Скачать
      1. Случай с неизвестными вероятностями состояний «природы»

Если вероятности состояний «природы» не известны, то для поиска решения ЛПР может применять различные критерии оптимальности. Рассмотрим наиболее используемые критерии.

Критерий Вальда– наиболее осторожный критерий (критерий крайнего пессимизма), согласно которому оптимальной для ЛПР является стратегия, максимизирующая минимальный выигрыш:

.

Критерий Сэвиджа – также осторожный критерий, согласно которому оптимальной для ЛПР является стратегия, минимизирующая максимальный риск:

.

Компромиссный критерий Гурвица – компромиссный критерий, согласно которому в качестве оптимальной для ЛПР выбирается стратегия, максимизирующая следующее выражение:

,

где k– коэффициент осторожности (пессимизма), 01. Заметим, что приk= 1 критерий Гурвица переходит в критерий Вальда, а приk= 0 имеем так называемый критерий «крайнего оптимизма», предлагающий ЛПР в качестве оптимальной стратегию, максимизирующую максимальный выигрыш.

Естественно, чем ответственнее выбор и чем меньше склонен рисковать ЛПР, тем ближе к 1 следует выбирать коэффициент k. При отсутствии у ЛПР информации для выбора или «по умолчанию» рекомендуется выбиратьk 0,6.

Если ЛПР сомневается при выборе критерия оптимальности, то рекомендуется применить несколько критериев и выбрать ту стратегию, которую рекомендует большинство из них.

В качестве примера рассмотрим игру с «природой», матрицы G(34) иR(34) которой с некоторыми дополнительными столбцами представлены соответственно табл. 5.4 и табл. 5.5.

Таблица 5.29

G(34)

Пj

Ai

П1

П2

П3

П4

i

wi

hi

A1

19

30

41

49

19

49

31

A2

51

38

10

20

10

51

26,4

A3

73

718

81

11

11

81

39

Таблица 5.30

G(34)

Пj

Ai

П1

П2

П3

П4

si

A1

54

8

0

0

54

A2

22

0

71

29

71

A3

0

30

40

38

40

Дополнительные столбцы таблиц содержат следующую информацию, определяемую по соответствующим матрицам выигрышей и рисков: ,,,.

Применение соответствующих критериев приведет к следующим результатам:

  • согласно критерию Вальда оптимальной для ЛПР стратегией будет A1;

  • согласно критерию Сэвиджа оптимальной для ЛПР стратегией будет A3;

  • согласно критерию Гурвица (с k= 0,6) оптимальной для ЛПР стратегией будетA3.

Два критерия из трех рекомендуют ЛПР выбрать стратегию A3., что и следует сделать, если ЛПР не боится риска получить очень маленький выигрыш 11, возможный при выборе этой стратегии. Если такой риск не приемлем для ЛПР, то следует выбрать наиболее осторожную стратегиюA1, рекомендуемую критерием Вальда и гарантирующую минимальный выигрыш 19.

Заметим, что в играх с «природой», как правило, не используются смешанные стратегии по следующим причинам:

  • в антагонистических играх смешанные стратегии применяются часто для того, чтобы обмануть, запутать противника, что в играх с «природой» не имеет смысла;

  • аппарат смешанных стратегий ориентирован на получение максимального среднего выигрыша, т.е. выигрыша, который будет получен при многократном повторении игры, но в таком случае накапливается статистика и выявляются вероятности qiсостояний «природы», при наличии которых может быть применен критерий Лапласа, дающий решение в чистых стратегиях.