Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
72
Добавлен:
12.02.2015
Размер:
3.41 Mб
Скачать

Элементы теории статистических игр

Существуют задачи принятия решения, в которых одной из оперирующих сторон является «природа». Особенностью этого «игрока» является безразличие к исходу результата операции. Сложность проблемы заключается в том, что ЛПР не может представить себе образ действия и поведение «природы». Теория статистических игр реализует такие задачи разделяя их на две группы:

  1. Статистические игры, в которых невозможно проведение эксперимента.

  2. Статистические игры с возможностью проведения эксперимента.

  1. Идеальный эксперимент (эксперимент полностью определяет поведение природы).

  2. Неидеальный эксперимент (уточняет априорную информацию).

Статистические игры без эксперимента

Ситуация с формальной точки зрения совпадает с матричной игрой, так как может быть задана в виде таблицы выигрышей ЛПР, строки которой соответствуют стратегиям ЛПР, а столбцы состояниям природы. Концептуальное отличие: природе мы не можем приписать целенаправленных осознанных действий.

Пример

П1, П2, П3, П4 – состояния «природы», х1, х2, х3 - стратегии ЛПР

x П

П1

П2

П3

П4

x1

2

3

4

5

x2

5

4

1

2

x3

7

2

8

1

Это – платежная матрица

Существует другой способ задания ситуации – задание матрицы риска. Для этого в каждом столбце матрицы выигрышей находится максимальное число , а затем рассчитывается риск по формуле

Получим матрицу риска

.

x П

П1

П2

П3

П4

x1

5

1

4

0

x2

2

0

7

3

x3

0

2

0

4

7

4

8

5

По отношению к тому, какой информацией мы располагаем о поведении природы возможно 3 ситуации:

  1. Известны вероятности, с которыми наступает состояние природы,

  2. Вероятности не известны, но можно судить с той или иной достоверностью чему они могут быть равны,

  3. Ничего не знаем о вероятностях состояния природы.

  1. Вероятности мы знаем, но нет возможности их уточнить. Можно поступить так: либо максимизировать средний выигрыш, либо минимизировать средний риск (n – число состояний природы). Рассчитаем средний выигрыш при условии, что ЛПР выбрал iю стратегию. Тогда средний выигрыш, полученный ЛПР за много партий составит:

,

где- вероятность наступления состоянияПj

Очевидно ЛПР должен выбрать такую свою стратегию i0, чтобы величина была максимальна, т.е.

Важно понимать, что результат получим в среднем за много партий.

Вместо максимизирования среднего выигрыша можно минимизировать средний риск, но результат будет тот же:

  1. Вероятности неизвестны, но можно предположить, как они упорядочены. Для решения задачи значения qj , берем равные членная некоторой убывающей геометрической прогрессии. После этого мы ведем расчеты так, как будто мы точно знаем qj .

Один из подходов (принцип недостаточности основания Лапласа) – принять все вероятности равными, т.е. .

3. Критерии, характеризующие характер ЛПР:

  • Критерий Вальда (критерий крайнего пессимизма):

  • Критерий минимакса риска Сэвиджа:

Оба эти критерия предполагают злонамеренность природы

  • Критерий пессимизма - оптимизма Гурвица:

где α – степень пессимизма ЛПР(α=[0,1]).

Решим наш пример при следующих вероятностях

q1=1.2, q2=0.3, q3=0.4, q4=0.1;

Средние выигрыши:

a1=0.2∙2+0.2 5+0.27=2.8,

a2=0.3∙3+0.3∙4+0.3∙2=2.7,

a3=0.4∙4+0.4∙1+0.4∙8=5.2,

a4=0.1∙5+0.1∙2+0.1∙1=0.8;

Выбираем i0=3

Проверим по рискам:

r1=0.2∙5+0.3∙1+0.4∙4=2.9,

r2=0.2∙2+0.4∙7+0.1∙3=3.5,

r3=0.3∙2+0.1∙4=1;

Результат тот же i0’=3;

Посчитаем по Гурвицу с α=0.5;

Выбираем третью стратегию.

Соседние файлы в папке Лекции