Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1 / 28-04 / lr4-meth.doc
Скачиваний:
38
Добавлен:
19.04.2013
Размер:
117.25 Кб
Скачать

10

Лабораторная работа № 3. Принятие решений в условиях риска на основе теории игр

Теория игр относится к так называемым игровым методам исследования операций. Эти методы предназначены для обоснования решений в условиях неопре­деленности, где неопределенность означает неполноту, неясность тех дан­ных, на основе которых должно приниматься решение.

Игровые методы дают возможность выработать наилучшую в данных условиях обстановки линию поведения, совокупность правил, или стратегию, руководствуясь которыми можно обеспечить себе максимально возможный средний выигрыш.

В тех случаях, когда неопределенность обстановки вызвана сознательными злонамеренными действиями сторон, применяется аппарат теории игр, которая служит для выработки рекомендаций по рациональному образу действий в условиях конфликтных ситуаций. Под конфликтными ситуациями понимаются такие, в которых сталкиваются две или более стороны, преследующие различные цели. Причем результат любого действия каждой из сторон зависит от того, какой образ действий выберет «противник». Поскольку в конфликтных ситуациях мы, как правило, не располагаем достаточными сведениями о том, что задумал «противник», решение методами теории игр принимается в условиях неопределенности.

Под игрой понимаются мероприятия, состоящие из ряда действий сторон. Если в конфликте участвуют две стороны, игра называется парной, если более двух – множественной.

Система условий, регламентирующая возможные варианты действий сторон, объем информации каждой стороны о поведении другой, а также результат, к которому приводит данная совокупность действий, составляют правила игры.

Игра состоит из ряда последовательных этапов или ходов, причем под ходом понимается выбор одного из предусмотренных правилами игры действий.

Совокупность правил, определяющих выбор варианта действий при каждом ходе в зависимости от сложившейся обстановки называется стратегией.

Результатом игры является выигрыш или проигрыш одной из сторон, обычно выражаемый в количественной форме. Например, математическое ожидание дохода или прибыли.

Оптимальной стратегией является такая, которая при многократном повторении игры обеспечивает данной стороне максимально возможный средний выигрыш.

Игры, в которых одна сторона проигрывает столько, сколько выигрывает другая, называются играми с нулевой суммой.. В лабораторной работе будут рассматриваться только парные игры с нулевой суммой.

В общем виде постановка задачи теории игр производится следующим образом:

  • имеется некоторая операция (целенаправленное действие), в которой участвуют две стороны А и В с противоположными интересами;

  • имеются правила игры, регламентирующие результаты, к которым приводят возможные варианты действий сторон;

  • результаты действий сторон (выигрыши) выражены в количественной форме и обозначены аij (математическое ожидание выигрыша стороны А, сделавшей свой i‑й ход npи j-м ходе стороны В).

Условие игры обычно записывается в форме платежной матрицы, или матрицы игры (табл. 1).

Таблица 1. Матрица игры

Стратегии стороны А

Стратегии стороны В

B1

B2

Bn

αi

A1

a11

a12

a1n

α1

A2

a21

a22

a2n

α2

Am

am1

am2

amn

αm

βj

β1

β2

βn

В данной игре сторона А (мы) имеет m стратегий, а сторона В (противник) – n стратегий (игра m×n).

Необходимо найти наилучшие (оптимальные) стратегии сторон, а также ожидаемый средний выигрыш (результат).

При решении игры встречаются следующие понятия:

α = MAX {αi}; = MAX MIN {аij} – максимин, или нижняя цена игры;

β = MIN {βi}; = MIN MAX {аij} – минимакс, или верхняя цена игры.

Получение максимина и минимакса ясно из рассмотрения матрицы игры (табл. 1 и 2).

В тех случаях, когда α = β, игра имеет седловую точкуэлемент матрицы, являющийся одновременно минимальным в сво­ей строке и максимальным в своем столбце.

Общее значение нижней и верхней цены игры α = β = v называется чистой ценой игры.

Седловой точке соответствует пара стратегий сторон (стратегии Аi и Вj), которые являются оптимальными. Совокупность этих стратегий называется решением игры в чистых стратегиях.

В тех случаях, когда αβ, решение находится в смешанных стратегиях. Смешенными стратегиями называются такие, которые получаются путем случайного чередования чистых стратегий.

Смешанная стратегия стороны А обозначается

S*А(p1; p2; …; рm),

где p1; p2; …; рm - вероятности, с которыми применяются стратегии А1; А2; Аm.

Причем р1 + р2 + … +рm == 1.

Аналогично для стороны В:

S*B(q1; q2; …; qn),

где q1 + q2 + … +qn == 1.

Решением игры в смешанных стратегиях будет пара оптимальных смешанных стратегий, обозначенных S*А и S*В. Выигрыш, соответствующий этому решению, называется ценой игры v. Применительно к играм 2×2:

р1 =

a12 – a11

a21 + a12 – a11 – a22

p2 = 1 – p1

q1 =

a21 – a22

a11 + a22 – a12 – a21

q2 = 1 – q1

Стратегии, входящие в оптимальную стратегию с вероятностями, отличными от нуля, называются активными.

v =

a22 a11– a12 a21

a11 + a22 – a12 – a21

Игра 2×2 имеет следующее геометрическое решение (рис. 1):

  • на отрезке оси абсцисс, длина которого равна единице, левый конец участка (х = 0) обозначает стратегию А1, а правый (х = 1) – стратегию А2; промежуточные точки участка изображают смешанные стратегии стороны А;

  • через точки А1 и А2 проводятся перпендикуляры к оси абсцисс: оси I-I и II-II, На оси I-I откладываются выигрыши при стратегии А1, а на оси II-II – выигрыши при стратегии А2;

  • стратегия противника В1 дает на осях I-I и II-IIточки с координатами а11 и а12 соответственно, а стратегия В2 – точки с координатами а21 и а22 соответственно;

  • ордината точки N пересечения стратегий В1 и В2 дает величину выигрыша v – цену игры. Абсцисса точки N дает вероятности обеих стратегий р1 и р2, которые равны расстояниям от точки S* до правого и левого конца отрезка [A1; A2] соответственно.

Нижняя (гарантированная) граница выигрыша выделена на рис. 1 жирной линией.

Рис. 1. Геометрическое решение игры 2×2

Соседние файлы в папке 28-04