Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Курс лекций.doc
Скачиваний:
363
Добавлен:
09.04.2015
Размер:
1.28 Mб
Скачать

4 Решение матричных игр в смешанных стратегиях

Обозначим через р1, ..., рm вероятности, с которыми игрок А использует в ходе игры свои чистые стратегии A1, ..., Аm. Для вероятностей рi выполняются условия:

. (7.3)

Упорядоченное множество , элементы кото­рого удовлетворяют условиям (7.3), полностью определяет ха­рактер игры игрокаА и называется его смешанной стратеги­ей. Таким образом, смешанной стратегией игрока А является полный набор вероятностей применения его чистых страте­гий. Механизм случайного выбора чистых стратегий, которым пользуется игрок А, обеспечивает ему бесконечное множество смешанных стратегий. Любая его чистая стратегия Аi может рассматриваться как частный случай смешанной стратегии, i-я компонента которой равна 1, а остальные равны 0, т. е. р = (0; ...; 1; ...; 0).

Аналогично, упорядоченное множество , эле­менты которого удовлетворяют соотношениям

, (7.4)

является смешанной стратегией игрока В. Игрок В, как и иг­рок А, располагает бесконечным множеством смешанных стра­тегий.

Итак, пусть игроки А и В применяют смешанные стратегии р и q. Это означает, что игрок А использует стратегию Ai с вероятностью pi, а игрок В - стратегию Вj с вероятностью qj. Поскольку игроки выбирают свои чистые стратегии случайно и независимо друг от друга, то вероятность выбора комбина­ции (Аi; Вj) будет равна произведению вероятностей pi и qj. При использовании смешанных стратегий игра приобрета­ет случайный характер, случайной становится и величина вы­игрыша игрока А (проигрыша игрока В). В связи с этим мож­но вести речь лишь о средней величине (математическом ожи­дании) выигрыша (проигрыша). Ясно, что эта величина явля­ется функцией от смешанных стратегий р и q и определяется по формуле

. (7.5)

Функция (7.5) называется платежной функцией игры с матрицей, заданной таблицей 7.2.

Таблица 7.2 - Платежная матрица игры

Аi

Вj

pi

В1

Вn

А1

а11

a1п

p1

Am

am1

amn

pm

qj

q1

qn

Нижней ценой игры будем называть число α, определяемое по формуле ,a верхней ценой игры – число β, определяемое по формуле .

Оптимальными являются смешанные стратегии р* и q* игроков А и В, удовлетворяющие равенству

==(7.6)

Величину , полученную по формуле (7.6), называютценой игры v.

5 Решение статистических игр по различным критериям

Статистические игры (игры с природой) – это парные матричные игры, в которых сознатель­ный игрок А (статистик), заинтересованный в наиболее выгод­ном для него исходе игры, выступает против участника, совер­шенно безразличного к результату игры (природой П).

Статистик может использовать несколько стратегий A1, ..., Аm. Природа также обладает множеством стратегий (состоя­ний) П1, ..., Пn. Под состоянием природы понимается полная совокупность внешних условий, в которых статистику приходится выбирать свою стратегию.

В своих взаимоотношениях с природой статистик может пользоваться как чистыми стратегиями Ai, так и смешанными стратегиями . Если он имеет возможность оценить последствия применения каждой своей чистой стратегииАi в зависимости от любого состояния Пj природы, т. е. если ему известен численный результат aij для каждой допустимой комбинации (Ai; Пj), то статистическую игру можно задать платежной матрицей [аij] (таблица 7.3).

Таблица 7.3 - Платежная матрица игры

Аi

Пj

рi

П1

Пn

А1

а11

a1п

р1

Am

am1

amn

рm

βj

β1

βn

Часто построение платежной матрицы является трудоемким этапом подготовки принятия решения. Поэтому при анализе игры с природой вводится показа­тель, позволяющий оценить, насколько то или иное состоя­ние природы влияет на исход ситуации. Этот показатель на­зывается риском.

Риском rij статистика, когда он пользуется чистой стра­тегией Аi при состоянии Пj природы, называется разность между максимальным выигрышем , который он мог бы получить, достоверно зная, что природой будет реализо­вано именно состояние Пj, и тем выигрышем aij, который он получит, используя стратегию Аi, не зная, какое из состоя­ний Пj природа действительно реализует. То есть элементы матрицы рисков определяются по формуле

(7.7)

где βj – максимально возможный выигрыш статистика при состоянии Пj (макси­мальный элемент j-го столбца платежной матрицы (таблица 7.4)), т. е. .

Таблица 7.4 - Платежная матрица игры

Аi

Пj

П1

Пn

А1

r11

r1п

Am

rm1

rmn

qj

q1

qn

Решение статистической игры может находиться либо в смешанных стратегиях, либо в чистых стратегиях.

Учитывая специфику статистических игр, при поиске оп­тимальных решений обращаются к различным критериям, дающим некоторую логическую схему принятия решения. Поскольку критерии формулируются на основе здравого смысла, интуиции и практической целесообразности, то они помогают оценить принимаемое решение с различных пози­ций, что позволяет избежать грубых ошибок в хозяйствен­ной деятельности.

Применяется две группы критериев, использующих и не использующих априорные вероятности qj состояний при­роды. К первой группе относятся критерии Байеса и Лапла­са.

В качестве оптимальной по критерию Байеса принимает­ся чистая стратегия Аi, при которой максимизируется сред­ний выигрыш статистика

, (7.8)

то есть обеспечивается . (7.9)

Если статистику представляются в равной мере правдо­подобными все состояния Пj природы, то , и оптимальной по критерию Лапласа считается чистая стра­тегия Аi, обеспечивающая

. (7.10)

Ко второй группе критериев, применяемых при неизвест­ных априорных вероятностях состояний природы, относятся критерии Вальда, Сэвиджа и Гурвица.

Критерий Вальда – это максиминный критерий, который является критерием крайнего песси­мизма, так как здесь статистик исходит из предположения, что природа «действует» против него наихудшим образом, т. е. реализует такие состояния Пj, при которых величина его вы­игрыша принимает наименьшее значение. Оптимальной по кри­терию Вальда считается чистая стратегия Аi, при которой наименьший выигрыш статистика будет максимальным, то есть ему обеспечивается максимин

Для смешанных стратегий критерий Вальда формулиру­ется так: оптимальной считается та смешанная стратегия, при которой минимальный средний выигрыш статистика будет максимальным, то есть стратегия р*, найденная из условия

Критерий Сэвиджа, как и критерий Вальда, является кри­терием крайнего пессимизма. Оптимальной по критерию Сэвиджа считается та чистая стратегия Аi, при которой минимизируется величина ri мак­симального риска, то есть обеспечивается .

Для смешанных стратегий критерий Сэвиджа формули­руется так: оптимальной считается та смешанная стратегия, при которой максимальный средний риск статистика минимизируется, то есть стратегия р*, найденная из условия .

Критерий Гурвица, называемый критерием пессимизма-оптимизма, рекомендует рассчитывать на нечто среднее. Оптимальной по критерию Гурвица считается чистая стратегия Аi, найденная из условия где принадлежит интервалу (0; 1) и выбирается из субъективных сооб­ражений.

При = 1 критерий Гурвица превращается в критерий крайнего пессимизма Вальда, а при= 0 — в критерий край­него оптимизма.

Надо отметить, что анализ практических ситуаций следу­ет проводить по нескольким критериям, что позволит глубже вникнуть в суть явления и выбрать обоснованное решение.