- •Тема 5. Принятие решений в условиях неопределенности
- •Тема 5. Принятие решений в условиях неопределенности 1
- •5.1.Критерии в условиях неопределенности
- •5.1.1.Критерий Лапласа
- •5.1.2. Минимаксный критерий
- •5.1.3.Критерий Сэвиджа
- •5.1.4. Критерий Гурвица
- •5.1.5. Пример.
- •5.2. Теоретико-игровые модели
- •5.2.1. Оптимальность в форме равновесия
- •5.2.2. Почти антагонистические игры
- •5.2.3. Принципы оптимальности в условиях обмена информацией
- •5.2.4.Смешанные стратегии
- •5.3. Игры с нулевой суммой
- •5.3.1. Оптимальное решение игры двух лиц с нулевой суммой
- •5.3.2. Теорема о минимаксе
- •5.3.3. Решение игр с нулевой суммой в смешанных стратегиях
- •5.4. Методы решения матричных игр в смешанных стратегиях
- •5.4.1. Графическое решение игр
- •5.4.2. Метод последовательных приближений
- •5.4.3. Решение матричных игр методами линейного программирования
5.3.3. Решение игр с нулевой суммой в смешанных стратегиях
[
Таким образом, оптимальное решение игры не обязательно должно характеризоваться чистыми стратегиями. Вместо этого оптимальное решение может требовать смешивания случайным образом двух или более стратегий, как это сделано в следующем примере.
Пример 5.3.3-1.
Два игрока А и В играют в игру, основанную на подбрасывании монеты. Игроки одновременно и независимо друг от друга выбирают герб (Г) или решку (Р) Если результаты двух подбрасываний монеты совпадают (т.е. ГГ или РР), то игрок А получает один доллар от игрока В. Иначе игрок А платит один доллар игроку B.
Следующая матрица платежей игроку А показывает величины минимальных элементов строк и максимальных элементов столбцов, соответствующих стратегиям обоих игроков.
|
ВГ |
ВР |
Минимумы строк |
AГ |
1 |
-1 |
-1 |
AР |
-1 |
1 |
-1 |
Максимумы столбцов |
1 |
1 |
|
Максиминная и минимаксная величины (цены) для этой игры равны -1 доллар и 1 доллар соответственно. Так как эти величины не равны между собой, игра не имеет решения в чистых стратегиях. В частности, если игрок А использует стратегию АГ, игрок В выберет стратегию ВР, чтобы получить от игрока А один доллар. Если это случится, игрок А может перейти к стратегии АР, чтобы изменить исход игры и получить один доллар от игрока В. Постоянное искушение каждого игрока перейти к другой стратегии указывает на то, что решение в виде чистой стратегии неприемлемо. Вместо этого оба игрока должны использовать надлежащую случайную комбинацию своих стратегий. В рассматриваемом примере оптимальное значение цены игры находится где-то между максиминной и минимаксной ценами для этой игры:
максиминняя (нижняя) цена < цена игры < минимаксная (верхняя).
Следовательно, в данном случае цена игры должна лежать в интервале [-1,1], измеряемом в долларах.
[ Таха 11к]
Обозначим p1 вероятность выбора игроком А стратегии АГ . Соответственно, вероятность выбора игроком А стратегии АР будет (1- p1). Тогда средний платеж игроку А при первой стратегии игрока В равен
,
а при второй стратегии игрока В соответственно
.
поэтому при выборе оптимальной смешанной стратегии
Отсюда .
Подставляя числовые значения, получаем
,
т.е. в оптимальной смешанной стратегии игроку А следует использовать обе стратегии с одинаковой вероятностью. Цена игры в этом простейшем случае будет равна
.
[ Интрилигатор 16н]
В общем случае следует ожидать, что в игре двух участников с нулевой суммой оба игрока применяют свои оптимальные смешанные стратегии. В частном случае вполне определенной игры оптимальной смешанной стратегией будет такая стратегия, в которой чистой стратегии, соответствующей седловой точке, приписана вероятность, равная единице, т. е. векторы оптимальных стратегий единичные. Вообще число ненулевых элементов в векторе оптимальной смешанной стратегии не должно превышать минимальное количество чистых стратегий, имеющихся в распоряжении каждого игрока.
Применяя смешанные стратегии, партнеры ни в одной из партий игры не открывают друг другу своих истинных стратегий. Данная стратегия выбирается с помощью какого-нибудь механизма случайного выбора (бросание монеты или игральной кости, таблица случайных чисел и т. д.), причем используемые стратегии находятся в соответствии с оптимальными вероятностями. Если бы противнику было известно, какая именно стратегия будет применена в данной партии, то он мог бы использовать это знание с выгодой для себя. Однако он не может извлечь никакой полезной информации из знания оптимальных вероятностей партнера.