
Правило доминирования.
Доминирование в теории игр — ситуация, при которой одна из стратегий некоторого игрока дает больший выигрыш, нежели другая, при любых действиях его оппонентов. Обратное понятие, нетранзитивность, возникает, если некоторая стратегия может давать меньшие выигрыши, чем другая, в зависимости от поведения остальных участников.
Понятие доминирования используется при решении или упрощении некоторых типов некооперативных игр.
Если в платежной матрице А, где все элементы строки Ai(ai1, ai2, ... , am) не меньше соответствующих элементов некоторой строки Ak(akl, ak2,... , akn), а по крайней мере одна строка больше, то строка Ai называется доминирующей, а строка Ак - доминируемой.
Аналогичны понятия «доминирующий» и «доминируемый» столбцы. Первому игроку не выгодно применять стратегии, которым соответствуют доминируемые стоки, а второму игроку - невыгодно применять стратегии которым соответствуют доминирующие столбцы.
Следовательно, при решении игры можно уменьшить ее размерность путем удаления из платежной матрицы доминирующих столбцов и доминируемых строк.
Стратегии, над которыми доминируют другие стратегии, надо отбросить и приписать им нулевые вероятности. На цене игры это никак не скажется. Зато размер матрицы игры понизится. С этого и нужно начинать решение игры.
Из платежной матрицы исключают чистые стратегии заведомо невыгодные по сравнению с другими:
а) для игрока А такими стратегиями являются те, которым соответствуют строки с элементами не большими по сравнению с элементами других строк;
б) для игрока В такими стратегиями являются те, которым соответствуют столбцы с элементами не меньшими по сравнению с элементами других столбцов.
Например, рассмотрим игру с матрицей
Сравнивая
строки, убеждаемся, что элементы 2-ой
строки не больше соответствующих
элементов 1-ой строки, а 3-ья строка
совпадает с 4-ой. Следовательно, стратегии
и
невыгодные и могут быть отброшены.
Матрица игры преобразуется к матрице
Сравнивая
столбцы полученной матрицы, убеждаемся,
что элементы 2-го столбца не меньше
соответствующих элементов 1-го столбца,
а элементы 3-го столбца не меньше
соответствующих элементов 4-го столбца,
т.е. стратегии
и
также могут быть отброшены. Окончательно
усеченная матрица игры имеет вид
.
Таким
образом, оптимальными стратегиями
игроков А
и В
игры с матрицей Н
будут
и
,
где
и
– оптимальные стратегии игры с матрицей
.
Аффинное правило.
Пусть
и
– оптимальные смешанные стратегии
игроков А
и В
в игре с платежной матрицей
и
ценой
.
Тогда
и
будут оптимальными стратегиями и в игре
с матрицей
и ценой
.
Например,
игру с матрицей
можно заменить игрой с матрицей
,
т.к. элементы этих матриц связаны
соотношениями
:
;
;
;
;
;
.
При этом оптимальные стратегии игр
совпадают, а цены игр связаны соотношением
.
В
общем случае решение игр размера
в смешанных стратегиях сводят к решению
двух возможно двойственных ЗЛП.
Редукция матричных игр к ЗЛП.
Процедуру сведения игры со сложной матрицей к игре с более простой матрицей называют редуцированием.
Пусть
игра
задана платежной матрицей
.
Через
и
обозначим соответственно оптимальные
стратегии игроков А
и В.
Пусть
– цена игры. Не умаляя общности, полагаем
.
В противном случае с помощью аффинного
правила добьемся того, что все
.
Оптимальная стратегия игрока А обеспечивает ему средний выигрыш, не меньший , при любой стратегии игрока В. Поэтому все средние выигрыши игрока А можно выписать в виде системы неравенств:
(18.1)
Введем новые переменные:
(18.2)
Тогда после деления каждого неравенства из (18.1) на получим новую систему неравенств
(18.3)
Из равенства
нетрудно
получить соотношение для
:
.
Игрок
А
стремится
максимизировать свой гарантированный
выигрыш
.
Максимизация
равносильна минимизации
.
Следовательно, получили следующую
задачу для нахождения оптимальной
стратегии игрока А:
(18.4)
при условиях (18.3) и
(18.5)
Сформулированная задача (18.3) – (18.5) является ЗЛП.
Повторим с естественными изменениями предыдущие рассуждения для определения оптимальной стратегии игрока В.
Игрок В стремиться минимизировать гарантированный проигрыш . Все средние проигрыши игрока В запишем в виде системы неравенств:
, (18.6)
которые следуют из того, что средний проигрыш игрока В не превосходит цены игры при любой стратегии игрока А.
В обозначениях
система неравенств (18.6) примет вид
(18.7)
Применение
удовлетворяют соотношению
.
Минимизация равносильна максимизации .
Получили следующую задачу для нахождения оптимальной стратегии игрока В:
(18.8)
при условиях (18.7) и
(18.9)
Задача (18.7) – (18.9) также является ЗЛП.
Таким образом, игра свелась к двум ЗЛП, которые запишем в матричном виде
,
,
,
Очевидно, задачи I и II являются двойственными ЗЛП.
Задача. Предприятие выпускает три вида продукции, получая при этом прибыль, зависящую от спроса, который может быть в одном из четырех состояний. Данные представлены таблицей
Спрос Продукция |
|
|
|
|
|
2 |
3 |
4 |
5 |
|
6 |
5 |
4 |
3 |
|
4 |
4 |
3 |
3 |
Найти оптимальные пропорции в выпускаемой продукции, гарантирующие среднюю величину прибыли при любом состоянии спроса, считая его неопределенным.
Решение. Задача сводится к игровой модели, в которой игрок А – предприятие, имеющее три стратегии: , и ; игрок В – спрос, имеющий четыре стратегии: , , и ; платежная матрица – заданная таблица.
Выполним анализ игры:
Седловой
точки нет:
,
.
Игра в смешанных стратегиях.
Составим взаимнодвойственные ЗЛП:
Решим задачу (II) симплекс-методом
Базисные неизвестные |
Свободные члены |
|
|
|
|
|
|
|
|
1 |
2 |
3 |
4 |
5 |
1 |
0 |
0 |
|
1 |
|
5 |
4 |
3 |
0 |
1 |
0 |
|
1 |
4 |
4 |
3 |
3 |
0 |
0 |
1 |
f |
0 |
–1 |
–1 |
–1 |
–1 |
0 |
0 |
0 |
|
|
0 |
|
|
|
1 |
|
0 |
|
|
1 |
|
|
|
0 |
|
0 |
|
|
0 |
|
|
1 |
0 |
|
1 |
f |
|
0 |
|
|
|
0 |
|
0 |
|
|
0 |
|
|
1 |
|
|
0 |
|
|
1 |
|
|
0 |
|
|
0 |
|
|
0 |
|
|
0 |
|
|
1 |
f |
|
0 |
0 |
0 |
0 |
|
|
0 |
Из итоговой симплекс-таблицы находим решение задачи (II):
,
,
,
,
,
,
,
.
Перейдем к решению задачи (I).
По первой теореме двойственности
По второй теореме двойственности справедливо соответствие между переменными задач (I) и (II):
,
где
– балансовые переменные задачи (I),
и из строки f
итоговой симплекс-таблицы находим
,
,
,
,
,
,
.
Возвращаясь к исходной игре, имеем
,
,
.
Ответ:
оптимальные пропорции выпускаемой
предприятием продукции составляют по
50 % продукции
и
,
гарантирующие 4 ед. прибыли при оптимальном
спросе
% в состоянии
и
% в состоянии