
- •Виды задач и критерии выбора
- •Платежная матрица. Нижняя и верхняя цена игры.
- •4. Геометрическая интерпретация игр
- •5. Приведение парной игры к задаче линейного программирования
- •1. Формулировка пары двойственных задач линейного программирования, эквивалентных заданной парной игре.
- •2. Определение оптимальных планов двойственных задач.
- •3. Нахождение решения игры с использованием соотношений между оптимальными планами двойственных задач и оптимальными стратегиями и ценой игры (формулы (5.8)).
- •3. Решение игр в смешанных стратегиях
5. Приведение парной игры к задаче линейного программирования
Игра размера mxn не имеет наглядной геометрической интерпретации. Ее решение достаточно трудоемко, но принципиальных трудностей не имеет, поскольку может быть сведено к решению задаче линейного программирования.
Наряду с приводимыми выше теоремой Неймана и теоремой об активных стратегиях справедлива следующая терема теории игр.
Теорема. Для того чтобы число v было ценой игры, а U* и Z*- оптимальными стратегиями, необходимо и достаточно выполнение неравенств:
|
|
Рассмотрим игру mxn, определяемую матрицей:
A = |
|
a11 a12 ... a1n a21 a22 ... a2n ... am1 am2 ... amn |
|
Как и ранее, игрок A обладает стратегиями A1, A2, ..., Am, игрок В – стратегиями B1, B2, …, Bn. Требуется определить оптимальные стратегии игроков U* и Z*.
Рассмотрим оптимальную стратегию U* игрока A.
Согласно теореме, приведенной выше, справедливо следующее утверждение.
Если игрок А
применяет смешанную стратегию U*
= (
,
,
...,
)
против чистой стратегии Bj игрока
В, то он получает средний выигрыш
или математическое ожидание выигрыша
aj = a1j
+ a2j
+ ... + amj
,
.
Для оптимальной стратегии U* все средние выигрыши не меньше цены игры v, поэтому получаем систему неравенств:
|
(5.3) |
Предположим для определенности, что v > 0.
Этого всегда можно достигнуть благодаря тому, что прибавление ко всем элементам матрицы А одного и того же постоянного числа С не приводит к изменению оптимальных стратегий, а только лишь увеличивает цену игры на С.
Каждое из неравенств разделим на число v (v > 0), а также введем новые переменные: y1 = / v, y2 = / v, ..., ym = / v.
Тогда система (5.3) примет вид:
|
(5.4) |
При этом yi ≥ 0, .
Далее рассмотрим равенство + + ... + = 1.
Разделим неравенство на число v (v ≠ 0). Получим:
y1 + y2 + ... + ym = 1/v. |
(5.5) |
Вспомним, что цель игрока А – максимизировать свой гарантированный выигрыш, т.е. цену игры v. Максимизация цены игры v эквивалентна минимизации величины 1/v, поэтому задача может быть сформулирована следующим образом: определить значения переменных yi ≥ 0, i = 1, 2, …, m, так, чтобы они удовлетворяли линейным ограничениям (5.4) и при этом линейная функция (5.5) обращалась в минимум.
Перед нами задача линейного программирования.
Решая задачу (5.4) – (5.5), можно найти оптимальную стратегию U*.
Аналогичные рассуждения выполним и для игрока В.
Обозначив xj = / v, , в результате получим:
|
(5.6) |
x1 + x2 + ... + xn = 1/v. |
(5.7) |
Таким образом, задача определения оптимальной стратегии игрока В сводится к следующему: определить значения переменных xj ≥ 0, j = 1, 2, …, n, так, чтобы они удовлетворяли линейным ограничениям (5.6) и при этом линейная функция (5.7) обращалась в максимум.
Решая задачу линейного программирования (5.6) – (5.7), получим оптимальную стратегию Z*.
Вновь приведем формулировки полученных задач линейного программирования.
|
|
|
|
||
|
a11y1 + a21y2 + ... + am1ym ≥ 1, a12y1 + a22y2 + ... + am2ym ≥ 1, ... a1ny1 + a2ny2 + ... + amnym ≥ 1; |
|
|
a11x1 + a12x2 + ... + a1nxn ≤ 1, a21x1 + a22x2 + ... + a2nxn ≤ 1, ... am1x1 + am2x2 + ... + amnxn ≤ 1; |
|
|
|
|
|
|
|
yi ≥ 0, . |
|
xj ≥ 0, . |
|
Очевидно, что задачи (5.4) – (5.5) и (5.6) – (5.7) представляют собой пару взаимно двойственных задач линейного программирования. Их решение позволяет решить соответствующую игру.
При этом:
|
(5.8) |
|
Таким образом, процесс нахождения решения игры с использованием методов линейного программирования включает следующие этапы.