
- •Лабораторная работа 5. Теория игр. Парные игры,
- •Теоретические сведения. Базовые понятия
- •Классификация игр
- •Матричные игры
- •Решение матричной игры в чистых стратегиях
- •Решение игры в смешанных стратегиях
- •Пример 1
- •Пример 2. Графическое решение парной игры
- •Пример 3
- •Варианты заданий
- •Задача 1
- •Задача 2
- •Лабораторная работа 6. Теория игр. Игры с природой. Цель: освоить методы решения игр с природой. Получить представление о следующих понятиях и методах:
- •Теоретические сведения. Базовые понятия
- •Пример 1 ( [1]).
- •Пример 2. (Переработано из: [4])
- •Варианты заданий
- •Задача 1
- •Задача 2
- •Рекомендательный библиографический список
Решение игры в смешанных стратегиях
Если игра не имеет решения в чистых стратегиях, то решение ищется в смешанных стратегиях. Под смешанными стратегиями понимают векторы:
X = ( p1,...., pm), Y= ( q1,....,qn),
где pi и qj вероятности выбора чистых стратегий Аi и Вj игроками А и В, т.е.:
Функция
называется платежной функцией. Она
является средним выигрышем игрока А,
если А выбирает стратегию X , а
игрок В стратегию
Y, при многократном повторении игры.
Решением
игры в смешанных стратегиях называется
тройка (X0, Y0,
),
удовлетворяющая условию:
,
где X и Y любые смешанные стратегии.
Величина
=
называется ценой игры, а стратегии X0
и Y0
оптимальными.
Векторы
X0 и Y0, удовлетворяющие
указанному условию, называются седловой
точкой функции
.
Платежная функция всегда имеет седловую
точку, и, следовательно, игра всегда
имеет решение в смешанных стратегиях.
Цена игры
-
это значение платежной функции в седловой
точке. При этом можно также показать,
что:
=
H(X0, Y0) =
H(X,Y)=
H(X,
Y).
Говорят,
что k- я строка матрицы
доминирует l-ю строку, если akj
alj и akj > alj , хотя
бы для одного j .
Аналогично, k-й столбец доминирует
l-й столбец, если aik
ail и хотя бы для одного i aik
< a il.
Доминируемые строки и столбцы можно исключить, поскольку они соответствуют невыгодным чистым стратегиям.
Стратегии,
оптимальные для игры с платежной матрицей
будут оптимальными и для игры с матрицей
.
Это свойство позволяет сводить платежные
матрицы к матрицам с положительными
элементами.
Активными называются чистые стратегии, которые входят в состав оптимальных смешанных стратегий с ненулевыми вероятностями.
Для
того, чтобы тройка (X, Y,
)
была решением игры, необходимо и
достаточно выполнение следующих условий:
(5.1)
(5.2)
.
(5.3)
(5.4)
(5.5)
(5.6)
Решая систему неравенств (5.1) (5.6), можно найти решение игры. Решение игры равносильно решению пары задач линейного программирования:
Первая задача.
Обозначим
;
тогда равенство (5.1) перепишется в виде
(5.7)
неравенство (5.2) принимает вид
(5.8)
а неравенство (5.3) принимает вид
.
(5.9)
Оптимальная
стратегия для игрока А должна
максимизировать значение
,
следовательно минимизировать значение
.
Таким образом, целевая функция имеет вид:
(5.10)
Окончательно задача ЛП формулируется так: найти минимум (5.10) при условии (5.8) и (5.9)
Вторая задача.
Обозначим
;
тогда равенство (5.4) перепишется в виде
(5.11)
неравенство (5.5) принимает вид
(5.12)
а неравенство (5.3)
.
(5.13)
Оптимальная стратегия для игрока B должна минимизировать значение , следовательно, максимизировать значение .
Таким образом, целевая функция имеет вид:
(5.14)
Окончательно задача ЛП формулируется так: найти максимум (5.14) при условии (5.12) и (5.13).
После того, как игра решена, т.е. получена тройка (p1, p2 ,..., pi,..., pn; q1, q2,..., qj,..., qm ; v), возникает вопрос о практическом применении полученного решения. Для игрока А оно состоит в том, что нельзя сообщать противнику, какая полезная стратегия будет применяться в каждой конкретной игре, а ее выбор следует осуществлять с помощью какого-либо генератора случайных чисел (жребий, таблица случайных чисел, каких-либо функций в алгоритмических языках генерирующих значения случайных величин), реализующего распределение (p1, p2 ,..., pi,..., pn). Для игрока В все эти соображения аналогичны с заменой распределения на (q1, q2,..., qj,..., qm). В случае, если игра многократно повторяется и игроки придерживаются своих оптимальных стратегий, то средний выигрыш равен .