Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ТПР - мой вариант.docx
Скачиваний:
64
Добавлен:
16.09.2019
Размер:
1.99 Mб
Скачать

45. Матричные игры. Сведение матричной игры к задаче линейного программирования.

Парная, конечная, антагонистическая игра называется матричной.

Рассмотрим такую игру G(X,Y,K), в которой участвуют два игрока, имеющие противоположные интересы: выигрыш одного равен проигрышу другого. Так как выигрыш первого игрока равен выигрышу второго игрока с обратным знаком, мы можем интересоваться только выигрышем а первого игрока. Естественно, первый игрок хочет максимизировать, а второй — минимизировать а.

X и Y -- непустые множества стратегий для 1 и 2 игроков соответственно, элементы декартова произведения X×Y (т.е. пары стратегий (x,y), где x , y --ситуации), а функция К: X×Y→R называется функцией выигрыша первого игрока.

Пусть у первого игрока имеется m стратегий, а у второго игрока n стратегий. Допустим, что из своих m стратегий первый игрок выбирает i-ю (i=1,…,m), а второй игрок j-ю (j=1,…,n). Тогда определяется выигрыш первого игрока, равный . Если выигрыш равен отрицательному числу, то речь идет о фактическом проигрыше игрока. Матрица А называется платежнойматрицей, или матрицей выигрыша:

Теорема:

Пусть v>0. Для того чтобы тройка (х*, у*, v) являлась решением игры G = (Х,Y,А) в смешанных стратегиях, необходимо и достаточно выполнение следующих условий:

1) для первого игрока:

(1)

2) для второго игрока:

(2)

Разделим все уравнения и неравенства в (1) и (2) на v (это можно сделать, т.к. по предположению v> 0) и введём обозначения:

, , ,

Тогда (1) и (2) перепишется в виде:

, , ,

, , ,

Поскольку первый игрок стремится максимизировать v, то решение первой задачи сводится к нахождению таких неотрицательных значений xi , при которых

при условии . (3)

Поскольку второй игрок стремится минимизировать v, то решение второй задачи сводится к нахождению таких неотрицательных значений yj , при которых

при условии (4)

Формулы (3) и (4) выражают двойственные друг другу задачи линейного программирования (ЛП).

Решив эти задачи, получим значения xi , yj и v. Тогда смешанные стратегии получаются по формулам:

(5)

46. Графоаналитические методы решения матричных игр.

Графический метод применим к играм, в которых хотя бы один игрок имеет только две стратегии.

Поясним метод на примерах. Рассмотрим игру, заданную платёжной матрицей.

На плоскости хОy введём систему координат и на оси Ох отложим отрезок единичной длины А1А2, каждой точке которого поставим в соответствие некоторую смешанную стратегию игрока 1 (p, 1 - p). В частности, точке А1 (1, 0) отвечает стратегия А1, точке А2 (0, 1) – стратегия А2 и т.д.

Рис.1

В точках А1 и А2 восстановим перпендикуляр и на полученных прямых будем откладывать выигрыш игроков. На первом перпендикуляре (в данном случае он совпадает с осью 0y) отложим выигрыш игрока 1 при стратегии А1, а на втором – при стратегии А2. Если игрок 1 применит стратегию А1, то выиграет при стратегии В1 игрока 2 – 2, при стратегии В2 – 3, а при стратегии В3 – 11. Числам 2, 3, 11 на оси 0х соответствуют точки В1, В2 и В3.

Если же игрок 1 применит стратегию А2, то его выигрыш при стратегии В1 равен 7, при В2 – 5, а при В3 – 2. Эти числа определяют точки В1’, В2’, В3’ на перпендикуляре, восстановленном в точке А2. Соединяя между собой точки В1 и В’1, В2 и В’2, В3 и В’3 получим три прямые, расстояние до которых от оси 0х определяет средний выигрыш при любом сочетании соответствующих стратегий. Например, расстояние от любой точки отрезка В1В1’ до оси 0х определяет средний выигрыш v при любом сочетании стратегий А1А2 (с частотами p и 1 – p) и стратегией В1 игрока 2. Это расстояние равно

2p + 7(1 – p) = v.

Таким образом, ординаты точек, принадлежащих ломанной В1MNВ’3 определяют минимальный выигрыш игрока 1 при применении им любых смешанных стратегий. Эта минимальная величина является максимальной в точке N; следовательно, этой точке соответствует оптимальная стратегия x* = (p, 1-p), а её ордината равна цене игры v. Координаты точки N находим как точку пересечения прямых В2B’2 и В3B’3.

Соответствующие два уравнения имеют вид

.

Следовательно, , при цене игры . Таким образом, мы можем найти оптимальную стратегию при помощи матрицы .

Оптимальные стратегии для игрока 2 можно найти из системы

и, следовательно, . (Из рисунка видно, что стратегия B1 не войдёт в оптимальную стратегию).