Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Книга по теории игр.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
1.89 Mб
Скачать

1.1.4.Приведение матричной игры к задаче линейного программирования

Обозначим через SA=(p1, p2, …, pn) оптимальную смешанную стратегию игрока A. Требуется найти вероятности и определить цену игры при условии, что известна платёжная матрица игры. Допустим, что игрок B выбирает чистую стратегию B1. Тогда средний выигрыш для игрока A будет равен a11p1+a21p2+…+an1pn. Этот выигрыш должен быть не меньше цены игры v, следовательно, a11p1+a21p2+…+an1pn≥v.

Если игрок B выберет стратегию B2, то и в этом случае средний выигрыш игрока A должен быть не меньше цены игры v, следовательно, a12p1+a22p2+…+an2pn≥v.

Какую бы стратегию ни выбирал игрок B, выигрыш игрока A всегда должен быть не меньше цены игры v. Поэтому мы можем записать следующую систему из m неравенств (напоминаем, что m — число чистых стратегий игрока B):

a 11p1+a21p2+…+an1pn≥v;

a12p1+a22p2+…+an2pn≥v;

………………………… (1)

a1mp1+a2mp2+…+anmpn≥v.

При этом p1+p2+…+pn=1. (2)

Введя обозначения x1=p1/v, x2=p2/v, … xn=pn/v, перепишем (1) и (2) в виде

a 11x1+a21x2+…+an1xn≥1;

a12x1+a22x2+…+an2xn≥1;

………………………… (3)

a1mx1+a2mx2+…+anmxn≥1;

x1+x2+…+xn=1/v. (4)

Нам желательно, чтобы цена игры была максимальной, следовательно, 1/v должна быть минимальной. Таким образом, поиск оптимальной смешанной стратегии свёлся к решению следующей задачи линейного программирования: надо найти неотрицательные величины xi такие, чтобы они удовлетворяли неравенствам (3) и обращали в минимум сумму x1+x2+…+xn, т.е.

L= x1+x2+…+xn→min,

при ограничениях

a 11x1+a21x2+…+an1xn≥1;

a12x1+a22x2+…+an2xn≥1;

…………………………

a1mx1+a2mx2+…+anmxn≥1;

xi≥0, i=1, 2, …, n/

Задача. Самолёты против зениток. Найдём оптимальную смешанную стратегию некоторой конкретной игры. Предположим, что сторона A нападает на сторону B. У стороны A имеются два самолёта, несущие мощное поражающее средство. У стороны B имеются четыре зенитки, при помощи которых осуществляется оборона важного объекта. Чтобы объект оказался разрушенным, достаточно, чтобы к нему прорвался хотя бы один самолёт. Для подхода к объекту самолёты могут выбрать любой из четырёх воздушных коридоров (см. рис. 2).

Рис. 2. Воздушные коридоры и объект

У стороны A есть две чистые стратегии: стратегия A1 — самолёты посылаются в разных воздушных коридорах (безразлично, каких именно), стратегия A2 — оба самолёта посылаются в каком-то одном из коридоров. Возможные стратегии стороны B таковы: B1 — поставить по зенитке на каждый коридор, B2 — поставить по две зенитки на какие-то два коридора (остальные два коридора остаются неохраняемыми, B3 — поставить две зенитки на один из коридоров и по одной зенитке ещё на два коридора, B4 — поставить три зенитки на один из коридоров и одну зенитку ещё на один коридор, B5 — поставить все четыре зенитки на один из коридоров. Стратегии B4 и B5 заведомо невыгодны хотя бы потому, что три, а тем более четыре зенитки в пределах одного коридора не нужны, ведь у стороны A всего два самолета. Поэтому ограничимся стратегиями B1, B2, B3.

Предположим, что сторона A выбрала стратегию A1, сторона B — стратегию B1. Ясно, что тогда ни один самолёт не прорвётся к объекту — выигрыш стороны есть нуль (a11=0). Пусть выбраны стратегии A1 и B2. В этой ситуации, какие бы два коридора ни выбирала сторона B для размещения пар зениток, у самолётов всегда будут шесть равновероятных вариантов и только один проигрышный. Таким образом, при выборе стратегий A1 и B2 вероятный выигрыш стороны A составляет 5/6 (a12=5/6). Рассуждая подобным образом, найдём остальные элементы платёжной матрицы данной игры (см. табл. 6). Нижняя цена игры равна ½, верхняя ¾. Седловой точки нет, оптимальное решение лежит в области смешанных стратегий.

Табл. 6. Платёжная матрица игры

B

A

В1

В2

В3

min

А1

0

5/6

1/2

0

А2

1

1/2

3/4

1/2

max

1

5/6

3/4

Чтобы найти оптимальную смешанную стратегию, воспользуемся платёжной матрицей (см. табл. 6) и соотношениями (3) и (4). В результате получим следующую задачу линейного программирования:

x1+x2→min

, x1≥0, x2≥1

Решение удобно представить графически. Для этого построим область допустимых решений D (см. рис. 3). Уравнение x1+x2=const описывает семейство параллельных прямых, которые на рисунке показаны штриховыми линиями. Из всех прямых, имеющих хотя бы одну точку в пределах допустимой области, наименьшей сумме x1+x2 соответствует прямая FF. Точка G соответствует оптимальной смешанной стратегии. Координаты этой точки: x1=3/5; x2=1. Отсюда v=5/8, p1=3/8, p2=5/8. Итак, оптимальная смешанная стратегия стороны A предполагает использование стратегии A1 с вероятностью 3/8 и стратегии A2 с вероятностью 5/8.

Как воспользоваться этой рекомендацией на практике? Если игра происходит один раз, то стороне A следует, по-видимому, избрать стратегию A2, ведь p2>p1. Предположим, что игра совершается многократно (например, по отношению к многим объектам, подлежащим бомбардировке). Если игра повторяется раз N (N»1), то в 3N/8 случаях сторона A должна избрать стратегию A1, а в 5N/8 случаях стратегию A2.

Рассмотрим поведение стороны B. При выборе стороной A оптимальной смешанной стратегии её средний выигрыш оказывается в пределах между верхней ценой игры, раной ¾, и ценой игры v=5/8. При неразумном поведении стороны B выигрыш стороны A может оказаться равным верхней цене игры (и даже может стать больше). Если сторона B, в свою очередь, будет придерживаться

Рис. 3. Допустимая область D (область красного цвета) и решение G.

оптимальной смешанной стратегии, то выигрыш игрока A окажется равным цене игры v. Оптимальная смешанная стратегия стороны B сводится к тому, что эта сторона вообще не применяет стратегию B3, стратегию B1 использует с вероятностью ¼, а стратегию B2 с вероятностью ¾. Нецелесообразность применения стратегии B3 усматривается из рисунка: соответствующая этой стратегии прямая EE не имеет общих точек с красной областью. Для определения вероятностей, с какими должны использоваться стратегии B1 и B2, воспользуемся уже найденным значением цены игры (v=5/8): q10+q25/6=5/8. Отсюда видно, что q1=1/4, q2=3/4. [Тарасов Л. В. Мир, построенный на вероятности. – М.: Просвещение, 1984. – 191 с.].

При решении произвольной конечной игры размера n × m рекомендуется придерживаться следующей схемы:

  1. Исключить из платежной матрицы заведомо невыгодные стратегии по сравнению с другими стратегиями. Такими стратегиями для игрока А (игрока В) являются те, которым соответствуют строки (столбцы) с элементами, заведомо меньшими (большими) по сравнению с элементами других строк (столбцов).

  2. Определить верхнюю и нижнюю цены игры и проверить, имеет ли игра седловую точку. Если седловая точка есть, то соответствующие ей стратегии игроков будут оптимальными, а цена совпадает с верхней (нижней) ценой.

  3. Если седловая точка отсутствует, то решение следует искать в смешанных стратегиях. Для игр размера m × n рекомендуется симплексный метод, для игр размера 2×2, m, m×2 возможно геометрическое решение.

Фактическое решение некоторых классов антагонистических игр сводится к решению дифференциальных и интегральных уравнений, а матричных игр — к решению стандартной задачи линейного программирования. Разрабатываются приближённые и численные методы решения игр. Для многих игр оптимальными оказываются так называемые смешанные стратегии, то есть стратегии, выбираемые случайно (например, по жребию).

Теория игр, созданная для математического решения задач экономического и социального происхождения, не может в целом сводиться к классическим математическим теориям, созданным для решения физических и технических задач. Однако в различных конкретных вопросах теория игр широко используются весьма разнообразные классические математические методы. Кроме этого, теория игр связана с рядом математических дисциплин внутренним образом. В теория игр. систематически и по существу употребляются понятия теории вероятностей. На языке теория игр можно сформулировать большинство задач математической статистики. Необходимость при анализе игры количественного учёта неопределённости предопределяет важность и тем самым связь И. т. с теорией информации и через её посредство — с кибернетикой. Кроме того, теория игр, будучи теорией принятия решений, может рассматриваться как существенная составная часть математического аппарата операций исследования.

Теория игр применяется в экономике, технике, военном деле и даже в антропологии. Основные трудности практического применения теория игр связаны с экономической и социальной природой моделируемых ею явлений и недостаточным умением составлять такие модели на количественном уровне.