Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Витебский государственный университет им. П. М. Машерова

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

УМК ЭММ и М.doc

Скачиваний:

Добавлен:

01.03.2025

Размер:

5.95 Mб

Скачать

☆

<<< < Предыдущая 7 8 9 10 11 12 13 14 15 16 17 1819 / 3419 20 21 22 23 24 25 26 27 28 29 30 31 > Следующая >>>

6.2. Платежная матрица. Нижняя и верхняя цена игры

Рассмотрим парную конечную игру. Пусть игрок А располагает m личными стратегиями, которые обозначим ; у игрока В имеется n стратегий: . В этом случае говорят, что игра имеет размерность . В результате выбора игроками любой пары стратегий и , однозначно определяется исход игры, т.е. выигрыш игрока А (положительный или отрицательный) и проигрыш игрока В. Предположим, что значения известны для любой пары стратегий . Матрица , элементами которой являются выигрыши, соответствующие стратегиям и называется платежной матрицей или матрицей игры и может быть представлена таблицей (табл. 6.2.1).

_{Таблица 6.2.1}

			…
			…
			…
…	…	…	…	…
			…

Пример 6.2.1. Составить платежную матрицу следующей игры: первый игрок А прячет в руке некоторое (четное или нечетное) количество мелких одинаковых предметов (орехи, камушки, монеты, …); второй игрок В отгадывает: является ли спрятанное число предметов парным («чет») или нет («нечет»). Если игрок В угадал, то игрок А платит 1 ден. ед. В; если игрок В не угадал, то он платит 1 ден. ед. А.

Решение.

Для иллюстрации задачи используем табл. 6.2.2.

Таблица 6._2.2

Стратегии игроков		В
Стратегии игроков		чет	нечет
А	чет	–1	1
А	нечет	1	–1

Таким образом, условия игры определяются платежной матрицей:

Ответ: .

Рассмотрим игру с платежной матрицей и определим наилучшую среди стратегий . Выбирая стратегию , игрок А должен рассчитывать, что игрок В ответит на нее той из стратегий , при которой выигрыш для игрока А минимален.

Обозначим через наименьший выигрыш игрока А при выборе им стратегии для всех возможных стратегий игрока В, т.е.

(6.2.1)

Среди всех чисел выберем наибольшее: . Будем называть  нижней ценой игры или максиминным выигрышем (максимином). Это гарантированный выигрыш игрока А при выборе любой стратегии игроком В. Следовательно:

. (6.2.2)

Стратегия, соответствующая максимину, называется максиминной стратегией.

Игрок В заинтересован в том, чтобы уменьшить выигрыш игрока А и, выбирая стратегию , он учитывает максимально возможный при этом выигрыш для А. Обозначим через наибольший проигрыш игрока В при выборе им стратегии для всех возможных стратегий игрока А, т.е.

. (6.2.3)

Среди всех чисел _j выберем наименьшее и назовем верхней ценой игры или минимаксным выигрышем (минимаксом). Это гарантированный проигрыш игрока В. Следовательно:

. (6.2.4)

Стратегия, соответствующая минимаксу, называется минимаксной стратегией.

Принцип, диктующий игрокам выбор наиболее «осторожных» минимаксной и максиминной стратегий, называется принципом минимакса.

Пример 6.2.1 (продолжение). Определить нижнюю и верхнюю цены игры в случае, если платежная матрица имеет вид:

Решение.

Представим решение задачи с помощью таблицы 6.2.3.

Таблица 6.2.3


–1	1	–1
1	–1	–1
1	1	–1 1

Таким образом, нижняя цена игры , верхняя цена игры , т.е. , причем .

Ответ: , .

Приведем без доказательства следующую теорему.

Теорема 6.2.1. В матричной игре нижняя чистая цена игры не превосходит верхней чистой цены игры, т.е.

Если верхняя и нижняя цены игры совпадают, то общее значение верхней и нижней цены игры называется чистой ценой игры, или ценой игры. Минимаксные стратегии, соответствующие цене игры, являются оптимальными стратегиями, а их совокупность – оптимальным решением, или решением игры. В этом случае игрок А получает максимальный гарантированный выигрыш , а игрок В добивается минимального гарантированного проигрыша . Данная ситуация называется устойчивостью решения или равновесием по Нэшу, т.е. ни одному из участников игры не выгодно менять свое поведение (стратегию) при условии, что другой участник не изменяет своего поведения.

Определение 6.2.1. Чистая стратегия игрока А – это возможный ход первого игрока, выбранный им с вероятностью, равной 1.

Пара чистых стратегий и дает оптимальное решение игры тогда и только тогда, когда соответствующий ей элемент является одновременно наибольшим в своем столбце и наименьшим в своей строке. Такая ситуация, если она существует, называется седловой точкой и может быть задана в виде пары векторов: , .