Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Игра лекция.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
648 Кб
Скачать

2. Строго детерминированные игры

Определение 1.5. Игра с платежной матрицей Hmxn называется строго детерминированной (строго определенной), если матрица H содержит элемент V, являющийся минимальным в строке и максимальным в столбце его содержащем одновременно.

Утверждение. Если Hmn – платежная матрица с седловой точкой akl, то оптимальными стратегиями для А и В являются чистые стратегии выбора k-й строки и l-го столбца, а ценой игры служит V=akl.

Поясним суть определения.

Пример 2. Пусть дана игра с платежной матрицей

.

Проверить является ли она строго определенной.

Запишем матрицу и применим определение 1.5.

Среди выигрышей А выбираем максимальный - он соответствует

.

Среди проигрышей игрока В выбираем наименьший –

следовательно, игра строго определенная. Более того, сразу можно определить цену игры V

V = 3

и чистые стратегии =(0,1,0) – для игрока А, =(0,0,1) – для игрока B.

Способ определения седловой точки, описанный в примере 6, называется методом минимакса.

Замечание. На практике решение оформляется значительно проще.

3. Нестрого детерминированные игры

Игру (или соответствующую ей платежную матрицу) не являющуюся строго определенной, называют нестрого определенной. Если матричная игра не имеет седловой точки, то решение игры затрудняется. В этих играх . Установленный факт означает, что если игра одноходовая, то есть партнеры играют один раз, выбирая по одной чистой стратегии, то в расчете на разумно играющего противника они должны придерживаться принципа минимакса, это гарантирует выигрыш V игроку А и проигрыш V игроку В. Следовательно, при применении минимаксных стратегий величина платежа V ограничена неравенством .

Если же игра повторяется неоднократно, то постоянное применение минимаксных стратегий становится неразумным. Например, если игрок В будет уверен в том, что на следующем ходу А применит прежнюю стратегию, то он несомненно выберет стратегию, отвечающую наименьшему элементу в этой строке, а не прежнюю.

Таким образом, мы пришли к выводу, что при неоднократном повторении игры обоим игрокам следует применять свои стратегии. Тогда возникает вопрос: а каким образом их менять, чтобы в среднем выигрыш одного игрока и проигрыш другого был аналогично одноходовой игре, ограничиваясь снизу и сверху соответственно?

Давайте снова рассмотрим игру с платёжной матрицей .

Здесь , и и между ними образуется образуется “дыра ” . Как можно её заполнить и чем?

Представим себя в позиции первого игрока. Он имеет гарантированный выигрыш, (скорее проигрыш), равный (-1). Как он может его повысить?

Конечно, если игра повторяется много раз, то он может изучить своего партнёра, придумывать всякие схемы игры и т.д. и т.п., но вряд ли это даст какие-то гарантии, если число партий невелико. Тут никакие схемы не помогут.

В такой ситуации единственный выход - выбирать свой ход случайным образом. Например, взять и подбросить монету. Упадёт она кверху орлом - делать ход i=1, выпадет решка = делать ход i=2. Что же это даст?

Выигрыш станет случайной величиной и оценивать его надо по математическому ожиданию. Пусть второй игрок делает ход j=1. Тогда математическое ожидание выигрыша первого игрока будет .

Если второй игрок делает ход j=2, то математическое ожидание выигрыша первого игрока равно .

Таким образом, выбирая свой ход случайно, первый игрок гарантирует себе (правда, в среднем, а не в каждой партии), выигрыш, равный нулю. А это всё-таки лучше, чем гарантированный выигрыш, равный (-1) .

Аналогично, второй игрок, бросая монету и выбирая ход в соответствии с её “указанием”, гарантирует себе в среднем проигрыш, равный 0. Это тоже лучше, чем проигрыш, равный 1.

Таким образом, оказывается, что случайный выбор хода повышает наши шансы на успех, хотя бы в среднем. И это является одной из основных идей теории игр - выбирать свой ход случайно. Подобный случайный выбор хода получил название смешанной стратегии.

Конечно, с обычных житейских позиций, случайный выбор хода не всегда приемлем. Вообразите себе военачальника, который выиграл сражение. Он даёт интервью по TV и на вопрос о том, как же он принял правильное решение, говорит: “Ну, я бросил монету, она упала орлом кверху, и поэтому я … ”. Как посмотрит на него телезритель? А если он проиграл битву, то как отнесётся к такому ответу его начальство?

И тем не менее, случайный выбор хода (смешанная стратегия) имеет право на существование, даже в реальной жизни. Когда не знаешь, как действовать - выбирай свой ход случайным образом! Иногда помогает. По крайней мере, никто не разгадает стратегии твоего поведения и не предугадает твоего хода.

Итак, решение находят, применяя смешанные стратегии.

Смешанной стратегией первого (второго) игрока называется вектор

р= , где ,

(q= , где .)

Вектор p (q) означает вероятность применения i-й чис­той стратегии первым игроком (j-й чистой стратегии вто­рым игроком).

Поскольку игроки выбирают свои чистые стратегии случайно и независимо друг от друга, игра имеет случай­ный характер и случайной становится величина выигрыша (проигрыша). В таком случае средняя величина выигры­ша (проигрыша) – математическое ожидание – являет­ся функцией от смешанных стратегий р, q:

.

Функция f(p, q) называется платежной функцией игры.

Стратегии р*= , q*= называ­ются оптимальными, если для произвольных стратегий р= , q= выполняется условие:

.

Использование в игре оптимальных смешанных страте­гий обеспечивает первому игроку выигрыш, не меньший, чем при использовании им любой другой стратегии р; второму игроку – проигрыш, не больший, чем при исполь­зовании им любой другой стратегии q.

Значение платежной функции при оптимальных страте­гиях определяет цену игры, т. е. Совокупность оптимальных стратегий и цены игры со­ставляет решение игры.

Утверждение 1. В 1928 году фон Нейманом была доказана основная теорема теории игр, утверждающая, что каждая игра имеет, по крайней мере, одно решение, возможно, в области смешанных стратегий.

Утверждение 2 . Для того чтобы смешанные стратегии р*= ,

q*= были оптимальными для игроков А и В в игре с матрицей и выигры­шем v, необходимо и достаточно выполнения неравенств:

, .

На основании утверждения можно сделать вывод: если игрок А применяет оптимальную смешанную страте­гию р*, а игрок В любую чистую стратегию, то выиг­рыш игрока А будет не меньше цены игры.

Аналогично: если игрок В использует оптимальную смешанную страте­гию q*, а игрок А любую чистую стратегию, то про­игрыш игрока В не превысит цены игры.

Замечание. Решение матричной игры можно упростить, выявив при этом доминирование одних стратегий над другими. Так, рассматривая страте­гии игрока А, сравниваем соответствующие элементы строк s и t. Если все элементы s строки не меньше элементов t-й строки, то выигрыш игрока А при стратегии As будет больше, чем при стратегии At. В этом случае стратегия As доминирует над стратегией At. Стратегию As называют доминирующей, а стратегию At доминируемой.

Аналогично, поскольку игрок В заинтересован в минимизации про­игрыша, доминирующим будет столбец с наименьшими элементами.

Если в матричной игре имеем строки (столбцы) с одними и теми же элементами, то строки (столбцы), а со­ответственно и стратегии игроков А и В, называются дублирующими.

В матричной игре доминируемые и дублирующие стро­ки (столбцы) можно опускать, что не влияет на решение игры.

Пример 7. Найти доминируемые строки и столбцы в платежной матрице

Решение. Очевидно, доминируемыми являются 1 и 3 строки и 3 столбец.

Матрица игры сводится к виду

.

В этой матрице первый столбец – доминируемый. Остается матрица

H2=(2).

Заметим, что a22=2 – седловая точка.