Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
2. Модели теории игр.doc
Скачиваний:
20
Добавлен:
15.11.2019
Размер:
538.11 Кб
Скачать

155

19.11.20

9. Игровые методы обоснования решений

9.1. Предмет и задачи теории игр

Основные понятия

Одна из задач теории оптимальных решений — принятие решения в условиях неопределенности.

Для обоснования решений разработаны специальные математические методы, которые рассматриваются в теории игр.

Теория игр представляет собой математическую теорию конфликтных ситуаций.

Ее цель — выработка рекомендаций по разумному поведению участников конфликта.

Конфликтными называются ситуации, в которых сталкиваются интересы двух (или более) сторон, преследующих разные (иногда противоположные) цели, причем выигрыш каждой стороны зависит от того, как себя поведут другие.

Примеры конфликтных ситуаций многообразны. К ним принадлежит любая ситуация, складывающаяся в ходе боевых действий, ряд ситуаций в области экономики, судопроизводства, а также в спорте.

Чтобы сделать возможным математический анализ конфликта, строится его математическая модель. Такую модель называют игрой.

От реального конфликта игра отличается тем, что ведется по определенным правилам.

Эти правила указывают «права и обязанности» участников, а также исход игры — выигрыш или проигрыш каждого участника в зависимости от сложившейся обстановки.

Человечество издавна пользуется такими формализован-ными моделями конфликтов — «играми» в буквальном смысле слова (шашки, шахматы, карточные игры и т.п.).

Отсюда и название теория игр, и ее терминология: конфликтующие стороны условно называются игроками, одно осуществление игры —партией, исход игры — выигрышем или проигрышем.

Мы будем считать, что выигрыши (проигрыши) участников имеют количественное выражение.

Если это не так, то всегда можно им его приписать, например, в шахматах считать выигрыш за единицу, проигрыш — за минус единицу, ничью — за нуль.

В игре могут сталкиваться интересы двух или более участников;

  • в первом случае игра называется парной,

  • во втором — множественной.

Развитие игры во времени можно представлять как ряд последовательных ходов участников.

Ходом называется выбор игроком одного из предусмотренных правилами игры действий и его осуществление.

Ходы бывают личные и случайные.

При личном ходе игрок сознательно выбирает и осуществляет тот или другой вариант действий (пример — любой ход в шахматах).

При случайном ходе выбор осуществляется не волей игрока, а каким-то механизмом случайного выбора (бросание монеты, игральной кости, вынимание карты из колоды и т.п.).

Некоторые игры (так называемые чисто азартные) состоят только из случайных ходов — ими теория игр не занимается.

Ее цель — оптимизация поведения игрока в игре, где (может быть, наряду со случайными) есть личные ходы.

Такие игры называются стратегическими.

Стратегией игрока называется совокупность правил, определяющих выбор варианта действий при каждом личном ходе в зависимости от сложившейся ситуации.

Обычно, участвуя в игре, игрок не следует каким-либо жестким, «железным» правилам: выбор (решение) принимается им в ходе игры, когда он непосредственно наблюдает ситуацию.

Однако теоретически дело не изменится, если предположить, что все эти решения приняты игроком заранее («если сложится такая-то ситуация, я поступлю так-то»).

Это будет значить, что игрок выбрал определенную стратегию.

Теперь он может и не участвовать в игре лично, а передать список правил незаинтересованному лицу — судье.

Стратегия может быть задана машине-автомату в виде программы (именно так играют в шахматы ЭВМ).

В зависимости от числа стратегий игры делятся на конечные и бесконечные.

Игра называется конечной, если у каждого игрока имеется в распоряжении только конечное число стратегий (в противном случае игра называется бесконечной).

Бывают игры (например, шахматы), где в принципе число стратегий конечно, но так велико, что полный их перебор практически невозможен.

Оптимальной стратегией игрока называется такая, которая обеспечивает ему наилучшее положение в данной игре, т. е. максимальный выигрыш.

Если игра повторяется неоднократно и содержит, кроме личных, еще и случайные ходы, оптимальная стратегия обеспечивает максимальный средний выигрыш.

Задача теории игр — выявление оптимальных стратегий игроков.

Основное предположение, исходя из которого находятся оптимальные стратегии, состоит в том, что противник (в общем случае — противники) по меньшей мере так же разумен, как и сам игрок, и делает все для того, чтобы добиться своей цели.

Расчет на разумного противника — лишь одна из возможных позиций в конфликте, но в теории игр именно она кладется в основу.

Игра называется игрой с нулевой суммой, если сумма выигрышей всех игроков равна нулю (т.е. каждый игрок выигрывает только за счет других).

Самый простой случай — парная игра с нулевой суммой — называется антагонистической.

Теория антагонистических игр — наиболее развитый раздел теории игр, с четкими рекомендациями.

Теория игр, как и всякая математическая модель, имеет свои ограничения.

Одним из них является предположение о полной («идеальной») разумности противника.

В реальном конфликте зачастую оптимальная стратегия состоит в том, чтобы угадать, в чем противник «глуп», и воспользоваться этой глупостью в свою пользу.

Схемы теории игр не включают элементов риска, неизбежно сопровождающего разумные решения в реальных конфликтах.

В теории игр выявляется наиболее осторожное, «перестраховочное» поведение участников конфликта.

Сознавая эти ограничения и поэтому не придерживаясь слепо рекомендаций, полученных игровыми методами, можно все же разумно использовать аппарат теории игр как «совещательный» при выборе решения.

Классификация выборов решений.

Дадим классификацию задач на выбор решения, используя понятие «полезности».

Выборы решений обычно разбиваются согласно тому, принимает ли решение  индивидуум или  группа,

и согласно тому, производится ли выбор

    • при определенности,

    • при риске

    • при неопределенности или

    • сочетание неопределенности и риска на основании экспериментальных данных.

Этот раздел относится к теории статистических выводов.

Различие между индивидуумом и группой является лишь функциональным.

Обратимся к классификации по признаку определенности — риска — неопределенности и допустим, что нужно сделать выбор между двумя действиями.

  • Выбор решений при определенности, если относительно каждого действия известно, что оно неизменно приводит к некоторому исходу.

  • Выбор решений при риске, если каждое действие приводит к одному из множества возможных частных исходов, причем каждый исход имеет известную вероятность появления.

  • Выбор решений при неопределенности, когда-то или иное действие или оба действия имеют своим следствием множество возможных частных исходов, но вероятности этих исходов неизвестны или не имеют смысла.

Игра со строгим соперничеством (или, то равнозначно, с нулевой суммой) есть такая игра, в которой два игрока имеют прямо противоположные интересы.

Игра с нестрогим соперничествомненулевой суммой) — это игра, в которой нет строгого соперничества.

Большинство экономических, политических и военных столкновений интересов можно представить в форме игр лишь в том случае, если признать присущее им нестрогое соперничество.

Антагонистические матричные игры.

Самым простым случаем, подробно разработанным в теории игр, является конечная парная игра с нулевой суммой (антагонистическая игра двух лиц).

Рассмотрим такую игру, в которой участвуют два игрока А и В, имеющие противоположные интересы: выигрыш одного равен проигрышу другого.

Так как выигрыш игрока А равен выигрышу игрока В с противоположным знаком, мы можем интересоваться только выигрышем а игрока А.

Цель игрока А — максимизировать свой выигрыш а, в свою очередь, цель игрока В — минимизировать эту же величину, которая является для него проигрышем.

Пусть у игрока А имеется m возможных стратегий А1, А2, ..., Аm, а у игрока Вn возможных стратегий В1, В2, ..., Вn

Такая игра называется игрой m n.

Выбор стратегии каждым игроком производится при полном незнании выбора другого игрока.

Предположим, что для каждой пары стратегий Аi, Вj выигрыш aij нам известен.

Тогда в принципе можно составить прямоугольную таблицу (матрицу), в которой перечислить стратегии игроков и соответствующие выигрыши.

Bj

Ai

B1

B2

...

Bn

A1

a11

a12

...

a1n

A2

a21

a22

...

a2n

...

...

...

...

...

Am

am1

am2

...

amn

Игра, представленная таким образом, называется матричной, а полученная таблица — платежной матрицей.

Заметим, что если игра приведена к такому виду, то многоходовая игра фактически сведена к одноходовой — от игрока требуется сделать только один ход: выбрать стратегию.

Пусть игрок А выбирает некоторую стратегию Аi тогда в наихудшем случае (например, если выбор станет известным игроку В) он получит выигрыш, равный .

Предвидя такую возможность, игрок А должен выбрать такую стратегию, чтобы максимизировать свой минимальный выигрыш :

  .

Величина — гарантированный выигрыш игрока А — называется нижней ценой игры.

Стратегия Аi, обеспечивающая получение , называется максиминной.

Игрок В, выбирая стратегию, исходит из следующего принципа : при выборе некоторой стратегии Вj его проигрыш не превосходит максимального из значений элементов j -го столбца матрицы, т.е. меньше или равен .

Рассматривая множество для различных значений j, игрок В, естественно, выберет такое значение j, при котором его максимальный проигрыш минимизируется:

 .

Величина называется верхней ценой игры, а соответствующая выигрышу стратегия Вj минимаксной.

Нижняя цена игры всегда не превосходит верхней цены игры.

Если = = v, то число v называется ценой игры.

Фактический выигрыш игрока А при разумных действиях партнеров ограничен нижней и верхней ценой игры.

Игра, для которой = , называется игрой с седловой точкой.

Для игры с седловой точкой нахождение решения состоит в выборе максиминной и минимаксной стратегий, которые являются оптимальными.

Стратегии игроков, для которых вероятности ui и zi отличны от нуля, называются активными.

Чистые и смешанные стратегии и их свойства.

Наличие седловой точки в игре — это далеко не правило, скорее — исключение — большинство игр не имеет седловой точки.

Чистой стратегией называется возможный ход игрока, выбранный им с вероятностью, равной 1.

Это так называемые «игры с полной информацией».

Игрой с полной информацией называется такая игра, в которой каждый игрок при каждом личном ходе знает предысторию ее развития, то есть результаты всех предыдущих ходов, как личных, так и случайных.

Примерами игр с полной информацией могут служить: шашки, шахматы, «крестики и нолики».

Если игра не имеет седловой точки, то для ее решения используются смешанные стратегии.

Смешанной стратегией называется вектор, каждая из компонент которого показывает относительную частоту использования игроком соответствующей чистой стратегии.

Обычно смешанную стратегию первого игрока обозначают как вектор U=(u1, u2, ...um),

а второго — как вектор Z=(z1, z2,...zn),

где ui 0 (i=1...m), zj 0 (j=1...n),

=1, =1.

Применение смешанных стратегий мыслится таким образом:

  • игра повторяется много раз;

  • перед каждой партией игры, когда игроку предоставляется личный ход, он «передоверяет» свой выбор случайности.

Смешанные стратегии в теории игр представляют собой модель изменчивой, гибкой тактики, когда ни один из игроков не знает, как поведет себя противник в данной партии.

Такая тактика часто применяется в карточных играх.

С уществует так называемая основная теорема теории игр, состоящая в следующем:

каждая конечная игра имеет, по крайней мере, одно решение, возможно, в области смешанных стратегий.

Применение игроком А оптимальной стратегии U* должно обеспечить ему при любых действиях игрока В выигрыш не меньше цены игры.

Поэтому выполняются следующие соотношения:

, j=1,...n. (9.1)

А налогично, для игрока В оптимальная стратегия Z* должна обеспечить при любых стратегиях игрока А проигрыш, не превышающий величину v, т.е. справедливо

соотношение

, i=1,...m (9.2)

Всякая матричная игра с нулевой суммой имеет решение в смешанных стратегиях.

Если U*оптимальная стратегия первого игрока, а

Z* оптимальная стратегия второго игрока, то число

v =

является ценой игры.

П р и м е р 1Записать платежную матрицу.

Найти нижнюю и верхнюю цены игры, установить наличие седловой точки матричной игры.

4

3

-5

12

14

-4

5

8

3

5

8

9

5

12

4

5

1.1

Р е ш е н и е.  Запишем платежную матрицу, найдем нижнюю и верхнюю границы цены игры:

B1

B2

B3

B4

A1

4

3

-5

12

-5

A2

14

-4

5

8

-4

A3

3

5

8

9

3

A4

5

12

4

5

4

14

12

8

12


Видим, что = 4 не равно = 8, следовательно, седловой точки нет и, следовательно, данная игра имеет решение в смешанных стратегиях.

10

7

4

8

9

-4

12

2

4

5

5

-6

1

3

4

4

5

-4

1

2

1.2

Р е ш е н и е.  Из платежной матрицы видно, что когда первый игрок применяет стратегию А1, а второй — В3, игра имеет седловую точку, следовательно, решение игры записывается в чистых стратегиях (А1; В3) при цене игры v = 4.

Чистые стратегии определяются как вектора

U (1, 0, 0, 0) и Z (0, 0, 1, 0).

B1

B2

B3

B4

B5

A1

10

7

4

8

9

4

A2

-4

12

2

4

5

-4

A3

5

-6

1

3

4

-6

A4

4

5

-4

1

2

-4

10

12

4

8

9

4

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]