Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1513.pdf
Скачиваний:
6
Добавлен:
07.01.2021
Размер:
1.24 Mб
Скачать

это число выигрышем (проигрышем) участника. Если игра повторяется достаточно много раз, то игроков может интересовать не выигрыш и проигрыш в каждой конкретной партии, а средний выигрыш (проигрыш) во всех партиях. Зададим платёжные функции выигрышей (проигрышей) игроков для каждого из возможных исходов.

Таким образом, математическое описание игры сводится к перечислен ю всех действующих в ней игроков, указанию для

каждого

грока всех его стратегий, а также численного выигрыша,

который он получ т после того, как остальные игроки выберут свои

стратег

. В результате игра становится формальным объектом,

С

 

 

который поддается математическому анализу.

 

Для того что решить игру или найти решение игры, следует

выбрать для каждого

грока такую стратегию,

которая удовлетворяет

условию

опт мальности, т.е. один из игроков должен получить

 

вы грыш, когда второй придерживается своей

максимальный

 

стратег . В то же время второй игрок должен иметь минимальный

проигрыш, если первый придерживается своей стратегии. Такие

стратегии считаются оптимальными для обоих игроков. Оптимальные

стратегии должны

удовлетворять условию

устойчивости, т.е.

 

бА

каждому из игроков должно ыть невыгодно отказываться от своей

стратегии в данной игре.

Если игра повторяется достаточно много раз, то игроков может интересовать не выигрыш и проигрыш в каждой конкретной партии, а

средний выигрыш ( проигрыш) во всех партиях.

Целью теории игр является определение оптимальной

стратегии для каждого игрока.

Д

1.3. Классификация игр

 

Игры можно классифицировать по различным признакам:

 

И

а) по числу игроков; б) по количеству стратегий;

в) по свойствам функций выигрыша; г) по возможности предварительных переговоров между

игроками.

Взависимости от числа игроков различают игры с двумя, тремя

иболее участниками. Очевидно, что игра с двумя участниками

9

является самой простой моделью. В играх с бесконечным числом игроков в игру вступают всё новые и новые участники игры.

По количеству стратегий рассматривают конечные и бесконечные игры. В конечных играх игроки располагают конечным числом возможных стратегий, которые называются чистыми.

По свойствам функций выигрыша игры классифицируются на две группы: игры с нулевой суммой (когда выигрыш одного из игроков равен про грышу другого) и игры с постоянной разностью (в

которых

гроки вы грывают и проигрывают одновременно).

Полагаем также, что при любом исходе игры с нулевой суммой

сумма

вы грышей

 

двух

 

участников aij bij H , т.е. равна

С

Тогда при некотором исходе (i; j) выигрыши

постоянному ч слу.

 

будут соответственно равны

 

 

 

 

 

 

 

 

a H

 

ij

и

b

 

H

 

ij

.

 

 

 

 

 

 

ij

 

 

 

 

ij

 

 

 

 

игроков

 

 

 

 

2

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

образом

 

 

 

 

 

Следовательно, при каждом исходе первый участник получает

ij , а второй теряет ij . Таким

 

 

, игру с постоянной суммой

можно представить какАигру с нулевой суммой: при каждом исходе выигрыш 1-го участника равен проигрышу 2-го участника.

Антагонистическими называютсяДигры, в которых результат, выгодный одному участнику всегда невыгоден другому.

В зависимости от возможности предварительных переговоров между игроками различают кооперативные и некооперативные игры.

Игра называется кооперативной (или коалиционной), если до её начала участники временно объединяются вИкоалиции и принимают взаимно обязывающие соглашения о своих стратегиях и последующем разделении полученного выигрыша. Члены одной коалиции могут свободно обмениваться информацией и принимать полностью согласованные решения. В противном случае игра называется бескоалиционной или некооперативной. Нетрудно понять,

что в коалиционной игре набор возможных решений каждого участника намного шире, чем в бескоалиционной игре. Следовательно, более сложной является коалиционная модель конфликта между участниками.

По характеру получения информации рассматривают игры в нормальной форме (игроки получают всю предназначенную им

10

информацию до начала игры) и динамические игры (необходимая информация поступает игрокам в процессе развития игры). Наиболее простым является случай, когда все участники, во-первых, знают все множество возможных исходов игры, т.е. ситуаций, к которым приводят все допустимые комбинации стратегий игроков, и, вовторых, знают количественные значения индивидуальных полезностей всех игроков для каждого исхода.

 

Если одна

та же

гровая ситуация воспроизводится множество

раз

(многократное

разыгрывание),

то

игра

называется

повторяющейся.

 

 

 

 

 

Игра называется последовательной, если действия одних

С

 

 

 

 

участн ков гры следуют за действиями других её участников.

 

Начнем

зучен е теории с простейшей статической модели –

 

гры, в которой участвуют два игрока, множество

стратег й каждого з

гроков конечно,

а выигрыш одного игрока

матричной равен про грышубАдругого.

2. М ТРИЧНЫЕ ИГРЫ

2.1. Платёжная матрица. Принцип минимаксной и максиминной стратегий

1)в игре участвуют два игрокаД;

2)каждый игрок имеет конечное множество стратегий;

3)игра заключается в том, что каждыйИиз игроков, не имея информации о действиях противника, делает один ход. Результатом выбора игроком стратегий является выигрыш или проигрыш в игре;

4)и выигрыш и проигрыш обоих игроков выражаются числами. Рассмотрим матричную игру. Пусть игрок A располагает

имеются n личных стратегий, которые обозначим B1,B2,...,Bn . Говорят, что игра имеет размерность m n. В результате выбора игроками любой пары стратегий Ai и Bj однозначно определяется исход игры, т.е. выигрыш aij игрока A и проигрыш игрока B.

11

Допустим, что для любой пары стратегий (Ai ,Bj ) известны значения

aij.

Платёжной матрицей или матрицей игры называется матрица

вида P (aij),i 1,2,...,m; j 1,2,...,n.

 

 

 

С

 

a

.a

... a

 

 

 

11

12

1n

 

Общ й в д такой матрицы P ....................

.

 

 

 

 

 

 

или

am1am2

... amn

троки этой матрицы соответствуют стратегиям игрока A, а

столбцы – стратег ям

грока B.

 

 

 

Представлен е

гры с помощью платежной матрицы называют

бА

нормальной зап сью

гры (

нормальным представлением игры).

Очев дно, что

грок A

предпочитает те исходы, в которых

значен е элемента платежной матрицы будет наибольшим, а игрок B

– исходы, в которых соответствующий элемент будет наименьшим. Однако сход гры зависит от выбора обоими игроками своих стратегий. Поэтому рациональный игрок при выборе своей стратегии должен просчитывать, какие стратегии предпочтет его соперник. Решением игры удем называть исход игры, рассчитанный в предположении, что игроки рациональны, т.е. оптимизируют свой результат на основе какого-либо разумного критерия.

Пример 1. Проанализировать стратегии игроков, если платёжная матрица имеет вид

4

10

 

P

6

8

.

 

 

 

 

 

 

Д

Решение. Каждый игрок имеет по две стратегииИ. Если игрок A выбрал стратегию A1, а игрок B – стратегию B2, то выигрыш первого (или проигрыш второго) равен 10. Но если игрок B при этом выбрал стратегию B1, то выигрыш первого будет равен 4, значит, игроку A не следует применять стратегию A1. Если игрок B намерен получить минимальный проигрыш, то соответственно игрок A получит минимальный выигрыш, а это его может не устраивать. Таким образом, игроки должны выбирать такие стратегии, чтобы для каждого из них были достигнуты приемлемые результаты.

12

Ситуация, в которой достигаются приемлемые результаты для обоих игроков, называется ситуацией равновесия.

 

Понятие наилучшего (оптимального) решения является сложным

понятием. Для того чтобы утверждать, что какое-то решение является

оптимальным, нужно знать, что именно мы понимаем под словом

С

«оптимальный». Например, фирма при выборе своих управленческих

решений может руководствоваться следующими соображениями:

макс м зац я пр были;

м н м зац я здержек;

завоевать место на рынке;

стрем ться к м н мизации хозяйственных рисков;

и др.

Каждое

з

эт х

соо ражений приводит к определенному

критер ю опт мальности. Решения, которые оптимальны с точки

зрения одного кр тер я, могут

ыть неоптимальными с точки зрения

другогоесли. Напр мер, фирма выбрала в качестве критерия

оптимальности пр нц п достижения наибольшей прибыли,

то может

оказаться, что решен е, которое обеспечивает наибольшую прибыль,

приводит к появлению высоких хозяйственных рисков.

 

 

Одним из критериев оптимальности является критерий

гарантированного результата. Этот критерий заключается в том, что

наилучшим решением (оптимальной стратегией) будет такое

решение, которое даёт игроку определённый (гарантированный)

выигрыш (илибАпроигрыш) независимо от действий других участников

игры.

 

 

 

 

 

 

 

 

 

 

Рассмотрим

парную

конечную

игру

m n

с

матрицей

P (aij),i 1,2,...,m; j 1,2,...,n

и определим

наилучшую

среди

стратегий A ,A ,...,A

 

 

 

И

первого игрока. Выбирая стратегию

A ,

игрок

1

2

m

 

 

Дi

 

A должен рассчитывать, что игрок B ответит на неё той из стратегий

Bj , для которой выигрыш для игрока A минимален.

игрока A при

Обозначим

через i

наименьший

выигрыш

выборе им стратегии

Ai для всех возможных стратегий игрока B

(наименьшее число в i-й строке платёжной матрицы), т.е.

 

 

min aij i .

j

13

Из всех

чисел

i

выберем наибольшее значение max i

 

 

 

i

(таких может

быть

несколько), которое называется нижней ценой

игры или максимином. Стратегия, соответствующая максимину, называется максиминной стратегией. Эта стратегия гарантирует игроку A выигрыш не меньше нижней цены , при условии что игрок B применил любую стратегию. Следовательно,

 

 

max min ij .

 

 

(1)

 

 

i

 

j

 

 

 

 

Вел ч ны, связанные с осторожным поведением

игрока

B,

С

 

 

 

 

 

том,

чтобы

определяются аналог чно. Цель игрока B состоит в

уменьш ть вы грыш

грока A.

 

Поэтому выбирая стратегию Bj , он

макс мально возможный при этом выигрыш для

противн ка.

 

м

 

 

 

 

 

 

учитывает

 

 

 

 

 

 

 

 

j maxaij .

 

 

 

 

 

 

 

i

 

 

 

 

Из всех чисел

j вы ерем наименьшее значение

min j .

Обознач

 

j

 

 

 

 

Число называется

верхней ценой

игры, или минимаксом.

Это

гарантированный проигрыш игрока B. Следовательно,

 

 

 

 

А

 

 

(2)

 

 

minmaxaij .

 

 

 

 

 

j

i

 

 

 

 

Стратегия,

соответствующая

минимаксу,

называется

минимаксной стратегией. Эта

 

стратегия обеспечивает

игроку

B

 

 

 

Д

 

 

проигрыш не больше верхней цены

против любой стратегии игрока

A. Рассмотренный принцип выбора Истратегий называется

принципом минимаксной и максиминной стратегий. Он следует из того, что каждый игрок стремится достичь цели, противоположной цели противника, и делает всё, чтобы получить наибольший доход.

В конечной матричной игре максиминная стратегия гарантирует игроку A выигрыш не меньше, чем нижняя цена игры , в то же время A не может рассчитывать на выигрыш больше верхней цены. Аналогичное рассуждение показывает, что игрок B, имея

14

возможность проиграть не больше , не может рассчитывать на проигрыш меньше . Для игры, в которой , это означает, что гарантирующие стратегии дают игрокам результаты, которые невозможно улучшить, и, следовательно, соответствуют их оптимальному поведению. Очевидно, что в этом случае выбор любой пары (Ak ,Br ) гарантирующих стратегий выгоден обоим игрокам.

При

нет

таких

убедительных причин

считать

гарант рующ е стратегии «неулучшаемыми», как это было в случае

,

при выборе оптимального поведения надо использовать

другие

 

 

соображен я.

 

 

 

СТеорема 1. Для лю ой матричной игры выполняется

неравенство

 

 

 

 

б

(3)

 

max min ij

minmaxaij .

 

i

j

j i

 

То есть н жняя цена игры не больше чем верхняя цена игры. Следовательно, для матричной игры всегда выполняется условие

.

Если верхняя цена игры равна нижней цене игры, т.е.

справедливо равенство

 

А,

(4)

то такая игра называется игройДс седловой точкой, а пара оптимальных стратегий (Ai ,Bj) – седловой точкой игры. Применение оптимальных стратегий даёт ситуацию равновесия.

Ценой игры называется элемент платёжной

матрицы,

являющийся одновременно минимальным в i-й строке

и в j

столбце. Таким образом, . Если игра имеет седловую точку,

то говорят, что она решается в чистых стратегиях.

 

И

Теорема 2. Если один участник игры выбирает свою оптимальную максиминную или минимаксную стратегию, то лучшим выбором для другого участника будет своя минимаксная или максиминная стратегия.

Если платёжная матрица имеет седловую точку, то ни одному участнику игры невыгодно в одностороннем порядке отказываться от

15

своей оптимальной стратегии. Другими словами, в cедловой точке наблюдается баланс интересов, поэтому эту точку называют точкой равновесия.

Если платёжная матрица имеет седловую точку, то: -игрок A имеет оптимальную максиминную стратегию; -игрок B имеет оптимальную минимаксную стратегию;

-применение оптимальных стратегий даёт ситуацию равновесия, которая называется равновесием в чистых стратегиях;

- гра меет решение , Ai,,Bj .

Найдём решен е игры рассмотренного выше примера 1. Для

этого в каждой строке ищем минимальный элемент, затем в

С

выбираем максимальное значение:

полученном стол це м

нимумов затем в строкебАмакс мумов определяет минимальное значение:

max i max(4,6) 6, 2 – нижняя цена игры.

Игрок B вы рает в каждом столбце максимальный элемент, а

min j min(6,8) 6, 1 – верхняя цена игры.

Следовательно, гра имеет седловую точку (A2,B1) и цена игры

6.

Пример 2. Найти гарантированные выигрыши и проигрыши, нижнюю и верхнюю цены, оптимальные стратегии игры с матрицей

Решение. Вычисление Дгарантированных выигрышей и проигрышей можно оформлять следующим образом: рядом с каждой строкой (столбцом) платёжной матрицы справа (снизу) записывается наименьший (наибольший) элемент этой строки (столбца). В

P 1 0 1 .

2

5

3

 

 

 

 

 

 

 

 

 

 

 

3

2

2

 

 

 

рассматриваемом примере получится

 

 

 

И

2

5

 

3

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 .

P= 1 0

1

 

2

 

2

 

 

3

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

5

1

 

 

 

16

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]