Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
теория игр.doc
Скачиваний:
81
Добавлен:
03.06.2015
Размер:
11.32 Mб
Скачать

2.Основные модели теории игр

    1. Развернутая и стратегическая формы игр

Основные модели теории игр следующие.

  1. Игра в развёрнутой форме.

  2. Игра в стратегической форме.

Анализ любой игры или конфликтной ситуации должен начинаться с описания модели, описывающей игру.

Для представления игры в развёрнутой форме рассмотрим пример – простую карточную игру. В ней два участника, называемые игроками.

Игроки откладывают по доллару, чтобы платить из этих денег выигрыш, и начинают игру.

Первый игрок вытягивает из колоды карту и видит красная она или черная. Второй игрок не знает цвет карты. В этот момент первый игрок может закончить игру. Если он заканчивает игру, то он показывает второму игроку, какого цвета карта. Если она красная, то первый игрок забирает себе все отложенные доллары. В этом случае первый игрок выигрывает один доллар. Если карта черная, то первый игрок проигрывает один доллар, так как отложенные доллары забирает второй игрок.

Если первый игрок продолжает играть, то он добавляет к отложенным долларам еще один доллар.

В этот момент второй игрок может либо закончить игру, либо ее продолжить.

Если второй игрок заканчивает игру, то первый игрок, не зависимо от цвета карты,

забирает все отложенные доллары и его выигрыш составляет один доллар. А второй игрок проигрывает один доллар.

Если второй игрок продолжает игру, то он добавляет к отложенным долларам еще один доллар.

После этого первый игрок показывает ему цвет карты. Если карта красная, то первый игрок забирает все отложенные доллары. Его выигрыш составляет два доллара, а второй игрок проигрывает два доллара. Если карта черная, то все доллары забирает второй игрок. Выигрыш второго игрока составляет два доллара, а первый игрок проигрывает два доллара.

На рисунке показан граф, отображающий события, которые могут возникнуть в игре. Дерево в теории графов – связанный неориентированный граф, не содержащий циклов. Дерево с одной выделенной вершиной называется корневым деревом.

Для того, чтобы дерево игры полностью описывало игру необходимо отобразить тот факт, что игроки находятся не в одинаковых информационных состояниях.

Для того, чтобы пометить, в каких информационных состояниях находятся игроки, вводятся информационные метки: a,b, 0. Единственная роль информационных меток – указание на то, какие вершины не различимы игроками, которые их контролируют.

Графом называется конечное множество точек, или вершин, вместе с множеством рёбер, каждое из которых соединяет пару вершин. Ребро может быть идентифицировано двумя вершинами, которые это ребро соединяет. Тогда путём называется множество рёбер в форме

,k=1,2,…,m-1, ,

-- разные вершины графа.

Мы можем сказать, что такой путь соединяет вершины и .

Деревом называется граф, в котором каждая пара узлов соединяется только одним путём из рёбер графа.

Деревом с корнем называется дерево, в котором одна особая вершина отмечена как корень дерева. Когда мы говорим о пути к данной вершине, мы имеем ввиду тот единственный путь, который связывает эту вершину с корнем.

Альтернативой у вершины в дереве с корнем является любое ребро, которое соединяет эту вершину с другой вершиной, но не входит в состав пути к этой вершине.

Вершина или ребро xследует за вершинойyтогда и только тогда, когдаyнаходится на пути кx. За конечной вершиной не следует ни одна альтернатива.

Для любого положительного целого nигройв развёрнутой форме называется дерево с корнем вместе с функциями, которые определяют метки для каждой вершины и ребра, удовлетворяя таким условиям:

  1. Каждая нетерминальная вершина имеет метку игрока (1,2,…,N)

0 – метка отсутствия контроля каким-либо игроком.

2. Если вершина помечена 0, тогда должно быть фиксировано вероятностное распределение.В такой вершине эти вероятности неотрицательны для каждой альтернативы и их сумма равна 1.

3. Каждая вершина, которая контролируется игроком , имеет вторую метку, которая описывает информационное состояние игрока, если траектория игры достигла этой вершины. Метка (i,k) помечает вершину, в которой игрокiдвигается в информационном состоянииk.

4. В вершине, контролируемой игроком, каждой альтернативе предписана метка хода. Если какие-то вершины имеют одни и те же метку игрока и метку информационного состояния, т.е. (i,k), то тогда разметка ходов совпадает, т.е. для любой альтернативы в вершинеxсуществует в точности одна альтернатива в вершинеy, которая имеет ту же метку движения.

5. Каждая финальная вершина имеет метку, которая описывает вектор nчисел, т.е. вектор выигрышей.

В этом курсе часто рассматриваются игры, удовлетворяющие требованию 6:

6. Игроки не забывают сделанных выборов.

Требование 6 «О памяти»

Пусть y – вершина, в которой i-й игрок принимает решение и z – вершина, неразличимая с y.

Тогда для любой прошлой вершины, в которой i-й игрок принимает решение, и движения, о которых игрок помнит в y, должны существовать неразличимые вершина и движения, которые помнит i-й игрок, находясь в z.

(Конечно, может быть, что x=ωиb=c)

Если никакие две вершины не имеют одного и того же самого информационного состояния, то мы говорим, что это игра с совершенной информацией.

Игра с несовершенной информацией

Игры с совершенной информацией

В игре с совершенной информациейигрок знает прошлые движения всех других игроков и результат хода случая, а также все свои прошлые движения.

Стратегией игрока в игре в развернутой форме является любое правило для определения движения в каждом возможном состоянии игры.

Математически это означает, что стратегия – это функция, отображающая информационные состояния в движения.

Обозначим

Si– множество возможных информационных состояний игрока i

Ds– множество движений, доступных игроку i в состоянииs.

– множество стратегий игрока i

В простой карточной игре у первого игрока 4 стратегии.

Стратегия, которая состоянию а ставит в соответствие R, а состоянию b – r. Т.е. получаем Rr

Стратегия, которая состоянию а ставит в соответствие R, а состоянию b –f. Т.е. получаем Rfи т.д.

Всего 4 стратегии: {Rr,Rf,Fr,Ff}, у второго игрока – две: {M,P}

Множество стратегий второго игрока состоит из двух стратегий {L,R}.

Множество стратегий второго игрока состоит из четырех стратегий {Ll,Lr,Rl,Rr}

Стратегическая форма игры:

Г={N, (Ci) iєN, (ui)iєN},

N– множество игроков,

Ci– множество стратегий i-го игрока,

ui– функция выигрыша i-го игрока,

ui: ΠjєNCj→R.

Обозначим с={c1,c2,…,cN}.

Если NиCi – конечные множества, то игра называется конечной.

С – все множество таких наборов.

Выбор игроки делают одновременно.

Процедуру конструирования игры Г в стратегической форме по игре Гe в развернутой форме предложили фон Нейман и Моргенштерн.

Пример. Проанализируем простую карточную игру заранее, до начала игры

Количество игроков – 2

Стратегии 1-го игрока – {Rr,Rf,Fr,Ff}

Стратегии 2-го игрока – {M,P}

Ожидаемые выигрыши каждого игрока:

u1(Rf,M)=2·½+(-1)·½=0,5

u2(Rf,M)=(-2)·½+1·½=-0,5 и т.д.

C1

C2

M

P

Rr

0,0

1,-1

Rf

0.5,-0.5

0,0

Fr

-0.5,0.5

1,-1

Ff

0,0

0,0

Это нормальное представление простой карточной игры.

В общем случае: пусть задана игра Гев развернутой форме. Представление ее в стратегической форме делается так

Множество игроков то же самое, стратегии те же. А функция полезности строится так

Р(x|c) – это вероятность того, что игра пройдет через узел х, если игроки будут делать свои выборы согласно набору с, а в вершине, в которой решение принимается случайным образом, следующая альтернатива, включенная в траекторию определяется распределением вероятности, зафиксированном в Ге

Т.е., если х – корень дерева, тогда Р(x|c)=1

Если х непосредственно следует за вершиной y, контролируемой ходом случая иq– вероятность выбора ребра от y к x, тогда Р(x|c)=qР(y|c)

Пусть х непосредственно следует за вершиной у, в которой решение принимает игрок i в информационном состоянии r.

Если ci(r) метка движения на ребре отyк х, тогда

Р(x|c)= Р(y|c)

Если ci(r) не метка движения на ребре отyк х, тогдаР(x|c)=0.

(напомним, что ci(r) входит в набор с)

Пусть Ω* - множество всех конечных вершин.

Тогда

,

где - выигрыш i-го игрока в вершине х в Гe.

Если Г=(N, (Сi)iєN, (ui) iєN) выводится из Гeтаким образом, тогда Г называется нормальным представлением Гe.

Пример.

C1

C2

L

R

T

2,2

4,0

B

1,0

3,1

Пример:

C1

C2

Ll

Lr

Rl

Rr

T

2,2

2,2

4,0

4,0

B

1,0

3,1

1,0

3,1