Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
теория игр.doc
Скачиваний:
81
Добавлен:
03.06.2015
Размер:
11.32 Mб
Скачать

4.Последовательные равновесия в играх в развернутой форме

4.1.Смешанные стратегии и стратегии поведения

Обозначения:

- игра в развернутой форме,

N– число игроков,

- число информационных состояний игрокаiв.

Предполагается, что ,

,

- множество вершин, в которыхi-й игрок делает ход и у него информационное состояние.

- множество действий игрокаiв состоянииs, т.е. множество ветвей с метками действий, которые следуют за вершиной из.

Чистой стратегиейигрока вназывается функция, описывающая действия игрока в любых его информационных состояниях.

- множество чистых стратегийi-го игрока в, т.е..

Игру в развернутой форме мы можем представить в виде нормального представления и многоагентного представления. Эти два представления дают два способа определения набора смешанных стратегий для данной игры в развернутой форме.

Набор смешанных стратегийвопределяется как любой набор смешанных стратегий в нормальном представлении игры, т.е. множество наборов таких смешанных стратегий в- это.

Набор стратегий поведенияв- это любой набор смешанных стратегий в многоагентном представлении.

Множество наборов стратегий поведения – это .

Набор смешанных стратегий описывает вероятностное распределение любого игрока на множестве всех стратегий игрока. Набор стратегий поведения описывает вероятностное распределение на множестве возможных движений для каждого информационного состояния каждого игрока.

Набор стратегий поведения может быть назван сценариемигрока, т.к. он описывает вероятность каждой альтернативной ветви, которая следует за каждой вершиной, в которой принимается решение.

Обозначения: если - набор стратегий поведения из, тогда

,,

.

может быть назван вероятностью движения, т.к. это вероятность того, что игрокiвыберет движениеесли траектория игры достигла узла, в котором ходит игрокi, находясь в информационном состоянииs.

также называется стратегией поведения игрокаi,описывает вероятность каждого возможного движения в любом информационном состоянии игрока.

Смешанной стратегией i-го игрока является, описывающие вероятностьвыбора любой чистой стратегииигрокомi.

Пример 4.1.1.

3,1

2,2

2,2

1,3

2,2

3,1

1,3

2,2

2,2

1,3

3,1

2,2

1,3

2,2

2,2

3,1


Равновесие для нормального представления этой игры – это набор смешанных стратегий

,

,.

Этим смешанным стратегиям соответствует набор стратегий поведения .

Вероятность выбора- ½.

Вероятность выбора -1/2.

Вероятность выбора- ½.

Вероятность выбора - ½.

Пример 4.1.2:

Рассмотрим смешанную стратегию 1- го игрока. На первый взгляд может показаться, что этой смешанной стратегии соответствует стратегия поведения,для игрока 1, но это не так. Используя стратегию, игрок 1 планирует выбрать, если он применил чистую стратегию. В этом случае траектория игры не достигнет узла 1.3 и выборне осуществляется. В действительности игрок будет использоватьс вероятностью 1 в узле 1.3, т.к.является единственной стратегией, которая имеет положительную вероятность и которая совместима с информационным состоянием 3. Так что стратегией поведения, соответствующей смешанной стратегии, является стратегия поведения (,)

скажем, чтоsисовместимы, если существует по крайней мере одна комбинация чистых стратегий других игроков, таких, что узел, в котором игрокiдвигается в информационном состоянииs, возникает с положительной вероятностью, если игрокiиспользует стратегию. То естьsисовместимы, еслиизтакой, что

,

где , аP(x|c) – вероятность попасть в узел при использовании игроками стратегииc(Pрассчитывается как произведение вдоль пути вероятностей случая).

- множество всех чистых стратегий из, которые совместимы с информационным состояниемsi-ого игрока.

имы скажем, чтоsсовместимы с, еслитакое, что.

Для иобозначим черезмножество чистых стратегий, которые совместимы сsи определяюткак движениеi-ого игрока в информационном состоянииs. То есть=.

Например, для последней разобранной игры (пример 4.1.2)

,

.

Стратегия поведения для игрокаiпредставляет смешанную стратегию, если

(4.1.1).

Для примера 2.20.2 =>

(,,)

Каждая смешанная стратегия имеет стратегию поведения, её представляющую. Еслине совместимо с, тогда любоеудовлетворяет (4.1.1), так как обе части (4.1.1) равны 0.

Т.е. может иметь более чем одно представление в стратегиях поведения.

Набор стратегий поведения представляет набор смешанных стратегий, еслипредставляет смешанную стратегию.

Каждой стратегии поведения поставим в соответствие её смешанное представление, определив, что вероятность выбора чистой стратегиитакая

,.

Смешанным представлением набора стратегий поведения является набор смешанных стратегийтакой, чтоявляются смешанным представлением.

Две смешанные стратегии из эквивалентны по поведению, если у них существует общее представление стратегиями поведения.

В примере

равновесная стратегия ,

(,)

Ей соответствует набор стратегий поведения

,,,.

Две смешанные стратегии иявляются эквивалентными по поведению, т.к. обе имеют представление в стратегиях поведения,, для которых смешанное представление.

В этой игре иэквивалентны по поведению, т.к. обе имеют одинаковое представление по поведению,, для которогоявляется смешанным представлением.

(Вычисления:

, ,,

, , .

Для ;;;.

,,,.

И для , и длясправедливо

=>,

=>,

=>

=>.

Получим ().

;;;;.

.

Если => , .

Если => , .

Если => , .

Если => , .

,

,

,

,

т.е. смешанное представление стратегии поведения () действительно является стратегией.

Два набора смешанных стратегий иизэквивалентны по поведению, если для каждогоiиэквивалентны по поведению.

Две смешанные стратегии иизэквивалентны по выигрышу, если для каждого игрокаjи,,

где - выигрышj-ого игрока в нормальном представлении .

Теорема 4.1:Если является игрой с совершенной памятью, тогда любые две смешанные стратегии из, эквивалентные по поведению, являются эквивалентными по выигрышу.

Пример 4.1.3.

Эта игра не является игрой с совершенной памятью. Смешанные стратегии 1-ого игрока иимеют одно и то же представление в стратегиях поведения,. Но они не являются эквивалентными по выигрышу.

идают ожидаемый выигрыш 1-ому игроку 0,

идают ожидаемый выигрыш 1-ому игроку -1.

(Вычисления:

, ,,

, ,.

;;;.

Использовалась формула .