Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
теория игр.doc
Скачиваний:
90
Добавлен:
03.06.2015
Размер:
11.32 Mб
Скачать

4.3.Последовательная рациональность в информационных состояниях, вероятность которых произойти положительная

Будем говорить, что стратегия является последовательно рациональной для игрока i в информационном состоянии , если он действительно будет хотеть делать то, что эта стратегия предписывает ему сделать в данном состоянии.

Бывает так, что, попав в состояние s, игрок думает, что ему не выгодно поступать так, как рекомендует ему выбранная в начале игры стратегия. Рассмотрим это явление подробнее. Для любого набора стратегий поведения и любых двух узлов x и y, еслиy следует за x, тогда- произведение всех вероятностей, приписанных ветвям на пути из x в y стратегийи распределением вероятности для хода случая.

Если y неследует за x, тогда=0. То естьявляется условной вероятностью того, что траектория игры пройдет через y после x, если все игроки выберут движение согласнои если игра начинается в узле x.

Обозначим

– множество всех конечных вершин в игре Ге,

– выигрыш игрока i в конечной вершине y,

, т.е.– это ожидаемый выигрыш игрока i, если траектория игры начинается из вершины x (вместо корня) и все игроки после этого выбирают свои движения согласно стратегии.

Пусть игрок i находится в информационном состоянии s, которое возникает только в одном узле x, т.е. . Тогда наборстратегий поведенияпоследовательно рациональный, если, где– стратегия поведения, которая отличается оттолько тем, что игрок i будет вести себя согласнов состоянии s.

Как определяется последовательная рациональность в случае, если содержит два и более узла?

В таком информационном состоянии s ожидаемый выигрыш игрока зависит от его мнения о том, какая вершина из оказалась на траектории игры.

-вероятностное распределение мненийна множестве вершин, помеченных меткой i,s.

, где– вектор мнений, описывающий распределение вероятности мнений для каждого информационного состояния каждого игрока.

Набор стратегий является последовательно рациональнымдля i в состоянии s при векторе мнений, если. (4.3.1)

Также существует эквивалентное определение:

являетсяпоследовательно рациональнойдля игрока i в информационном состоянии s с вектором мнений, если для любогоиз того, чтоследует.

.

называется последовательным выигрышемдвижения. Еслинеявляется последовательно рациональной для i в s с, тогда существуеттакое, что, но последовательный выигрышдля i в состоянии s (относительнои) строго меньше, чем последовательный выигрыш некоторого другого движения, которое может выбрать игрок i, находясь в s.

Такое движение называетсянерациональным движениемпри сценариис вектором мнений.

Как рациональный разумный игрок определяет вероятности мнений? Вероятности мнений – условные вероятности при условии, что в ходе игры у игрока появилась какая-то информация. Т.к. игроки разумны и рациональны, то эти условные вероятности должны быть связаны с формулой Байеса, учитывающей информацию и мнение игрока, которые у него были в начале игры.

Обозначим , где x0– корень дерева игры.– называется предварительной вероятностью вершины y при сценарии.

Пусть – набор стратегий, описывающих поведение, которое разумный игрок мог бы ожидать в игре Ге.– условная вероятность, которую игрок i приписывает событию, что он делает движение в узле x при условии, что он знает, что делает движение в каком-то из узлов, принадлежащих,. Тогда, согласно формуле Байеса

(4.3.2)

Будем говорить, что вектор мнений слабо совместимсо сценарием, еслиудовлетворяет (4.3.2),,.

Пусть (4.3.3)

Тогда (4.3.4)

Если условие (4.3.3) нарушено, тогда состояние s имеет нулевую вероятность осуществиться по сценарию , в этом случае будем говорить, что s находитсявне траекториисценария.

Теорема 4.3.Пустьявляется равновесием в стратегиях поведения в игре Гев развернутой форме с совершенной памятью. Пусть s таково, что условие (4.3.3) при сценарии выполняется. Пусть– вектор мнений, слабо совместимый с. Тогдапоследовательно рациональна для игрока i в состоянии s с вектором мнений.

Пример.Простая карточная игра.

M

P

Rr

0,0

1,-1

Rf

0.5, -0.5

0,0

Fr

-0.5, 0.5

1, -1

Ff

0,0

0,0

Ff – сильно доминируема, т.к.

Fr – слабо доминируема, т.к.

Нет равновесия в чистых стратегиях.

Равновесные стратегии таковы:

Равновесные стратегии поведения ( формула (4.1.1))

.

Чтобы проверить последовательную рациональность, выясним, будет ли каждый игрок действительно применять эти равновесные стратегии в каждой вершине, где они будут ходить. Если 1-й игрок вытащил красную карту, то он должен поднимать ставки, т.к. он ничего не выиграет, если закончит игру (F). Если 1-й игрок вытащил черную карту, то при условии, что 2-й игрок будет применять равновесную стратегию

В том числе и для , как рекомендует равновесная стратегия. Т.е. равновесная стратегия последовательно рациональна для 1-го игрока. Оптимальное движение 2-го игрока зависит от вероятностного распределения его мнений.

Пусть a0обозначает верхний узел 2-го игрока, а b0– нижний узел 2-го игрока.

На рисунках вектор мнений будет записываться в таких скобках <.>.

Т.е второму игроку нет смысла менять вероятности выбора M и P, т.к. (4.3.1) выполняется и , т.е..