Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
562189_1E882_bimatrichnye_igry.docx
Скачиваний:
10
Добавлен:
19.09.2019
Размер:
264 Кб
Скачать
  1. Оптимальность по Парето

Как и в случае антагонистических игр, целью теории биматричных игр является выработка принципов оптимальности10, а так же установление соответствий между свойствами игр и свойствами их решений.

Чаще всего под оптимальностью подразумевают различные варианты формализованных описаний содержательных представлений о выгодности, устойчивости и справедливости.

В биматричных играх могут появляться ситуации, приемлемые, (т.е. выгодные и потому устойчивые) для каждого из игроков, могут априори оказываться в том или ином смысле невыгодными (и потому не устойчивыми)для игроков.

Один вариант устойчивости ситуации, отражающий черты ее выгодности, состоит в ее оптималь­ности по Парето.

Далее мне придется сравнить между собой ситуации по выигрышам, которые получают в них различные игроки. Для этого я введу следующие обозначения:

,

и будем, как обычно, полагать

НI(х)<НI(у), если при всех i є I;

HI(x)≤HI(y) если Hi(x)≤Hi(x) при всех i є I, но НI(х)≠ НI(у);

НI(х)≤ НI(у), если .

Определение. Ситуация х° в биматричной игре

Г =

называется оптимальной по Парето, если не существует ситуации xєx, для которой имеет место векторное неравенство .

Множество всех ситуаций в игре Г, оптимальных по Парето, обозначается через ζP(Г). Иными словами, в оптимальной по Парето ситуации игроки не могут совместными усилиями увеличить выигрыш кого-либо из них, не уменьшив при этом выигрыш кого-либо другого.

Формальное различие ситуации равновесия от ситуации, оптимальной по Парето: в первой ни один игрок, действуя в оди­ночку, не может увеличить своего собственного выигрыша; во второй — все игроки, действуя совместно, не могут (даже нестрого) увеличить выигрыш каждого.

Вопросы об оптимальных по Парето ситуациях решаются в принципе проще, чем аналогичные вопросы о ситуациях равновесия. Это объясняется тем, что оптимальность по Парето ситуации х определяется лишь положением векторного значения Hi(x) в множестве всех допустимых векторов выигрышей,

ϑ (Г) = {HI(x): xєx}

а для выяснения вопроса о равновесности ситуации требуется учитывать еще и зависимость каждой из компонент Hi(х) этого вектора от соответствующей переменной xi. Практически любое достаточно обозримое описание множества векторов выигрышей ϑ приводит к описанию векторов выигрышей в оптимальных по Парето си­туациях.

Т ак, в изображенном на рис.1 примере оптимальным по Парето ситуа­циям будут соответствовать все точки ϑ (Г), принадлежащие выделен­ными жирными линиями участкам "северо-восточной" границы ϑ (Г) .

В частности, для существования в игре Г оптимальной по Парето ситуа­ции достаточно компактности множества ϑ (Г). Для этого же, в

свою очередь, достаточно, чтобы множество всех ситуаций х было компактным в некоторой топологии11, а все функции выигрыша Hi этой топологии бы­ли непрерывными.

  1. Равновесие по Нэшу

Ситуация х называется ситуацией равновесия, если для любого игрока i є I и любой его стратегии xi є хi - выполняется нера­венство .

Множество всех ситуаций равновесия в игре Г будем обозначать через ζ(Г). Очевидно,

.

Из определения видно, что в ситуациях равновесия и только в них ни один игрок не заинтересован в отклонении от своей стратегии. В частности, если ситуация равновесия оказывается предметом договора между игрока­ми, то ни один из игроков не будет заинтересован в нарушении своих обя­зательств. Наоборот, если в договоре зафиксирована неравновесная ситуа­ция., то по определению найдется хотя бы один игрок, который будет заинтересован в отклонении от нее и тем самым — в нарушении этого до­говора.

Равновесной стратегией игрока в бескоалиционной игре называется такая его стратегия, которая входит хотя бы в одну из си­туаций равновесия игры.

В случае антагонистической игры равновесные стратегии игроков совпа­дают с их оптимальными стратегиями. Для биматричных игр, напро­тив, понятие оптимальной стратегии игрока нередко вообще не имеет смысла: в таких играх оптимальными оказываются не стратегии отдельных игроков, а их сочетания, (т.е. ситуации) и притом для множества всех игро­ков сразу.

Поэтому в биматричных играх как оптимальные следует квалифицировать не действия того или иного игрока, а совокупность дейст­вий всех игроков, исход игры, ситуацию в ней. Именно в таком смысле следует понимать оптимальность приемлемых ситуаций в биматричной игре и ситуаций равновесия в ней.

Значительная часть теории биматричных игр состоит в исследовании свойств их ситуаций равновесия и равновесных стратегий игроков, а также в разработка способов их нахождения.

Процесс нахождения ситуаций равновесия в биматричной игре часто называется решением игры.

Джорджем Нэшем было доказано существование ситуации равновесия в смешанных стратегиях для любой биматричной игры.

Теорема. В каждой биматричной игре

Г =

существует хотя бы одна ситуация равновесия (в смешанных стратегиях).

Доказательство. Если игрок i имеет в игре Г mi чистых страте­гий, то множество Xi всех его смешанных стратегий, как уже неоднократно отмечалось, можно представлять как (mi 1) -мерный симплекс. Поэтому всякую ситуацию

Х = (Х1,...,Хn)

в смешанных стратегиях можно рассматривать как точку в декартовом произведении X = Х1 x . . . x Хn симплексов смешанных стратегий. Это декартово произведение, очевидно, является выпуклым и компактным подмножеством евклидова пространства размерности m1 + ... + mn - n.

Положим теперь для произвольной ситуации X и любой чистой стратегии

,- игрока i

. (4)

Очевидно, все вводимые таким образом функции . принимают только неотрицательные значения.

Функция , показывает увеличение выигрыша игрока i в ситуации X, происходящее за счет замены его стратегии Xi, входящей в эту ситуацию, некоторой чистой стратегией . Уменьшения же выигрыша функция , не показывает, ибо в этом случае ее значение будет равно нулю.

Составим теперь для всевозможных i=1, …, n и j=1, …, mj числа вида

(5)

Все эти дроби, очевидно, неотрицательны, а каждая сумма вида

равна единице.

Следовательно, при фиксированных X и i дроби (5) можно понимать

как вероятности соответствующих чистых стратегий игрока i. Тем

самым каждый набор таких дробей для всех чистых стратегий можно понимать как смешанную стратегию игрока i.

Так как дроби (5) составляются для каждого игрока i є I, их совокуп­ность определяет систему смешанных стратегий всех игроков, т.е. некоторую ситуацию в игре Г. Эта ситуация зависит от исходной ситуации X, являясь ее функцией. Будем обозначать ее поэтому через ψ(Х). Очевидно, что функция ψ осуществляет преобразование замкнутого выпуклого и ограниченного множества всех ситуаций X в себя.

Кроме того, эта функция является непрерывной функцией ситуации. Действительно, каждая компонента ситуации, являющейся значением функ­ции ψ, есть дробь вида (5). В числителе этой дроби первое слагаемое есть сама компонента ис­ходной ситуации и поэтому зависит от нее непре­рывно.

Второе слагаемое, как видно из (4), есть комбинация из линейных функций Hi (X) и , постоянной 0 и операции взятия максимума (то, что функция шах { 0, х }является непрерывной, легко усмотреть из ее графика на рис.2. Следовательно, также является непрерывной функцией X.

Рисунок 2

Значит, числитель дроби (5) есть непрерывная функция X. Наконец, знаменатель этой дроби непрерывен и притом не может приближаться к нулю (его значения не меньше единицы). Таким образом, функция ψ является непрерывной.

Заметим, что принципиальная важность теоремы Нэша ограничи­вается вопросом существования ситуации равновесия. Непосредственно применять ее для нахождения таких ситуаций не удается, так как сама по себе она не является конструктивной, так как теорема Нэша не дает путей к нахождению ситуаций рав­новесия. Вместе с тем, все методы приближенного нахождения непод­вижных точек в непрерывных отображениях компактов (особенно выпук­лых) в себя могут быть использованы для приближенного решения биматричных игр.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]