Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Вопросы 46-60 по математике для 588.doc
Скачиваний:
16
Добавлен:
13.09.2019
Размер:
1.32 Mб
Скачать
  1. Биматричные игры. Равновесие Нэша. Оптимальность Парето.

Биматричная игра – это конечная игра двух игроков с ненулевой суммой, в которой выигрыши каждого игрока задаются матрицами отдельно для соответствующего игрока (в каждой матрице строка соответствует стратегии игрока 1, столбец – стратегии игрока 2, на пересечении строки и столбца в первой матрице находится выигрыш игрока 1, во второй матрице – выигрыш игрока 2.)

Для биматричных игр также разработана теория оптимального поведения игроков, однако решать такие игры сложнее, чем обычные матричные.

Непрерывной считается игра, в которой функция выигрышей каждого игрока является непрерывной в зависимости от стратегий. В теории математики доказано, что игры этого класса имеют решения, однако пока не разработано практически приемлемых методов их нахождения.

Рассмотрим, например, конфликтную ситуацию, в которой каждый из двух участников имеет следующие возможности для выбора своей ли­нии поведения –

игрок А может выбрать любую из стратегий A1,…,Am,

игрок В может выбрать любую из стратегий B1,…,Bn.

При этом всякий раз их совместный выбор оценивается вполне оп­ределенно: если игрок A выбрал i-ю стратегию А1, а игрок В kстра­тегию Bk, то выигрыш игрока А равен некоторому числу aik, а выигрыш игрока В некоторому, вообще говоря, другому числу bik.

Иными словами, всякий раз каждый из игроков получает свой приз.

Последовательно перебирая все стратегии игрока А и все стратегии игрока B мы сможем заполнить их выигрышами две таблицы

B1

Bk

Bn

B1

Bk

Bn

A1

a11

a1k

a1n

A1

b11

b1k

b1n

….

….

Ai

ai1

aik

ain

Ai

bi1

bik

bin

Am

am1

amk

amn

Am

bm1

bmk

bmn

Первая из таблиц описывает выигрыши игрока А, вторая — выигрыши игрока B. Обычно эти таблицы записывают в виде матриц

,

Здесь А — платежная матрица игрока А, а В — платежная матрица игрока В.

При выборе игроком А i-й стратегии, а игроком В kстратегии их выигрыши находятся в матрицах выплат на пересечении i-x строк и kстолбцов: в матрице А это элемент aik , а в матрице В — элемент bik.

Таким образом, в случае, когда интересы игроков различны (но не обязательно противоположны), получаются две платежные матрицы: одна — матрица выплат игроку А, другая — матрица выплат игроку В. Поэтому совершенно естественно звучит название, которое обычно присваивается подобной игре, — биматричная.

Замечание, Рассматриваемые ранее матричные игры можно рассмат­ривать, разумеется, и как биматричные, где матрица выплат игроку В противоположна матрице выплат игроку А:

или

.

Однако в общем случае биматричная игра — это игра с ненулевой суммой.

Равновесие по Нэшу.

В теории игр равновесием Нэша (названным в честь Джона Форбса Нэша, который предложил его) называется тип решений игры двух и более игроков, в котором ни один участник не может увеличить выигрыш, изменив своё решение в одностороннем порядке, когда другие участники не меняют решения. Такая совокупность стратегий выбранных участниками и их выигрыши называются равновесием Нэша.

Из определения видно, что в ситуациях равновесия и только в них ни один игрок не заинтересован в отклонении от своей стратегии. В частности, если ситуация равновесия оказывается предметом договора между игрока­ми, то ни один из игроков не будет заинтересован в нарушении своих обя­зательств. Наоборот, если в договоре зафиксирована неравновесная ситуа­ция., то по определению найдется хотя бы один игрок, который будет заинтересован в отклонении от нее и тем самым — в нарушении этого до­говора.

Равновесной стратегией игрока в бескоалиционной игре называется такая его стратегия, которая входит хотя бы в одну из си­туаций равновесия игры.

В случае антагонистической игры равновесные стратегии игроков совпа­дают с их оптимальными стратегиями. Для биматричных игр, напро­тив, понятие оптимальной стратегии игрока нередко вообще не имеет смысла: в таких играх оптимальными оказываются не стратегии отдельных игроков, а их сочетания, (т.е. ситуации) и притом для множества всех игро­ков сразу.

Поэтому в биматричных играх как оптимальные следует квалифицировать не действия того или иного игрока, а совокупность дейст­вий всех игроков, исход игры, ситуацию в ней. Именно в таком смысле следует понимать оптимальность приемлемых ситуаций в биматричной игре и ситуаций равновесия в ней.

Значительная часть теории биматричных игр состоит в исследовании свойств их ситуаций равновесия и равновесных стратегий игроков, а также в разработка способов их нахождения.

Процесс нахождения ситуаций равновесия в биматричной игре часто называется решением игры.

Джорджем Нэшем было доказано существование ситуации равновесия в смешанных стратегиях для любой биматричной игры.

Оптимальность по Парето.

Как и в случае антагонистических игр, целью теории биматричных игр является выработка принципов оптимальности, а так же установление соответствий между свойствами игр и свойствами их решений.

Чаще всего под оптимальностью подразумевают различные варианты формализованных описаний содержательных представлений о выгодности, устойчивости и справедливости.

В биматричных играх могут появляться ситуации, приемлемые, (т.е. выгодные и потому устойчивые) для каждого из игроков, могут априори оказываться в том или ином смысле невыгодными (и потому не устойчивыми)для игроков.

Один вариант устойчивости ситуации, отражающий черты ее выгодности, состоит в ее оптималь­ности по Парето.

Иными словами, в оптимальной по Парето ситуации игроки не могут совместными усилиями увеличить выигрыш кого-либо из них, не уменьшив при этом выигрыш кого-либо другого.

Формальное различие ситуации равновесия от ситуации, оптимальной по Парето: в первой ни один игрок, действуя в оди­ночку, не может увеличить своего собственного выигрыша; во второй — все игроки, действуя совместно, не могут (даже нестрого) увеличить выигрыш каждого.

Вопросы об оптимальных по Парето ситуациях решаются в принципе проще, чем аналогичные вопросы о ситуациях равновесия.

Пример: имеются два продавца, продающие определенный товар на рынке. Оба из них знают, что чем выше цена, тем меньше общий объем продаж. Для простоты предположим, что каждый из них может продать либо 400 единиц некоторого товара, либо 100 единиц. Известно, что при продаже 800 единиц на рынке складывается цена равная 100 фунтам, при 500 единицах - 200 фунтов, а при объеме продаж 200 единиц - 500 фунтов. Матрицы выигрышей продавцов показаны в нижеследующих таблицах.