Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Исследование операций / ИСО Учебник

.pdf
Скачиваний:
108
Добавлен:
01.06.2015
Размер:
3.67 Mб
Скачать

Проиллюстрируем этот подход на игре (2 х n) (табл. 4.3.4). Предполагаем, что игра не имеет седловой точки в чистых стратегиях.

 

 

 

 

 

Таблица 4.3.4

Смешан-

 

Смешанные стратегии 2-го игрока

 

ные стратегии 1-

 

 

 

 

 

Р12

Р22

 

Рn2

го игрока

 

 

 

 

 

Р11

П11

П12

 

П1n

Р21 = 1- х1

П21

П22

 

П2n

Введем обозначения: Р11 – вероятность применения первым игроком 1-ой стратегии, Р21 – вероятность применения первым игроком 2-ой стратегии, причем Р21 = 1 - Р11; Р12 – вероятность применения вторым игроком 1-й стратегии, Р22 - вероятность применения вторым игроком 2-й стратегии и т.д., Рn2 – вероятность применения вторым игроком n-й стратегии.

Ожидаемый выигрыш первого игрока при применении вторым игроком 1-й стратегии составит:

П11 Р11 + П21 Р21 = П11 Р11 + П21(1 – Р11) = П11 Р11 + П21 – П21 Р11 = (П11 – П21) Р11 + П21.

Аналогично найдем ожидаемые выигрыши игрока 1 при применении вторым игроком 2-й, 3-й, …, n-й стратегии. Полученные данные поместим в табл. 4.3.5.

 

Таблица 4.3.5

Чистые стратегии второго игрока

Ожидаемые выигрыши первого игрока

 

 

1

11 – П21) Р11 + П21

2

12 – П22) Р11 + П22

 

 

n

1n – П2n) Р11 + П2n

Из табл. 4.3.5 видно, что ожидаемый выигрыш первого игрока линейно зависит от Р11.Построим прямые ожидаемых выигрышей игрока 1 (рис. 4.3.6).

Первый игрок должен выбирать такие стратегии, которые позволят ему максимизировать свой минимальный ожидаемый выигрыш. Поэтому оптимальная стратегия первого игрока определяется как точка пересечения пря-

35

мых, в которой достигается максимум его минимального ожидаемого выигрыша.

Пересечение прямых, соответствующих цене игры V, соответствует паре стратегий игрока 2.

П2n

 

 

 

 

П22

 

П11

П21

 

 

 

 

 

П12

 

 

 

0

1

 

 

 

 

П1n

Рис. 4.3.6. Графическое решение игры для игрока 1.

36

Тема 4.4 Игры двух лиц с ненулевой суммой. Матричные и биматричные игры

Лекция 4.4.1 Бескоалиционные неантагонистические игры

Простейшим примером матричных игр с ненулевой суммой являются игры с постоянной суммой, в которой для двух игроков

П1ij + Пij2 = a , где а – константа.

(4.4.1)

Также как и в играх с нулевой суммой две платежные матрицы игроков можно заменить одной матрицей.

Любую игру с постоянной суммой можно представить в виде некоторой матричной игры, поскольку прибавление какой-либо постоянной величины в каждой записи в матрице не влияет на результат. Если пары ( П1ij , a

П1ij ) представляют собой элементы платежной матрицы, то, вычитая

а

из ка-

2

 

 

 

 

 

 

 

 

 

 

ждого числа, входящего в эту пару, получаем

 

 

 

 

 

 

 

1 2

1

a

2

a

 

 

 

 

(Пij, Пij )=

Пij

 

 

, - Пij

 

 

,

(4.3.2)

2

 

2

 

 

 

 

 

 

 

 

 

где

П1ij = −Пij2 .

 

 

 

 

 

 

 

 

Другой тип игр – игры с непостоянной ненулевой суммой.

Виграх двух лиц с непостоянной ненулевой суммой есть одна существенная отличительная особенность: то, что хорошо для одного игрока, не обязательно плохо для другого. Следовательно, интересы игроков не являются полностью противоположными, и они могут извлечь выгод из сообщения своей стратегии. Будем различать два варианта таких игр: а) некооперативные (бескоалиционные игры, когда запрещены любые соглашения, обмен информацией, побочные платежи и совместный выбор стратегий, и б) кооперативные игры, в которых разрешается любой вид кооперации.

Рассмотрим бескоалиционные (некооперативные) матричные игры.

Внекооперативных играх даны две функции выигрыша П1 и П2, определенные для всех пар стратегий (S1, S2) и соответствующие выигрышам иг-

37

роков 1 и 2. Если множества стратегий конечные, то П1 и П2 можно представить в виде матриц П1 = (П1ij ) и П2 = (Пij2 ). Игра в такой форме называется би-

матричной игрой.

Вбольшинстве исследований по биматричным играм основное внимание уделяется вопросу существования равновесных пар стратегий в таких играх. В общем случае равновесных пар чистых стратегий может и не существовать. Однако доказано, что в любой биматричной игре существует по крайней мере одна равновесная пара смешанных стратегий.

Влитературе существование равновесных пар стратегий (точки равновесия) называют точками равновесия «по Нэшу»3.

Для того чтобы дать точное определение понятию точки равновесия, использующую понятие смешанной стратегии, предположим, что игрок 1 выбирает стратегию S1i , а игрок 2 – стратегию S2j , то, как и в табл. 4.1.2(3),

выигрыш первого игрока равен П1ij , а выигрыш второго – Пij2 . Если вероятность того, что игрок 1 выберет i-ю чистую стратегию S1i , равна р1i (i = 1, 2, …, m), то смешанная стратегия первого игрока выражается вектором

P1 =(

р11, р12 ,..., р1m ), где p1i 0.

(4.4.3)

Аналогично, если р2j

– вероятность выбора j-й чистой стратегии S2j иг-

роком 2 (j = 1, 2, …, n), то смешанная стратегия второго игрока выражается вектором

P2 = (р12 , р22 , ..., рn2 ), где 1р2 = 1, р2 ≥ 0.

(4.4.4)

Точкой равновесия является пара векторов р1*, р2*, определяющих оптимальные смешанные стратегии каждого из игроков, т.е. стратегии, приводящие данного игрока к максимальному ожидаемому выигрышу при усло-

3 Определение точек равновесия отнюдь не является единственным возможным способом решения некооперативных игр. Другие методы решения: принцип максимина (максимизация своих минимальных выигрышей); принцип максимакса (максимизация своих максимальных выигрышей); принцип максимальной суммы (максимизация суммы выигрышей); принцип максимальной разности (максимизация разности выигрышей) (рассмотрены в лекции 4.2.1).

38

вии, что противник применяет свою (оптимальную) смешанную стратегию. Следовательно,

Р1П1р2* ≤ р1*П1р2* для всех р1,

(4.4.5)

Р1*П2р2 ≤ р1*П2р2* для всех р2.

 

Вкаждой конечной игре двух лиц существует пара векторов смешанных стратегий, приводящих к точке равновесия. Такая пара векторов может быть не единственной, и может оказаться, что различным парам соответствуют различные значения (ожидаемого выигрыша). Вообще говоря, в каждой игре k лиц с конечным числом стратегии существуют смешанные стратегии, приводящие к равновесию. Равновесие – это набор таких смешанных стратегий, которые невыгодно самостоятельно изменять ни одному из игроков.

К сожалению, для игр с ненулевой суммой равновесные игры не полностью удовлетворяют понятию «решение игры».

Рассмотрим примеры ситуаций, которые могут продемонстрировать соответствующие трудности.

Впервой ситуации описывается деятельность двух фирм.

Фирма С1 может выпускать два сорта кофе: дешевый и дорогой. Вторая фирма С2 может выпускать два типа кофейников: дорогие и дешевые. Дорогой кофе можно сварить в любом кофейнике, а дешевый кофе можно приготовить только в дорогом кофейнике.

Если одна фирма производит дорогой продукт, а другая – дешевый, то существуют соизмеримые объемы продажных товаров, при которых фирма, выпускающая дорогой продукт, получит большую прибыль, а другая фирма будет иметь некоторую разумную прибыль. Если же обе фирмы начнут выпускать дорогую продукцию, то объемы продажных товаров будут малы и ни одна из фирм не получит никакой прибыли. Если же обе фирмы произведут дешевую продукцию, то они ничего не продадут и не получат прибыли.

Данную игру можно представить с помощью двух платежных матриц:

39

 

Стратегии фирмы

 

СтратегиифирмыС2

 

 

 

 

 

С1

 

 

 

П1 =

 

S12

S22

 

 

 

 

S11

7

0

 

 

 

 

 

 

 

S21

0

3

 

 

 

 

 

 

 

 

 

 

 

Стратегии фирмы

 

СтратегиифирмыС2

 

 

 

 

 

С1

 

 

 

П2 =

 

S12

S22

 

 

 

 

S11

 

3

0

 

 

 

 

 

 

 

 

S21

 

0

7

 

 

 

 

 

Легко видеть что при данной игре равновесными будут пары (S11, S12) и (S21, S22). Тем не менее пары (S11, S22) и (S21, S12) не равновесны, и, более того, выигрыши в равновесных точках различны. Таким образом, предварительное соглашение было бы выгодно в данной игре, но оно запрещено правилами.

Пример второй ситуации известен в литературе как «Дилемма заключенного».

Два преступника ожидают приговора суда за совершенное злодеяние. Адвокат конфиденциально предлагает каждому из преступников облегчить его участь (и даже освободить!), если он сознается и даст показания против сообщника. Если никто не сознается, то обоим угрожает заключение на определенный срок по сфабрикованному обвинению в незначительном преступлении. Каждый заключенный имеет на выбор две стратегии: не сознаваться (S11 и S12) или сознаваться (S21 S22), выдав при этом сообщника. Если разумно назначить полезность, то можно получить следующие платежные матрицы:

 

Стратегии заклю-

стратегиизаключенного 2

 

 

 

 

 

ченного 1

 

 

 

П1 =

S12

S22

 

 

 

 

S11

5

 

0

 

 

 

 

 

 

 

 

S21

10

 

1

 

 

 

 

 

 

 

 

 

 

Стратегии

стратегиизаключенного 2

 

 

 

 

 

заключенного 1

 

 

 

П2 =

S12

 

S22

 

 

 

 

S11

5

 

10

 

 

 

 

 

 

 

 

S21

0

 

1

 

 

 

 

 

Легко видеть, что (S21 S22) – единственная равновесная пара стратегий. Однако, если оба игрока сыграют не правильно, то их неравновесные стратегии (S11, S22) дадут им больший выигрыш.

41

Тема 4.5. Игры с непостоянной суммой. Кооперативные игры.

Лекция 4.5.1 Кооперативные игры без перевода и платежей.

Кооперативной игрой называется игра с непостоянной суммой, в которой игрокам разрешается обсуждать перед игрой свои стратегии и договариваться о совместных действиях; иначе говоря, игроки могут образовывать коалиции. Основная задача в кооперативной игре состоит в дележе общего выигрыша между членами коалиции. Следует различать кооперативные игры с побочными платежами, в которых платежи являются переводимыми, и игры без побочных платежей, в которых платежи непереводимы.

Предполагается, что в кооперативной игре без перевода платежей игроками игре достигают некоторого соглашения о согласовании использования своих стратегий. При этом игроки стремятся вступить в сговор с целью получить возможность использовать свои эффективные стратегии, тем самым получить больший выигрыш от их использования. В случае, если не удалось им скоординировать свои действия, то каждый игрок получит некоторый фиксированный платеж Т, называемый платеж при угрозе. Так при индивидуальном участии в игре платеж при угрозе может быть оценен как максиминный.

Т1 =max min П1i j ,

(4.5.1)

i j

 

где Т1 – платеж при угрозе игрока 1 при известной платежной матрице

{Пij1}.

Принципы решения кооперативной игры без перевода платежей сформулированы Дж. Нэшем.

На примере случая создания коалиции из 2-х игроков, где каждый игрок максимизирует свой выигрыш, (рис. 4.5.1) они включают:

1)Множество общих выигрышей игроков П1 и П2 является выпуклым, замкнутым и ограниченным сверху.

2)Игрокам известны значения платежей при угрозе Т1 и Т2..

3)Необходимость создания коалиции осознается игроками только на верхней границе допустимо множество и только на множестве Парето оптимальных решений, это множество на котором увеличение выигрыша одного из игроков возможно только за счет изменения выигрыша партнера. Иными словами, игроки не находясь не на верхней границе допустимого множества

42

(рис.4.5.1), где игроки могут улучшать свое положение индивидуально создавать коалиции не будут. Коалиция может быть образована только при выходе на верхнюю границу (рис. 4.5.1). Переговорное множество о создании коалиции есть платежи из множества Парето оптимальных решений суженных значениями платежей при угрозе Т1 и Т2.

4)Игра симметрична, т.е. решение не зависит от того, какие номера присвоены игрокам.

5)Игра инвариантна относительно монотонно линейных преобразований платежей.

6)Решение игры не зависит от заведомо не эффективных стратегий, т.е. решение не изменится если исключить их из рассмотрения.

7)Если условия 1) – 6) выполнить, то единственным равновесным ре-

шением по Нэшу является пара платежей (П1* 2* ), которые максимизируют произведение превышения этих платежей над платежами при угрозе

П1П2

(

П1

Т1

)(

П2

Т2

)

(4.5.2)

max

 

 

 

Графическое решения дано на рис. 4.5.1

43

Заштрихованная часть плоскости соответствует множеств возможных платежей; это множество выпукло, так как игроки могут применять смешанные стратегии. Прямой линией на границе множества отмечена «передовая линия» платежей, т.е. множество всех пар платежей, которые удовлетворяют допущению оптимальности по Парето. Точкой угрозы является точка Т, а решением Нэша является точка S, в которой передовая линия платежей достигает линии наибольшего уровня. Линии уровня в данном случае – это равносторонние гиперболы с центром в Т. Решение является единственным, т.е. множеству всех точек на передовой линии платежей, в которых выигрыши игроков больше, чем в точке угрозы.

В общем случае кооперативные игры получаются в тех ситуациях, когда, в игре n игроков разрешается образовывать определенные коалиции. Обозначим через N множество всех игроков, N= {1,2,…, n}, а через К – любое его подмножество. Пусть игроки из К договариваются между собой о совместных действиях и, таким образом, образуют одну коалицию. Очевидно, что число таких коалиций, состоящих из r игроков, равно числу сочетаний из n по к, то есть Cnr ? А число всевозможных коалиций равно

n

 

Сnr =2n 1

(4.5.3)

r=

Из этой формулы видно, что всевозможных коалиций значительно растет в зависимости от числа всех игроков в данной игре. Для исследования этих игр необходимо учитывать все возможные коалиции, и поэтому трудности исследований возрастают с ростом n. Образовав коалицию, множество игроков К действуют как один игрок против остальных игроков, и выигрыш этой коалиции зависит от применяемых стратегий каждым из n игроков.

Функция υ , ставящая в соответствие каждой коалиции К наибольший, уверенно получаемый его выигрыш υ (К), называется характеристической функцией игры. Так, например, для бескоалиционной игры n игроков υ (К) может получиться, когда игроки из множества К оптимально действуют как один игрок против остальных N К игроков, образующих другую коалицию

(второй игрок).

44

Соседние файлы в папке Исследование операций