Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Бескоалиционные игры (110

..pdf
Скачиваний:
34
Добавлен:
15.11.2022
Размер:
270.72 Кб
Скачать

соответствующих элементов матрицы B. Имеем β21 = 2 < β23, β12 = 3 < β13, β33 = 0 < β32, и, следовательно, исходы (2, 1), (1, 2), (3, 3) не принадлежат множеству Z(Γ). Таким образом,

Z(Γ) = .

Определение 6. Стратегия xi Xi называется равновесной, если она входит хотя бы в одну ситуацию равновесия по Нэшу.

4.Оптимальность по Парето

В бескоалиционных играх существуют и другие принципы оптимальности, которые приводят к ситуациям, более выгодным обоим игрокам, чем в случае равновесных ситуаций. Таким принципом оптимальности является оптимальность по Парето.

Рассмотрим множество векторов {H(x)} = {(H1(x), . . . , Hn(x))}, где x

n

X, X = Xi, т. е. множество значений вектор-выигрышей игроков во всех

i=1

возможных ситуациях x X.

Определение 7. Ситуация x¯ в бескоалиционной игре Γ называется оптимальной по Парето, если не существует ситуации x X, для которой имеют место неравенства

Hi(x) Hix) для всех i N и

Hi0 (x) Hi0 x) хотя бы для одного i0 N.

Множество всех ситуаций, оптимальных по Парето, будем обозначать через XP .

Содержательно это определение означает, что при отклонении одного из игроков от оптимальной по Парето ситуации, он может в некоторых случаях 11

увеличить свой выигрыш. Однако при этом выигрыш одного (нескольких) игроков, придерживающихся выбранной стратегии, заметно уменьшится. В игре «семейный спор» оптимальными по Парето являются ситуации (I1, II1)

и (I2, II2).

Сформулируем правило для нахождения ситуаций, оптимальных по Парето, в биматричной игре Γ(A, B).

Правило 2. Ситуация ¯ ¯ будет оптимальной по Парето в бимат-

(i, j)

ричной игре Γ(A, B), если не существует такой ситуации (i, j) (i {1, . . . , m}, j {1, . . . , n}), для которой вектор выигрышей (αij, βij) иг-

роков 1 и 2 покомпонентно больше вектора выигрышей (α¯i, ¯j, β¯i, ¯j) игроков

1 и 2 для ситуации ¯ ¯ (i, j).

Рассмотрим пример использования правила 2 для нахождения оптимальной по Парето ситуации в биматричной игре Γ(A, B).

Задача 2. В биматричной игре Γ(A, B) с матрицами

A =

4 1 0

,

B =

0 5

6

2

7

5

7

0

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

0

1

 

 

2

6

1

найдём все ситуации, оптимальные по Парето.

Решение. Используя правило 2, просматриваем последовательно все исходы игры Γ(A, B) и сравниваем соответствующие им векторы выигрышей. В результате в множество XP игры Γ(A, B) не попадут исходы: (1, 1),

(1, 2), (1, 3), (2, 3), (3, 2), (3, 3), так как (α11, β11) = (4, 0) < (6, 2) =

(α31, β31), (α12, β12) = (1, 5) < (2, 7) = (α21, β21), (α13, β13) = (0, 6) < (2, 7) = (α21, β21), (α23, β23) = (5, 2) < (6, 2) = (α31, β31), (α32, β32) = (0, 6) < (2, 7) = (α21, β21), (α33, β33) = (1, 1) < (2, 7) = (α21, β21).

Окончательно, множество оптимальных по Парето исходов имеет вид XP =

{(2, 1), (2, 2), (3, 1)}.

12

Замечание 3. Если изобразить векторы выигрышей (αij, βij) в виде точек декартовой системы координат (H1, H2), где i {1, . . . , m}, j {1,

. . . , n}, H1, H2 - функции выигрышей первого и второго игроков соответственно, то в силу правила 2 можно утверждать, что в биматричной (m × n) - игре Γ(A, B) ситуация (i , j ) является оптимальной по Парето, если множество Li j = {(α, β)| (α αi j ) (β βi j )} не содержит ни одной точки множества всевозможных векторов выигрышей в игре Γ(A, B) кроме точки (αi j , βi j ).

Рассмотрим биматричную игру Γ(A, B) из задачи 2. Изобразим графически множество векторов выигрышей данной игры в системе координат (H1, H2).

Рис. 1: Пример графического поиска ситуаций, оптимальных по Парето.

Как видно из рисунка 1 ситуации, дающие векторы выигрышей (2, 7), (7, 0), (6, 2), являются оптимальными по Парето, то есть XP = {(2, 1), (2, 2), (3, 1)}. Действительно, множества L21, L22, L31 удовлетворяют условию оптимальности по Парето замечания 3, а, например, множество L33 содержит, кроме

(1, 1), точки (1, 5), (2, 7), (5, 2), (6, 2), (1, 5). Поэтому ситуация (3, 3) не яв13

ляется оптимальной по Парето. Аналогичные рассуждения можно провести и для остальных ситуаций, возникающих в игре Γ(A, B) из задачи 2.

14

5.Смешанное расширение бескоалиционной игры

Переходим к рассмотрению смешанного расширения бескоалиционной игры.

Как известно, в антагонистических играх ситуация равновесия по Нэшу в чистых стратегиях, вообще говоря, не существует. Даже матричные игры в

общем случае имеют ситуацию равновесия по Нэшу лишь в смешанных стра-

тегиях. Так, например, матричная игра Γ(A), где A = 1 0 - матрица

0 1

выигрышей (проигрышей) первого (второго) игрока, не имеет ситуации равновесия по Нэшу в множестве чистых стратегий, так как v = v (1 = 0), где v - верхнее значение игры Γ(A), v - нижнее значение игры Γ(A). Таким образом, равновесие по Нэшу в бескоалиционной игре следует искать в классе смешанных стратегий.

Пусть Γ = (N, {Xi}i N , {Hi}i N ) - произвольная конечная бескоалиционная игра, где N = {1, 2, . . . , n}, Xi = {x1i , x2i , . . . , xmi i }, i N.

Определение 8. Вектор μi = (μi(x1i ), μi(x2i ), . . . , μi(xmi i )) называется сме-

шанной стратегией игрока i, если μi(xki i ) 0 для всех ki = 1, . . . , mi и

mi μi(xki i ) = 1. ki=1

В определении 8 μi(xki i ) - вероятность, которую смешанная стратегия μi приписывает стратегии xki i . Множество всех смешанных стратегий игрока i будем

обозначать ¯ . Набор называется ситуацией в смешан-

Xi μ = (μ1, μ2, . . . , μn)

ных стратегиях. При этом вероятность появления ситуации x = (x1, . . . , xn) определяется формулой:

μ(x) = μ1(x1) × μ2(x2) × . . . × μn(xn).

15

Функция выигрыша i-го игрока в ситуации μ определяется формулой:

Ki(μ) = Hi(x) · μ(x) =

x X

=. . . Hi(x1, . . . , xn) × μ1(x1) × . . . × μn(xn),

x1 X1

xn Xn

 

 

 

 

 

где i N,

x = (x1,

. . . , xn) X.

 

(1)

Введём обозначение

 

 

 

 

 

Ki(μ xj) =

. . .

 

. . . Hi(x xj) · μk(xk).

(2)

x1 X1

xj−1 Xj−1 xj+1 Xj+1

xn Xn

k=j

 

Пусть μj - произвольная смешанная стратегия игрока j в игре Γ. Умножив

(2) на μj(xj) и просуммировав по всем xj Xj, получаем

Ki(μ xj) · μj(xj) = Ki(μ μj).

xj Xj

 

Определение 9. Игра

¯

¯

Γ = (N, {Xi}i N , {Ki}i N ) в которой N - множество

игроков, ¯ - множество смешанных стратегий игрока а функция выиг-

Xi i,

рыша определяется равенством (1), называется смешанным расширением игры Γ.

Рассмотрим смешанное расширение биматричной (m×n)-игры Γ(A, B). Множества смешанных стратегий X1, X2 первого и второго игроков принимают вид:

m

X1 = {x| x = (ξ1, ξ2, . . . , ξm) Rm; ξi 0, i = 1, m; ξi = 1},

i=1

n

X2 = {y| y = (η1, η2, . . . , ηn) Rn; ηj 0, j = 1, n; ηj = 1}.

j=1

Выигрыши игроков K1, K2 в ситуации (x, y) в смешанных стратегиях вычисляются по формулам:

K1(x, y) = x A y, K2(x, y) = x B y, x X1, y X2.

16

Таким образом, получено смешанное расширение Γ(A, B) = (X1, X2, K1, K2) биматричной игры Γ(A, B).

 

m

n

Замечание 4. Из вида функций K1(x, y) =

αij ξi ηj, K2(x, y) =

 

=1

j=1

 

i

m

n

 

βij ξi ηj следует, что множество векторов выигрышей (K1, K2) в

i=1 j=1

 

смешанных стратегиях содержится в выпуклой оболочке множества векторов выигрышей (αij, βij), где i = 1, . . . , m, j = 1, . . . , n, в чистых стратегиях.

В дальнейшем для биматричных (m×n)-игр будем считать, что M = X1, N = X2, X = X1, Y = X2. В биматричных играх наряду с понятием смешанных стратегий употребляется понятие чистых стратегий.

Определение 10. В смешанном расширении Γ(A, B) биматричной игры стратегия

 

 

i

 

. . . , 0), где i = 1, . . . , m

i = (0, . . . , 0,

1,

0,

¯

 

j

0, . . . , 0), где j = 1, . . . , n)

0,

1,

( j = (0, . . . ,

называется чистой стратегией игрока 1 (игрока 2).

Заметим, что все стратегии игроков 1, 2 в игре Γ(A, B) являются чистыми стратегиями этих игроков в смешанном расширении Γ(A, B). Аналогично вводится понятие чистой стратегии и для смешанного расширения конечной бескоалиционной игры n лиц, причём справедливо следующее замечание.

Замечание 5. В смешанном расширении конечной бескоалиционной игры n лиц множество смешанных стратегий

 

 

 

 

 

 

 

 

mi

 

 

 

 

 

 

 

 

 

 

i = i = (μi1, . . . , μimi )| μiki = 1, μiki 0, ki = 1, . . . , mi}

 

 

 

 

 

X

 

 

 

 

 

 

 

 

 

 

 

ki=1

 

 

 

 

 

 

является выпуклой оболочкой множества чистых стратегий X

i

=

{

x

ki

=

 

 

 

mi

 

 

 

 

 

 

 

 

 

 

ki

 

}

,

то есть

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(0, . . . , 1, . . . , 0)

 

 

 

 

 

 

 

Xi = Conv(Xi) =

17

mi

mi

= i| μi = μiki xki ,

μiki = 1, μiki 0, ki = 1, . . . , mi}.

ki=1

ki=1

При исследовании смешанного расширения биматричной (m × n)-игры оказывается полезным понятие спектра смешанной стратегии.

Определение 11. Для биматричной игры Γ(A, B) множество Mx = {i| ξi > 0} (Ny = {j| ηj > 0}) называется спектром смешанной стратегии x = (ξ1, ξ2, . . . , ξm) первого игрока (y = (η1, η2, . . . , ηn) второго игрока).

В бескоалиционной игре n лиц спектр смешанной стратегии μi игрока i будем обозначать через [Xi]μi .

Определение 12. Стратегия x (y), для которой Mx = M, где M = {1, 2,

. . . , m} (Ny = N, где N = {1, 2, . . . , n}) называется вполне смешанной стратегией игрока 1 (игрока 2).

Ситуация (x, y), в которой обе стратегии x и y вполне смешанные, называется вполне смешанной. Теперь сформулируем определение ситуации равновесия для бескоалиционной игры n лиц.

Определение 13. Ситуация μ называется ситуацией равновесия по Нэшу в смешанных стратегиях в игре Γ, если для любого игрока i и для любой его смешанной стратегии μi имеет место неравенство

Ki(μ μi) Ki(μ ), i = 1, . . . , n.

Рассмотрим условия существования ситуации равновесия по Нэшу в смешанных стратегиях в конечной бескоалиционной игре. Начнем со случая биматричной игры.

Лемма 2. Пусть Γ(A, B) - биматричная (m × n)-игра. Тогда существуют смешанные стратегии x X и y Y игроков 1 и 2 соответственно, такие, что пара (x , y ), является ситуацией равновесия по Нэшу.

18

Данная лемма 2 может быть обобщена на случай конечной бескоалиционной игры n лиц.

Теорема 1. Любая конечная бескоалиционная игра имеет хотя бы одну ситуацию равновесия по Нэшу в смешанных стратегиях.

Доказательство. Доказательство данной теоремы основано на известной теореме о неподвижной точке.

Теорема (о неподвижной точке). Пусть S - компактное выпуклое множество в Rn и ψ - многозначное отображение, переводящее точки S в компактные выпуклые подмножества S и удовлетворяющее условию: если xn S, xn → x, yn ψ(xn), yn → y, то y ψ(x).

Тогда существует такое x S, что x ψ(x ).

В силу замечания 5 имеем, что множества смешанных стратегий Xi, где i = 1, . . . , n, являются выпуклыми множествами в некоторых евклидовых пространствах. Следовательно, множество X = X1 × . . . × Xn является выпуклым множеством в декартовом произведении евклидовых пространств, которое также является евклидовым пространством. Теперь для точек μ = (μ1, . . . , μn) множества X, являющихся ситуациями в смешанных стратегиях игры Γ определим многозначное отображение f следующим образом

f

μ

) = {

μ

 

μ

, . . . , μ

K

 

μ

μ

max K

 

μ

μ

 

, i

 

, . . . , n

.

(

 

 

= (

1

n)|

 

i(

 

i) =

μi Xi

i(

 

 

i)

 

= 1

}

 

Из формулы 1 видно, что функции выигрышей Ki(μ) = Ki(μ1, . . . , μn) линейны по μi, где i = 1, . . . , n. Следовательно, каждая из функций Ki(μ), i = 1, . . . , n является выпуклой, а множество её максимумов выпукло и замкнуто. В результате имеем, что множества f(μ), для всех μ X являются компактными выпуклыми подмножествами X.

19

Рассмотрим теперь последовательность k} такую, что μk X, μk → μ0

k→∞

и последовательность k} такую, что ωk f(μk), ωk → ω0. Так как ωk

k→∞

f(μk), то для любой ситуации μ = (μ1, . . . , μn) X выполняется неравенство

Ki(ωk) Ki(μk μi), для всех i = 1, . . . , n.

Так как для i = 1, . . . , n функции Ki непрерывны (в силу линейности), то вышеупомянутое неравенство выполняется и для μ0, ω0. В результате имеем ω0 f(μ0). Таким образом, выполнены все условия теоремы о неподвижной точке и существует ситуация μ = (μ1, . . . , μn) X, такая, что μ f(μ ), то есть для любой μ X

K

 

μ

 

max K

 

μ

μ

 

,

для всех

i

 

, . . . , n

 

i(

 

) =

μi Xi

i(

 

 

i)

 

 

= 1

 

или

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ki(μ ) Ki(μ μi),

 

для всех i = 1, . . . , n.

Следовательно, по определению 13 ситуация μ X является ситуацией равновесия по Нэшу в смешанных стратегиях в игре Γ. Приведём свойства ситуаций равновесия, которые помогают находить решение конечной бескоалиционной игры n лиц.

Свойство 1. Для того чтобы ситуация μ = (μ1, . . . , μn) в смешанных стратегиях в игре Γ = (N, {Xi}i N , {Hi}i N ) была ситуацией равновесия по Нэшу, необходимо и достаточно, чтобы для всех чистых стратегий xi Xi игроков выполнялись следующие неравенства:

Ki(μ xi) Ki(μ ), i = 1, . . . , n.

Доказательство. Необходимость утверждения следует из того, что каждая чистая стратегия xi игрока i является частным случаем его смешанной стратегии μi, и в силу определения 13 выполнены неравенства

Ki(μ xi) Ki(μ ), для всех i = 1, . . . , n.

20