Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Полшков Ю.Н. Курс лекций по ОММ.doc
Скачиваний:
16
Добавлен:
29.04.2019
Размер:
4.79 Mб
Скачать

Приложение б. Теория игр и задачи линейного про- граммирования Лекция 16. Экономические риски и теория игр

1. Теоретико-игровая модель.

План.

2. Решение матричных игр с нулевой суммой.

3. Оптимальные смешанные стратегии и задачи линейного программирования.

4. Доминирующие стратегии и другие факты теории игр.

1. Изучение экономического риска базируются на разных концепциях. Одна из них – концепция теории игр и статистических решений.

Теория игр это раздел математики, в котором изучаются математиче- ские модели принятия решений в условиях неопределённости и конфликтности сторон. Основателями теории игр являются американские ученые Джон фон

Нейман (1903-1957) и Оскар Моргенштерн (1902-1977). Игра это модель конфликтной ситуации, имеющая определённые правила действий ее участни- ков, которые стараются победить путем выбора оптимальной стратегии поведе-

ния. Субъект принятия решения называется игроком, а целевая функция – пла-

тёжной функцией.

Первый игрок может выбрать одну из стратегий поведения i ( i = 1, m ),

второй игрок одну из своих стратегий j ( j = 1, n ). У игроков нет информа-

ции о том, как поведёт себя противоположная сторона. Они могут только пред-

полагать.

Оба игрока знают значение выигрыша

aij

при выборе первым стратегии

i , а вторым стратегии j . Платёжная матрица имеет вид:

a11

a12

...

a1n

A = a21

a22

...

a2 n .

... ... ... ...

am1

am 2

...

amn

Пример 1 (игра в «старые» и «новые» товары). Два производителя те- левизоров стараются вытеснить друг друга с рынка. Первый производит «ста- рые» товары – три модели с жидкокристаллическим экраном (ЖКЭ). Второй производит «новые» товары – две модели телевизоров с плазменным экраном (ПЭ).

При появлении 1-й модели ПЭ объём продаж 1-й модели ЖКЭ снизился до 40% (составил 0,4 от поступивших в продажу), для 2-й модели ЖКЭ – соста- вил 0,5 и т.д. (табл. 1).

Табл. 1. Объём продаж первого производителя

Второй игрок (ПЭ)

1-я модель

2-я модель

Первый игрок

(ЖКЭ)

1-я модель

0,4

0,8

2-я модель

0,5

0,9

3-я модель

0,7

0,8

Выигрыш первого игрока является проигрышем для второго. Платёжная

матрица первого игрока A+ , второго – A :

0, 4 0,8

A+ = 0, 5 0, 9 ,

0, 4

A = 0, 5

0,8

0, 9 .

0, 7 0,8

0, 7

0,8

Перед нами матричная игра двух лиц. Т.к.

+

aij

+ aij

= 0 , ( i = 1, m ,

j = 1, n ),

то это игра с нулевой суммой.

Достаточно рассматривать игру с точки зрения одного из игроков (на-

пример, первого). Поэтому в дальнейшем будем иметь дело с платёжной мат-

рицей:

0, 4 0,8

A = 0, 5 0, 9 .

0, 7 0,8

2. Оптимальной стратегией игрока называется стратегия, обеспечивающая игроку при многоразовом повторения игры максимально возможный средний выигрыш V , который называют ценой игры. Решить игру означает найти оптимальную стратегию для каждого игрока и цену игры. Это будет решение в чистых стратегиях.

Первый игрок, не зная, как поведёт себя второй, для каждой своей страте-

гии i определяет минимальный (т.е. гарантированный) выигрыш

Справа от платёжной матрицы записывают минимумы по строкам:

αi = min aij .

j

a11

a12

...

a1n α1

A = a21

a22

...

a2 n

α 2 .

... ... ... ...

...

am1

am 2

...

amn α m

Выберем среди чисел αi

максимальный элемент:

max αi = max min aij = α .

i i j

Число α называется нижней чистой ценой игры или максимином. Но-

мер строки

i0 , в которой находится α , определит номер предпочтительной

стратегии первого игрока.

Для каждой стратегии j второго игрока выбирают максимальные эле-

менты

цам:

β j = max aij . Под платёжной матрицей записывают максимумы по столб-

i

a11

a12

...

a1n α1

A = a21

a22

...

a2 n α 2

... ... ... ...

... .

am1

β1

am 2

β2

...

...

amn α m

βn

Среди чисел β j

выбирают минимальный элемент:

min β j = min max aij = β .

j j i

Число β называется верхней чистой ценой игры или минимаксом. Но-

мер столбца

j0 , в котором находится β , определит номер предпочтительной

стратегии второго игрока.

Теорема 1 (о максимине и минимаксе). Для любой матричной игры двух лиц с нулевой суммой и ценой игры V имеет место неравенство:

α V β .

Если же в игре с матрицей A нижняя и верхняя чистые цены игры совпадают,

то игра имеет седловую точку в чистых стратегиях и чистую цену игры V * :

V * = α = β .

Из формулировки теоремы следует, что седловая точка определяет пару

чистых оптимальных стратегий

(i0 , j0 )

первого и второго игроков, соответст-

венно. Седловой элемент

a является минимальным в

i j

0 0

i0 -й строке и макси-

мальным в

j0 столбце. Игра решена полностью, если в матрице A имеется

седловая точка.

Решение примера 1 методом максимина и минимакса. Справа от мат-

рицы A запишем элементы минимальные по строкам, выберем среди них мак-

симальный и выделим его уголком. Получим, что α = 0, 7 .

Под матрицей A запишем элементы максимальные по столбцам, выберем

из них минимальный и выделим его уголком. Имеем

β = 0, 7 .

Т.к. α = β , то игра имеет седловую точку. Седловой элемент

деляем квадратом:

a31 = 0, 7

вы-

0, 4 0,8

0, 4

A =

0, 5 0, 9

0, 5

0, 7 0,8

0, 7 0, 9

.

0, 7

Ответ: чистой оптимальной стратегией для первого игрока будет 3-я

стратегия, для второго – 1-я, чистая цена игры составит V * = 0, 7 .

3. Отметим, что далеко не все платёжные матрицы имеют седловые точки. Сле-

довательно, не каждая матричная игра имеет оптимальные чистые стратегии.

Пример 2 (планирование структуры посевных площадей). Пусть аг-

рарное предприятие (первый игрок) может посеять одну из двух сельскохозяй-

ственных культур ( i = 1, 2 ). Состояние экономической среды (стратегии второго

игрока) определяется погодными условиями: 1) год засушливый; 2) год нор-

мальный; 3) год дождливый ( j = 1, 2, 3 ). Информация о выигрышах первого иг-

рока помещена в табл. 2.

Табл. 2. Доход от реализации (млн. грн.)

Второй игрок (погода)

Сухая

погода

Нормальная

погода

Дождливая

погода

Первый игрок (аграрное пред- приятие)

1-я культура

1

3

4

2-я культура

4

3

2

Платёжная матрица имеет вид:

1 3 4

A = .

4 3 2

Для определения чистых стратегий игроков применим метод максимина и

минимакса:

1 3 4 1

A =

4 3 2 2 .

4 3 4

Нижняя чистая цена игры

α = 2 . Верхняя чистая цена игры

β = 3 . Числа

α и β не совпадают. Седловой точки нет. Следовательно, чистые оптимальные

стратегии для игроков не существуют. Чистую цену игры V *

возможно.

определить не-

Вернёмся к рассмотрению общих вопросов. Как поступать, если платёж-

ная матрица

a11

a12

...

a1n

A = a21

a22

...

a2 n

... ... ... ...

am1

am 2

...

amn

не содержит седловой точки и чистых оптимальных стратегий нет?

В этом случае применяют не чистые, а смешанные стратегии. Т.е. первый игрок применяет свои m стратегий с определёнными вероятностями. Вектор вероятностей X неизвестен:

X = ( x1; x2 ;...; xm ) ,

x1 + x2 + ... + xm = 1 .

Аналогично, для второго игрока неизвестен вектор вероятностей Y , с ко-

торыми он принимает свои стратегии:

Y = ( y1; y2 ;...; yn ) ,

y1 + y2 + ... + yn = 1 .

Векторы X и Y называются смешанными стратегиями первого и вто- рого игроков, соответственно. Координаты этих векторов (вероятности) опре- деляют на основе статистических данных, т.е. эмпирическим путём. Поэтому данный раздел математики называют теорией игр и статистических решений.

Теорема 2 (основная теорема матричных игр фон Неймана). Любая матричная игра двух лиц с нулевой суммой имеет решение в виде смешанных

стратегий.

Для того чтобы найти оптимальные смешанные стратегии X и Y , а также определить неизвестную цену игры V , используют следующую теорему.

Теорема 3 (о свойствах оптимальных смешанных стратегий). Пусть задана игра с известной платёжной матрицей A и неизвестной ценой V . Для

того чтобы вектор

X = ( x1; x2 ;...; xm )

был оптимальной смешанной стратегией

первого игрока, необходимо и достаточно выполнение условий:

x1 + x2 + ... + xm = 1 , (1)

a12 x1 22 2 m 2 m

a11 x1 + a21 x2 + ... + am1 xm V ,

+ a x + ... + a x V ,

........................................

a1n x1 + a2 n x2 + ... + amn xm V ,

(2)

xi 0

( i = 1, m ). (3)

Аналогично для второго игрока: чтобы вектор

Y = ( y1; y2 ;...; yn )

был опти-

мальной смешанной стратегией второго игрока, необходимо и достаточно вы-

полнение условий:

y1 + y2 + ... + yn = 1 , (4)

a21 y1 22 2 2 n n

a11 y1 + a12 y2 + ... + a1n yn V ,

+ a y + ... + a y V ,

........................................

am1 y1 + am 2 y2 + ... + amn yn V ,

(5)

y j 0

( j = 1, n ). (6)

Рассмотрим применение теоремы 3 при условии, что все элементы пла-

тёжной матрицы A положительные. Тогда

V > 0

и на это число можно разде-

лить левые и правые части условий задачи (1)-(3):

x1 + x2

+ ... + xm

= 1 , (7)

V V V V

a x1 + a

x2

+ ... + a

xm

1,

11 V

21 V

m1 V

a x1 + a

x2

+ ... + a

xm

1,

12 V

22 V

m 2 V

(8)

........................................

a x1 + a

x2 + ... + a

xm

1,

1n V

2 n V

mn V

xi 0 ( i = 1, m ). (9)

V

Введём замену переменных:

t = x1 , t

= x2 ,..., t

= xm , Z =

1 . Т.к. первый

1 V 2 V

m V V

игрок стремится максимизировать цену игры, то

V max , а значит

Z min .

Задача (7)-(9) примет вид задачи линейного программирования (ЛП):

Z = t1 + t2 + ... + tm min , (10)

a12t1 22 2 m 2 m

a11t1 + a21t2 + ... + am1tm 1,

+ a t + ... + a t 1,

........................................

a1nt1 + a2 nt2 + ... + amntm 1,

(11)

ti 0

( i = 1, m ). (12)

Аналогично для второго игрока. Сделаем замену переменных в задаче (4)-

(6): w

= y1 , w

= y2 ,..., w

= yn , F =

1 . Будет получена вторая задача ЛП:

1 V 2 V

n V V

F = w1 + w2 + ... + wn max , (13)

a21w1 22 2 2 n n

a11w1 + a12 w2 + ... + a1n wn 1,

+ a w + ... + a w 1,

........................................

am1w1 + am 2 w2 + ... + amn wn 1,

(14)

w j 0

( j = 1, n ). (15)

Заметим, что задачи (10)-(12) и (13)-(15) являются двойственными отно- сительно друг друга. Для их решения можно применять симплекс-метод, метод искусственного базиса и в задачах малой размерности – графический метод.

Решение примера 2. Ранее мы доказали, что платёжная матрица

1 3 4

A =

4 3 2

не имеет седловой точки и чистых оптимальных стратегий для этой задачи не

существует.

Согласно теореме 2 применим смешанные стратегии. Вектор вероятно-

стей X первого игрока неизвестен:

X = ( x1; x2 ) ,

x1 + x2 = 1 .

Аналогично, для второго игрока неизвестен вектор вероятностей Y , с ко-

торыми он принимает свои стратегии:

Y = ( y1; y2 ; y3 ) ,

y1 + y2 + y3 = 1.

Применим теорему 3. Цена игры V является неизвестной. Для того чтобы

вектор

X = ( x1; x2 )

был оптимальной смешанной стратегией первого игрока, не-

обходимо и достаточно выполнение условий:

x1 + x2 = 1 , (16)

x1 + 4 x2 V ,

3x1 + 3x2 V ,

4x1 + 2x2 V ,

(17)

xi 0

( i = 1, 2 ). (18)

Аналогично для второго игрока: чтобы вектор

Y = ( y1; y2 ; y3 )

был опти-

мальной смешанной стратегией второго игрока, необходимо и достаточно вы-

полнение условий:

y1 + y2 + y3 = 1, (19)

y1 + 3 y2 + 4 y3 V ,

4 y1 + 3 y2 + 2 y3 V ,

(20)

y j 0

( j = 1, 3 ). (21)

Введём замену переменных: t

= x1 , t

= x2 , Z =

1 . Задача (16)-(18) примет

вид задачи ЛП:

1 V 2 V V

Z = t1 + t2 min , (22)

t1 + 4t2 1,

3t1 + 3t2 1,

4t1 + 2t2 1,

(23)

ti 0

( i = 1, 2 ). (24)

Аналогично для второго игрока. Сделаем замену переменных в задаче

(19)-(21): w

= y1 , w

= y2 , w

= y3 , F =

1 . Будет получена вторая задача ЛП:

1 V 2 V

3 V V

F = w1 + w2 + w3 max , (25)

w1 + 3w2 + 4w3 1,

4w1 + 3w2 + 2w3 1,

(26)

w j 0

( j = 1, 3 ). (27)

Т.к. задача (22)-(24) содержит две переменных, то ёё удобно решить гра-

фически (студентам проделать самостоятельно). Оптимальный план единствен-

ный: T * =

2 ; = 3 , Z = 5 .

14 14

min 14

Задачу (25)-(27) можно решить симплекс-методом (студентам проделать самостоятельно). Однако удобнее воспользоваться первой и второй теорема- ми двойственности.

Т.к.

Zmin = Fmax , то

w + w + w = 5 . Оптимальные значения

1 2 3 14

t * = 2 и

1 14

3

t2 * = 14

строго больше нуля, поэтому 1-е и 2-е ограничения в системе (26) бу-

дут строгими равенствами. В итоге, для решения задачи (25)-(27) достаточно

решить систему уравнений (студентам проделать самостоятельно):

w + w

+ w = 5 ,

1 2 3 14

w1 + 3w2 + 4w3 = 1,

4w + 3w + 2w = 1.

1 2 3

Однако, лучше всего, дополнительно учесть тот факт, что при

t * = 2 и

1 14

3

t2 * = 14

в системе (23) 1-е и 3-е ограничения обратятся в строгие равенства, а 2-

е – в неравенство. Следовательно,

приобретёт вид:

w1* > 0

и w3 * > 0 , а

w2 * = 0 . Т.о. система (26)

w1 + 4w3 = 1,

4w1 + 2w3 = 1.

Решая систему, придём к оптимальному плану:

W * =

2 ; 0; = 3 ,

F = 5 . Т.е. задачи ЛП (22)-(24) и (25)-(27) решены полностью.

max 14

1

14 14

Выполним обратную замену

y1 = w1V , y2 = w2V , y3 = w3V .

V = , x1 = t1V , x2 = t2V и

Z

Ответ: оптимальной смешанной стратегией для первого игрока будет

X * = (0, 4; 0, 6) , для второго

V * = 2,8 .

Y * = (0, 4; 0; 0, 6) , чистая цена игры составит

Значит, аграрному предприятию следует под 1-ю сельскохозяйственную культуру отвести 40% земли, под 2-ю – 60%. При этом гарантированный доход от реализации продукции составит 2,8 млн. грн.

4. Рассмотрим несколько полезных фактов из теории игр.

Пусть для i -й и k -й стратегий первого игрока выполняются соотношения

aij akj

( j = 1, n ),

причём хотя бы одно из них является строгим неравенством. Т.е. элементы i -й строки больше либо равны элементов k -й строки. Тогда говорят, что стратегия i превосходит или доминирует стратегию k . Т.к. первый игрок заинтересован в увеличении своего выигрыша, то его доминирующая стратегия i предпоч- тительнее стратегии k .

Пусть теперь для j -й и r -й стратегий второго игрока выполняются соот-

ношения

aij air

( i = 1, m ),

причём хотя бы одно из них является строгим неравенством. Т.е. элементы j - го столбца больше либо равны элементов r -го столбца. Значит у второго игро- ка стратегия j доминирует стратегию r . Т.к. второй игрок заинтересован в

уменьшении выигрыша первого игрока, то его r -я стратегия предпочтительнее

j -й стратегии.

Замечание 1. Наличие доминирующих стратегий позволяют снизить раз- мерность матрицы игры A и, тем самым, уменьшить объём вычислений при нахождении смешанных стратегий.

Пример 3. Игра двух лиц с нулевой суммой задана матрицей:

4 3 5 1

4 5 3 5

A = .

5 3 5 3

1 5 4 8

Для определения чистых стратегий игроков применим метод максимина и

минимакса:

4 3 5 1 1

4 5 3 5 3

A =

5 3 5 3 3 .

1 5 4 8 1

5 5 5 8

Нижняя чистая цена игры

α = 3 . Верхняя чистая цена игры

β = 5 . Числа

α и β не совпадают. Седловой точки нет. Следовательно, чистые оптимальные

стратегии для игроков не существуют. Чистую цену игры V *

возможно.

определить не-

Предположим, что неизвестная цена игры равна V , и будем искать реше- ние игры в смешанных стратегиях. Пусть для первого игрока – это неизвестный вектор вероятностей X :

X = ( x1; x2 ; x3 ; x4 ) ,

x1 + x2 + x3 + x4 = 1 .

Аналогично, для второго игрока:

Y = ( y1; y2 ; y3 ; y4 ) ,

y1 + y2 + y3 + y4 = 1.

Проверим матрицу A на наличие доминирующих стратегий. Сравнивая выигрыши построчно, видим, что у первого игрока 3-я стратегия доминирует 1- ю. Следовательно, для первого игрока 3-я стратегия предпочтительнее 1-й.

В теории игр доказано, что можно в матрице A вычеркнуть 1-ю строку,

положив

x1 = 0 . Будет получена матрица игры:

4 5 3 5

A1 = 5 3 5 3 .

1 5 4 8

У новой матрицы

V .

A1 цена игры будет такой же, как и у матрицы A , т.е. равна

По элементам матрицы

A1 видно, что у второго игрока 4-я стратегия до-

минирует 2-ю. Т.о. 2-я стратегия второго игрока предпочтительнее его 4-й стра-

тегии. Следовательно, в матрице

y4 = 0 :

A1 можно вычеркнуть 4-й столбец, положив

4 5 3

A2 = 5 3 5 .

1 5 4

Цена игры останется прежней, т.е. V .

В матрице

A2 доминирующих стратегий нет. Т.о. исходную игру с мат-

рицей A размерности 4 × 4

3 × 3 .

удалось свести к игре с матрицей

A2 размерности

На данный момент смешанные стратегии игроков для исходной задачи имеют вид:

X = (0; x2 ; x3 ; x4 ) ,

Y = ( y1; y2 ; y3 ; 0) .

Далее, используя матрицу

A2 , применяем теорему 3. Составляем двойственные

задачи ЛП (10)-(12) и (13)-(15). Находим оптимальные значения вероятностей

x2 *, x3*, x4 * и стоятельно).

y1*, y2 *, y3 * , а также цену игры V *

(студентам проделать само-

Теорема 4. Пусть задана игра двух лиц с матрицей

VA . Тогда другая игра с матрицей

A = (aij )

и ценой игры

B = (bij ) = (c aij + d ) ,

c > 0 ,

будет иметь оптимальные смешанные стратегии игроков такие же, как и для

игры с матрицей ношением:

A = (aij ) . Причём цена игры VB

VB = c VA + d .

связана с ценой игры VA

соот-

Замечание 2. Пользуясь теоремой 4, можно упрощать элементы исходной матрицы A для облегчения вычислений.

Пример 4. Рассмотрим игру с матрицей

300 400

A = .

700 200

Для определения чистых стратегий игроков применим метод максимина и

минимакса:

A = 300 400

700 200

700 400

300

200 .

Нижняя чистая цена игры

α = 300 . Верхняя чистая цена игры

β = 400 .

Числа α и β не совпадают. Седловой точки нет. Следовательно, чистые опти-

мальные стратегии для игроков не существуют. Чистую цену игры определить

невозможно. Доминирующих стратегий нет.

Воспользуемся теоремой 4. Каждый элемент матрицы A разделим на 100

и вычтем 2. Будет получена матрица

B = (bij ) = (0, 01 aij 2) , т.е.

1 2

B = .

5 0

Смешанные стратегии игроков для матриц A и B совпадают. Обозначим

векторы неизвестных вероятностей через

связаны равенством:

X = ( x1; x2 )

и Y = ( y1; y2 ) . Цены игр

VB = 0, 01VA 2 .

Далее, используя матрицу B , применяем теорему 3. Составляем двойст-

венные задачи ЛП (10)-(12) и (13)-(15). Находим оптимальные значения веро-

ятностей и цену игры VB * (студентам проделать самостоятельно).

Окончательно получим:

V * = VB * +2 = 100 (V

* +2) .

A 0, 01 B

Завершая данную лекцию, отметим, что игровые методы активно исполь- зуются при изучении экономических рисков. Для нахождения статистических решений применяются критерии Байеса, Бернулли, Лапласа, Вальда, Сэвиджа, Гурвица и др.