Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
УМК ИОЭ Политех.doc
Скачиваний:
78
Добавлен:
22.08.2019
Размер:
3.84 Mб
Скачать

Тема 4. Теория игр

1. Основные понятия теории игр

2. Принцип минимакса и максимина в теории игр

3. Решение матричных игр без седловых точек

4. Упрощение игр

1. Основные понятия теории игр

В экономической деятельности часто встречается проблема принятия управленческих решений в условиях неопределенности. При этом неопределенность может быть связана как с созна­тельными действиями конкурента, противника и т.п., так и с другими факторами, влияющими на эффективность решения. Ситуации, в которых эффективность принимаемого одной стороной решения зависит от действий другой стороны, на­зываются конфликтными.

В отличие от рассмотренных выше задач принятия решений в условиях определенности, риска и неопределенности, в которых внешняя среда (природа) предполагалась пассивной, в конфликт­ных ситуациях имеются противодействующие стороны, интересы которых противоположны. Теория, занимающаяся приняти­ем решений в условиях конфликтных ситуаций, называется теори­ей игр.

Игра - это математическая модель конфликтной ситуации, в которой имеется, по крайней мере, два учас­тника (игрока), каждый из которых стремится к достижению собственных целей. Задача теории игр состоит в выборе такой линии поведения данного игрока, отклонение от которой может лишь уменьшить его выигрыш.

Допустимые действия каждого из игроков, направленные на достижение некоторой цели, называются правилами игры. В общем случае правилами игры устанавливаются последовательность хо­дов, объем информации, которой располагает каждая сторона, о поведении другой стороны и результат (исход) игры. Правила определяют также конец игры, когда некоторая возможная последовательность выборов уже сделана и больше ходов делать не разрешается.

Количественная оценка результатов игры называется платежом.

Игра называется парной, если в ней участвуют только две стороны (два лица), либо множествен­ной – при наличии более двух сторон. Участники множественной игры могут образовывать коали­ции (игры в этом случае называются коалиционными). Множественная игра обращается в парную, если ее участники образуют две постоянные коалиции.

Парная игра называется игрой с нулевой суммой, если сумма платежей равна нулю, то есть если проигрыш одного игрока равен выигрышу второго. Такая конфликтная ситуация будет называться антагонистической.

В последние годы, поми­мо теории антагонистических, неантагонистических (кооперативных), конеч­ных, бесконечных, позиционных и дифференциальных игр, начала развиваться теория рефлексивных игр. Рефлексивные игры изучают ситуации с учетом мыс­ленного воспроизведения возможного образа действий и поведения противни­ка. Дифференциальные игры изучают задачи преследования управляемого объек­та другим управляемым объектом с учетом динамики их поведения; поведение объектов описывается дифференциальными уравнениями.

Однозначное описание выбора игрока в каждой из возможных ситуаций, когда он должен сделать личный ход, называется стратегией игрока. Стратегия игрока называется оптималь­ной, если при многократном повторении игры она обеспечивает игроку максимально возможный средний выигрыш (минимально возможный средний проигрыш).

Игра называется конечной, если число стратегий игроков конечно, и бес­конечной, если хотя бы у одного из игроков число стратегий является беско­нечным.

Выбор одной из предусмотренных правилами игры стратегий и ее осущест­вление называется ходом. Ходы бывают личные и случайные. Ход называется личным, если игрок сознательно выбирает один из возможных вариантов действий и осуществляет его. Ход называется случайным, если выбор производится не игроком, а каким-либо механизмом случайного выбора.

Существуют два способа описания игр: позиционный и нормальный. Позиционный способ связан с развернутой формой игры и сводится к графу последовательных шагов (дереву игры). Нормальный способ заключается в явном представлении совокупности стратегий игроков и платежной функ­ции. Платежная функция в игре определяет для каждой совокупности вы­бранных игроками стратегий выигрыш каждой из сторон.

Пусть имеется два игрока, один из которых может выбрать i-ю стратегию из m своих возможных стратегий (i = 1,т), а вто­рой, не зная выбора первого, выбирает j-ю стратегию из n своих возможных стратегий (j = 1,п). В результате первый игрок вы­игрывает величину aij и его цель будет заключаться в максимизации своего выигрыша, а второй игрок проигрывает эту величину и его цель – минимизация своего проигрыша. Если чисел aij составить матрицу (табл. 4.1) , то она будет называться платежной.

Таблица 4.1

Платежная матрица парной игры с нулевой суммой

Игрок 2

Игрок1

1

2

n

1

a11

a12

a1n

2

a21

a22

a2n

m

am1

am2

amn

Строки платежной матрицы соответствуют стратегиям первого игро­ка, а столбцы - стратегиям второго. Эти стратегии называются чистыми. Такую игру называют матричной игрой размерности m×n. В парной игре с ненулевой суммой выигрыш каждого игрока задается сво­ей платежной матрицей. Поэтому такие игры называют биматричными.

2. Принцип минимакса и максимина в теории игр

При определении наилучших стратегий игроков следует учитывать, что противники, участвующие в игре, одинаково разумны, и каждый из них делает все для того, чтобы добиться своей цели. Выбирая i-ю стратегию иг­рока 1, мы должны рассчитывать, что игрок 2 ответит на нее той из своих j-х стратегий, для которой выигрыш игрока 1 будет минимальным. Найдем мини­мальное число в каждой строке матрицы и, обозначив его αi, запи­шем рядом с платежной матрицей (табл. 4.2) в добавочный столбец.

Таблица 4.2

Платежная матрица парной игры с добавочным столбцом

и добавочной строкой

Игрок 2

Игрок 1

1

2

n

αi=min aij

j

1

a11

a12

a1n

α1

2

a21

a22

a2n

α2

m

am1

am2

amn

αm

βj= max aij

i

β1

β2

βn

Игрок 1, зная свои минимальные выигрыши при любой стратегии игрока 2, будет предпочитать такую стратегию, при которой значение αi является максимальным, то есть

(4.1)

Величина α - это гарантированный выигрыш, который может обеспечить себе игрок 1. Она называется нижней ценой игры (максимином). Стратегия, обеспечиваю­щая получение нижней цены игры, называется максиминной стратегией. Если игрок 1 будет придерживаться своей максиминной (перестраховочной) страте­гии, то ему гарантирован выигрыш не меньший величины α при любом поведении игрока 2.

Игрок 2 заинтересован уменьшить свой проигрыш или, что то же самое, выигрыш игрока 1 обратить в минимум. Поэтому для выбора своей наилучшей стратегии он должен найти максимальное значение выигрыша игрока 1 в каж­дом из столбцов и среди этих значений выбрать наименьшее. Максимальный элемент в каждом столбце обозначим через βj. Эти элементы будем записывать в дополнительной строке табл. 4.2.

Наименьшее значение среди βj обозначим β - это верхняя цена игры (минимакс), которая определяется по формуле

(4.2)

Использование игроком 2 своей минимаксной стратегии позволит ему при любом поведении игрока 1 проиграть не больше величины β.

Для нижней и верхней цены игры всегда справедливо следующее соотношение:

(4.3)

Игры, в которых нижняя цена равна верхней называются играми с седловой точкой.

Общее значение нижней и верхней цены игры в играх с седловой точкой называется чистой ценой игры γ, а стратегии, позволяющие достичь этого значения, - оптимальными чистыми стратегиями. Оптимальные стратегии и чистая цена являются решением игры.

Оп­тимальные стратегии обладают важным свойством. Они определяют в игре «по­ложение равновесия», которое заключается в том, что каждый из игроков не за­интересован в отходе от своей оптимальной стратегии, так как это ему невыгодно. Чистую цену игры γ в игре с седловой точкой при условии одинако­вой разумности партнеров игрок 1 не может увеличить, а игрок 2 — уменьшить.

Если игра имеет седловую точку, то говорят, что она решается в чистых стратегиях. Вероятность применения чистой стратегии в игре с седловой точ­кой равна единице.

Следует отметить, что игра может иметь более одной седловой точки.

Пример 5.1. Фирма планирует освоить производство трех товаров, которые будет реализовывать на рынке, где возможна продажа конкурентом аналогичных товаров. Фирме известны вероятности реализации своих товаров при наличии на рынке товаров-конкурентов (табл. 4.3).

Таблица 4.3

Платежная матрица игры

Конкурент

Фирма

1

2

3

αi

1

6

5

8

5

2

7

3

2

2

3

3

4

7

3

βj

7

5

8

Решение:

  1. Найдем нижнюю цену игры: .

  2. Определим верхнюю цену игры: .

  3. Игра имеет седловую точку, так как α=β=5. Чистая цена игры γ=5. Оптимальными чистыми стратегиями являются:

первая стратегия для рассматриваемой фирмы (производство и реализация товара 1);

вторая стратегия для конкурента (продажа товара 2).

3. Решение матричных игр без седловых точек

Поиск решения игры, платежная матрица которой не имеет седловой точки, приводит к сложной стратегии, состоящей в случайном применении двух и бо­лее чистых стратегий с определенными частотами. Такая сложная стратегия в теории игр называется смешанной. Смешанные стратегии игроков обо­значаются, соответственно, pt=(p1, р2,…, рm) и qj=(q1,q2, …, qn), где р1 0, qj 0 - вероятности применения чистых стратегий i (i=1, m) и j (j=1, n), при этом

(4.4)

Платёжная функция в данном случае определяется как математическое ожидание выигрыша первого игрока при применении игроками смешанных стратегий p и q и равна

E(р, q)= (4.5)

В соответствии с принципом минимакса каждый игрок должен выбирать такую смешанную стратегию, которая максимизирует его наименьший гарантированный выигрыш. Аналогично случаю использования чистых стратегий наименьший гарантированный выигрыш первого игрока называется нижней ценой игры и равен

(4.6)

Аналогично определяется верхняя цена игры

(4.7)

Теорема Фон-Неймана. В любой матричной игре существует такая пара смешанных стратегий (p*, q*), что

  1. Е(p,q*) E(p*,q*) E(p*,q) для любых p Pm, q Pn; (4.8)

  2. (4.9)

Число γ=Е(р*,q*) называется ценой игры в смешанных стратегиях.

По теореме Фон-Неймана любая матричная игра имеет пару оптимальных смешанных стратегий. Для решения матричной игры необходимо отыскать эти оптимальные стратегии и цену игры.

Чистая стратегия называется активной, если она используется в некоторой оптимальной смешанной стратегии с ненулевой вероятностью.

Теорема об активных стратегиях. Если один из игроков использует оптимальную стратегию, то его противник достигает цены игры γ при любой своей смешанной стратегии, в которой используются только активные чистые стратегии. Применение оптимальной смешанной стратегии обеспечивает игро­ку максимальный средний выигрыш (или минимальный средний проигрыш), равный цене игры у, независимо от того, какие действия предпринимает другой игрок, если только он не выходит за пределы своих активных стратегий.

В основной теореме теории игр утверждается, что любая конечная игра двух лиц с нулевой суммой имеет, по крайней мере, одно решение, возможно, в смешанных стратегиях. Цена игры γ - средний выигрыш, приходящийся на одну партию, - всегда удовлетворяет условию , т.е. лежит между нижней и верхней ценой игры. Следовательно, каждый игрок при многократном по­корении игры, придерживаясь смешанных стратегий, получает более выгод­ный доя себя результат. Оптимальное решение игры в смешанных стратегиях, также как и решение в чистых стратегиях, обладает свойством, которое заклю­чается в том, что каждый из игроков не заинтересован в отходе от своей опти­мальной смешанной стратегии, если его противник применяет оптимальную смешанную стратегию, так как это ему невыгодно.

4. Упрощение игр

Для игр с платежными матрицами большой размерно­сти отыскание решения можно упростить, если уменьшить их размерность путем вычеркивания дублирующих и заведомо невыгодных стра­тегий, а также замены некоторых групп чистых стратегий смешанными.

Если в платежной матрице игры все элементы строки (столбца) равны соответ­ствующим элементам другой строки (столбца), то соответствующие этим строкам (столбцам) стратегии называются дублирующими.

В некоторых играх одна из стратегий может быть заведомо менее целесообразной, чем другая. Например, вторая стратегия дает первому игроку больший выигрыш, чем первая стратегия при любом выборе стратегии вторым игроком. Это означает, что первая строка платежной матрицы будет являться доминируемой, а вторая - доминирующей.

Будем говорить, что строка i1 доминирует строку i2, если для всех j=1,…,n справедливы неравенства и существует такая стратегия j0, что .

Если из платежной матрицы убрать все доминируемые строки, то решение игры с полученной матрицей совпадает с решением исходной игры. Таким образом, иногда можно уменьшить размерность платежной матрицы путем удаления доминируемых строк.

Аналогично доминирование определяется и для столбцов.

Столбец j2 доминирует столбец j1, если для любого i = 1, …, m справедливы неравенства и существует такая стратегия i0, что .

Платежная матрица может быть также упрощена с помощью удаления доминирующих столбцов.

Пример 4.2. Упростить игру, представленную платежной следующей матрицей (табл. 4.4).

Таблица 4.4

Платежная матрица игры

Игрок 2

Игрок 1

1

2

3

1

-2

0

1

2

3

4

5

3

2

7

-2

Решение:

Сравнивая почленно элементы 1-й и 2-й строк, видим, что все элементы 1-й строки меньше соответствующих элементов 2-й строки. Следовательно, 1-я стратегия для игрока 1 заведомо невыгодна, и ее можно исключить.

Аналогично, сравнивая эле­менты 1-го и 2-го столбца, исключаем 2-й столбец, так как для игрока 2 невыгодна 2-я стратегия. В полученной матрице 2х2 исключаем доминируемую 2-ю строку и т.д.