
Я.И.Заботин
Т е о р и я и г р
( теоретические основы и игры с седловой точкой)
2 0 0 3
Научный редактор – кандидат физ.-мат. наук, доцент А.И.Кораблев
Рецензенты: профессор Ш.И.Галиев
профессор М.М.Карчевский
Теория игр (теоретические основы и игры с седловой точкой ) Набережные Челны: филиал Казанского государственного университета, 2003.
В пособии приводятся основные положения теории игр, на которых базируются методы отыскания оптимальных стратегий в конфликтных ситуациях, приводятся алгоритмы и упражнения отыскания оптимальных стратегий в играх с седловыми точками.
Предназначается для студентов, обучающихся по специальностям «Математические методы в экономике», «Прикладная математика», и может быть использовано при изучении курса «Теория игр» .
В в е д е н и е
Теория игр – сравнительно молодое математическое направление, изучающее конфликтные ситуации и позволяющее принимать в них оптимальную в определенном смысле стратегию поведения. Понятие конфликт является первоначальным, не определяемым математически и выражает, как обычно, ту ситуацию, в которой сталкиваются интересы двух или более противоборствующих сторон.
С конфликтами мы сталкиваемся в жизни очень часто. Наличие конфликта в военных ситуациях не требуют пояснения. Ясно также наличие конфликтов в конкурентной экономике. Такие ситуации возникают даже тогда, когда казалось бы нет никаких заметных для этого предпосылок. Так например, заказчик ищет строительную фирму, которая осуществила бы строительство некоторого объекта. Строительных фирм много, и они начинают борьбу за право осуществить это строительство. Стараются узнать условия других фирм, предлагают свои, стараясь, чтобы контракт на строительство был заключен с ними, а не с другими фирмами. Для каждой фирмы другая фирма является в определенном смысле противником. Иногда при изучении тех или иных реальных процессов, конфликт является условным. Так, например, иногда выработать оптимальную стратегию поведения в исследуемом процессе мешают природные явления, влияние которых не удается предусмотреть заранее. В этом случае природа может рассматриваться как условный противник, действия которого мешают найти наилучшее решение.
Цель теории игр – создание и использование методов, позволяющих выработать рекомендации по оптимальному образу действий в конфликтных ситуациях. Поскольку по методам теории игр вырабатываются управляющие решения, то эта теория является разделом исследования операций.
Было бы неправдой говорить, что теория игр уже нашла широкие практические применения. Но конфликтные ситуации существуют, некоторые из них поддаются уже сейчас математическому моделированию в виде игровых задач. Надо искать новые методы выработки оптимального поведения в новых конфликтных ситуациях, искать новые приложения новым исследователям операций.
В настоящем пособии при нумерации формул, лемм и теорем первое число указывает на номер параграфа, а второе – на их номер внутри параграфа.
§ 1. Основные определения теории игр, математическая формализация игровых понятий и модель игры
Чтобы математическими методами исследовать какой-либо процесс, необходимо, в первую очередь, строго математически формализовать все возникающие при этом понятия и взаимосвязь между ними.
Как уже отмечалось во введении, понятие конфликт является первоначальным неопределяемым математически, так же, как, например, и понятие множества в математическом анализе.
Определение 1.1. Математическую модель конфликтного процесса и действия участников этого конфликта называют игрой. Теорией игр называют математическую теорию, исследующую конфликтные процессы.
Каждый участник конфликта называется лицом или игроком.
Под термином “лицо”, или “игрок”, может пониматься конкретный человек, а может пониматься и коллектив, фирма, организация и тому подобное.
Пусть число участников игры равно n.
Каждый игрок должен в той или иной возникшей ситуации выбрать стратегию поведения. От принятой им стратегии поведения зависит, например, его прибыль. При этом игроку целесообразно и если возможно выбрать не просто достаточно хорошую стратегию, а в каком то смысле оптимальную. Все, что сейчас сказано, и нужно формализовать математически в первую очередь.
Обсудим следующий условный пример. Пусть данный рынок обеспечивают продуктами n лиц (предпринимателей). У каждого лица есть определенная сумма денег. Каждый из предпринимателей может приобрести 4 вида продукции и доставить их на рынок для продажи. Пусть первый предприниматель может купить на свою сумму денег 4 единицы первого продукта, 3 единицы – второго, 0 – третьего и 5 – четвертого. Тогда набор его покупок можно записать четверкой чисел (4,3,0,5). Но он может определить свою стратегию закупок и по-другому. Если придерживаться такого же правила записи, то его стратегию закупок, можно записать, например, в виде (0,7,3,2) и т.д. Таким образом, первый предприниматель имеет множество стратегий закупок. В таком же положении находятся и другие предприниматели. Когда каждый предприниматель выберет свою стратегию закупок, на рынке возникнет определенная ситуация с продуктами, от которой, вообще говоря, зависят цены на продукты, а следовательно и доходы предпринимателей.
Итак, продолжим математизацию.
П.1. ПОСТРОЕНИЕ МАТЕМАТИЧЕСКОЙ ИГРОВОЙ МОДЕЛИ
Каждое лицо имеет свое имя. Установим любым способом взаимно однозначное соответствие между множеством лиц и множеством чисел I={1,2,…,n}. Тогда каждого игрока можно называть по присвоенному ему номеру.
Определение
1.2. Пусть заданы множества
,
элементов, из которых игрок с номером
может выбрать любой элемент
.
Любой элемент
называется
стратегией
i-го
игрока, а
– множеством его стратегий.
Стратегия каждого игрока может быть многомерным набором чисел (вспомним пример с рынком), при этом размерности стратегий у различных игроков могут быть различными.
Определение 1.3. Набор выбранных всеми игроками стратегий , т.е. набор
называется ситуацией.
Множество всех ситуаций обозначается через
,
где знак
называется декартовым умножением и
означает, что из каждого множества
выбирается
по одному элементу
и составляется
набор
.
Таким образом, если каждый игрок выбрал
свою стратегию,
то возникла ситуация
,
и следует определить, какой доход каждый
игрок в этой ситуации получит.
Определение 1.4. Пусть на множестве ситуаций определены n функций
.
Если число
означает сумму, которую получит i–ый
игрок при ситуации
,
то
называют функцией выигрыша i–
го игрока.
Определение 1.5. Игрой называется процесс, при котором каждый из игроков в какой-то момент выбирает себе стратегию и в возникшей ситуации получает выигрыш .
Если задан набор
,
(1.1)
то говорят, что определена игра Г, а сам набор Г называют математической моделью игры или для краткости – игрой Г.
Из определения игры видно, что выигрыш игрока под номером i зависит не только от выбранной им стратегии, но и от стратегий, выбранных другими игроками, которые при выборе своей стратегии руководствуются своими интересами.
Разберемся, что же понимать под оптимальной стратегией игрока и решением игры в таком случае?
Пусть в игре
Г
возникла ситуация
.
Тогда в этой ситуации каждый из игроков
выиграет
.
Если же игрок под номером i
заменит
свою стратегию
стратегией
,
то возникнет ситуация
,
которую будем обозначать
.
Определение 1.6. Ситуация называется приемлемой для i-го игрока, если
(
)
(1.2)
Определение
1.7. Ситуация
,
называется решением игры или ситуацией
равновесия (по Нэшу), если она является
приемлемой для всех игроков, т.е. если
условие (1.2) выполняется для всех
.
Координата
(вообще говоря многомерная) ситуации
равновесия
называется оптимальной стратегией
i-го
игрока.
Конечно, далеко
не все игры имеют решение. Даже, если
множество
состоит из одного индекса, то неравенство
(1.2) означает, что для нахождения
следует
решить задачу математического
программирования
,
которая далеко не всегда имеет решение,
а когда имеет, то ее решение может
вызывать большие трудности.
П.2. Стратегически эквивалентные игры.
Оказывается, что существуют такие классы игр, в которых все игры, принадлежащие одному и тому же классу, имеют одинаковые решения.
Чтобы уметь выделять такие классы, введем следующее понятие.
Определение 1.8. Пусть определены игры
,
(1.3)
.
(1.4)
Игра
называется стратегически (или аффинно)
эквивалентной игре
и записывается это в виде
,
если существуют такие вещественные
числа
и
,
что выполняются условия
.
(1.5)
Убедимся, что определение 1.8 действительно удовлетворяет понятию эквивалентности и позволяет разбивать игры на классы стратегически эквивалентных игр, т.к. оно обладает следующими тремя свойствами.
1. Свойство рефлексивности: всякая игра эквивалентна самой себе.
Действительно, равенство (1.5) для игры Г имеет вид
(1.6)
и справедливо при
.
Заметим, что
это свойство не выполнялось бы, если бы
в определении 1.8 вместо требований,
наложенных на
и
,
было
записано
,
.
В этом случае равенство (1.6) не могло бы
быть выполнено.
2.
Свойство симметрии:
если
,
то
.
Действительно,
т.к.
,
то по определению 1.8 выполняются условия
(1.5). Но тогда
,
(1.7)
где
.
Но это и означает, что условие (1.5)
определения 1.8 выполнено и, следовательно,
.
В силу этого
свойства, при выполнении условия (1.5),
вместо того, чтобы говорить “вторая
игра эквивалентна первой”, появилась
возможность говорить “игры
эквивалентны”
Заметим, что и
свойство симметрии не выполнялось бы,
если бы в определении 1.8 было бы записано
,
.
Действительно, для коэффициентов
равенства (1.7) не выполнялись бы
требования
.
3. Свойство
транзитивности:
если
,
,
то
.
Пусть игры
определены наборами (1.1),(1.3),(1.4),
соответственно. Учитывая, что
,
,
в силу определения 1.8 найдутся такие
,
что
.
Подставляя
из первого равенства во второе, получим
.
Отсюда
,
поскольку нашелся множитель
,
при котором выполняются условия
определения 1.8.
Свойство 3 позволяет теперь выделять класс эквивалентных игр.
В определении 1.8 различие в значениях можно трактовать экономически как различие в начальных капиталах, коэффициент определяет различие в единицах измерения выигрышей.
Теорема 1.1 (о решениях стратегически эквивалентных игр). Стратегически эквивалентные игры имеют одни и те же ситуации равновесия (т.е. одни и те же решения).
Доказательство.
Пусть игры
определены наборами (1.3),(1.4), соответственно,
и
– решение одной из них, например первой.
Тогда согласно определениям 1.6 и 1.7
выполняются неравенства
(
)
,
.
(1.8)
А так как
,
то по
определению эквивалентности существуют
такие числа
,
что
.
(1.9)
Умножим неравенства
(1.8) на
и прибавим к обеим частям полученных
неравенств
.
Тогда получим
.
(1.10)
Тогда, учитывая,
что равенства (1.9) справедливы для любых
,
в том числе и для
,
неравенства (1.10) путем элементарной
подстановки выражений из (1.9) превратим
в неравенства
(
)
,
.
Но это по определению
1.7 и означает, что
является решением игры
.
Теорема доказана.
Теорема показывает, что в любых стратегически эквивалентных играх оптимальные стратегии одинаковы. Поэтому игры и называются стратегически эквивалентными.
В практике возникают игры разных типов. Под игроком может пониматься группа лиц. Если все участники группы имеют одинаковые интересы, то такие игры называются бескоалиционными. Но если группа лиц объединилась в коалицию, преследуя какую то определенную цель, но каждый из них имеет при этом свои интересы, не совпадающие с интересами других лиц, то такие игры называются коалиционными. В нашем курсе изучаются бескоалиционные игры. При этом будут изучаться так называемые игры с постоянной суммой.
Определение 1.9. Если для какой-то константы С выполняется равенство
,
то Г называется игрой с постоянной суммой.
Рассматриваются и игры, в которых указанная сумма не является константой. К ним относятся так называемые кооперативные игры. Но даже решение игр с постоянной суммой вызывает большие вычислительные трудности.
В игре с постоянной суммой увеличение выигрыша какого-нибудь игрока приводит обязательно к уменьшению выигрыша хотя бы у одного из остальных игроков, и игроки могут превращаться в противников.
Теорема 1.2. Любая игра с постоянной суммой стратегически эквивалентна игре с нулевой суммой.
Доказательство.
Пусть
– игра с
суммой С.
Тогда согласно
определению 1.9
.
Построим
игру
с тем же множеством I
участников
и с теми же множествами
стратегий, но с функциями
выигрышей,
где
.
По определению 1.8 игры Г
и
стратегически
эквивалентны. Но
является
игрой с нулевой суммой, так как
.
Теорема доказана.
Подведем некоторые итоги. Они говорят, что в множестве игр можно выделять классы стратегически эквивалентных игр и при этом находить решение любой из них.
Конечно, как было отмечено ранее, решение игровых задач вызывает еще большие трудности, чем решение задач математического программирования. Но для некоторых классов игровых задач разработаны уже достаточно эффективные методы решения.