1danilovtseva_e_r_farafonov_i_g_d_yakova_g_n_teoriya_igr_osno
.pdfМИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
Санкт-Петербургский государственный университет аэрокосмического приборостроения
Е.Р. Даниловцева, В. Г. Фарафонов,
Г.Н. Дьякова
ТЕОРИЯ ИГР. ОСНОВНЫЕ ПОНЯТИЯ
Текст лекций
Санкт-Петербург 2003
УДК 519.8 ББК 22.18 Д18
Даниловцева Е. Р., Фарафонов В. Г., Дьякова Г. Н.
Д18 Теория игр. Основные понятия: Текст лекций/ СПбГУАП. СПб., 2003, 36 с.: ил.
В тексте лекций излагаются основные понятия теории игр. Подробно рассмотрена теория антагонистических игр. Разобраны примеры решения матричных игр.
Текст лекций предназначен для студентов, обучающихся по специально-
сти “Математические методы в экономике”.
Рецензенты: кафедра высшей математики
Санкт-Петербургского государственного университета аэрокосмического приборостроения;
доцент Ю. П. Данилов
Утверждено редакционно-издательским советом университета
в качестве текста лекций
© СПбГУАП, 2003
Учебное издание
Даниловцева Елена Рафаиловна
Фарафонов Виктор Георгиевич Дьякова Галина Николаевна
ТЕОРИЯ ИГР. ОСНОВНЫЕ ПОНЯТИЯ
Текст лекций
Редактор А. В. Подчепаева
Компьютерная верстка М. А. Даниловой
Подписано к печати 26.09.03. Формат 60×84 1/16. Бумага офсетная. Печать офсетная. Усл. печ. л. 2,32. Уч. -изд. л. 2,13. Тираж 100 экз. Заказ №
Редакционно-издательский отдел Отдел электронных публикаций и библиографии библиотеки
Отдел оперативной полиграфии СПбГУАП
190000, Санкт-Петербург, ул. Б. Морская, 67
2
1.Конфликт – предмет рассмотрения теории игр
Вприроде и обществе часто встречаются явления, в которых те или иные участники имеют несовпадающие интересы и располагают различными путями для достижения своих целей. Такие явления называются конфликтами. Конфликты являются предметом рассмотрения теории игр.
Под конфликтом будем понимать всякое явление, применительно к которому можно говорить:
кто и как в этом явлении участвует; каковы возможные исходы этого явления;
кто в этих исходах заинтересован и в чем эта заинтересованность состоит. Рассмотрим возможные причины возникновения конфликтов. Одна из характерных черт всякого общественного, социально-эконо-
мического явления состоит в множественности, многосторонности интересов и в наличии сторон, выражающих эти интересы. Например:
продавец и покупатель, имеющие противоположные интересы; несколько производителей, фигурирующих на рынке и обладающих
достаточной силой воздействия на цену товара, имеющих в связи с этим как противоположные, так и совпадающие интересы;
объединения или коалиции лиц, участвующих в столкновении интересов, как в случаях определения ставок заработной платы союзами или объединениями рабочих и предпринимателей, голосования в парламенте и т. д.
Конфликт может возникать также из различия целей, которые отражают не только несовпадающие интересы, но многосторонние интересы одного и того же лица. Например:
конструктор согласует противоречивые технико-экономические требования в процессе конструирования изделия: минимизация габаритов, минимизация стоимости, максимизация надежности, простота в обращении; разработчики экономической политики согласуют противоречивые требования, предъявляемые к ситуации: рост объемов производства,
повышение доходов, снижение экологической нагрузки и т. д.; Конфликт может проявиться не только в результате сознательных
действий различных участников, но и как результат действия тех или иных «стихийных сил» (случай так называемых «игр с природой»).
Прямо противоположные интересы различных сторон явно проявляются в непосредственной борьбе: военной, дипломатической, экономической, спортивной.
3
Наконец, примерами конфликтных ситуаций являются обычные игры: салонные, карточные, шахматные, морской бой и т. д.
Для конфликта характерно следующее:
ни один из его участников заранее не знает решений, принимаемых остальными участниками, т. е. вынужден действовать в условиях неопределенности;
ход событий в конфликте зависит от решений, принимаемых каждой из сторон, поэтому поведение любого участника конфликта, если оно разумно, должно определяться с учетом возможного поведения всех его участников.
Подводя итог сказанному, отметим, что общим, объединяющим все конфликты, независимо от их физической и социальной природы, является:
1)столкновение интересов нескольких (двух или более) сторон, в том числе сознательных индивидуумов или природы;
2)преследование сторонами различных целей;
3)наличие наборов альтернатив для достижения этих целей, каждая из которых приводит к одному (или к одному из нескольких) возможных исходов.
2. Понятие игры. Классификация игр. Формальное представление игр
Игрой называется математическая модель конфликта. Математическая модель конфликта должна отражать присущие ему черты, а значит, должна описывать:
множество заинтересованных сторон (игроков); возможные действия каждой из сторон (стратегии и ходы);
интересы сторон, представленные функциями выигрыша ( платежа) для каждого из игроков.
В теории игр предполагается, что функции выигрыша и множество стратегий, доступных каждому из игроков общеизвестны, т. е. каждый из игроков знает свою функцию выигрыша и набор имеющихся в его распоряжении стратегий, а так же функции выигрыша и стратегии всех остальных игроков. В соответствии с этой информацией каждый из игроков организует свое поведение.
Различные виды игр можно классифицировать следующим образом: по числу игроков; по числу стратегий;
4
по свойствам функции выигрыша; по возможности предварительных переговоров и взаимодействия
между игроками в ходе игры.
По числу игроков различают игры с двумя, тремя и более участниками. В принципе возможны так же игры с бесконечным числом игроков.
По числу стратегий различают конечные и бесконечные игры. В конечных играх игроки располагают конечным числом возможных стратегий. Например, в игре в орлянку у игроков по две стратегии – «орел» или «решка». В бесконечных играх игроки имеют бесконечное число возможных стратегий. Например, при взаимодействии продавца и покупателя каждый из игроков может назвать любую цену и любое количество продаваемого (покупаемого) товара.
По свойствам функции выигрыша различают игры:
снулевой суммой, когда выигрыш одного игрока равен проигрышу другого, т. е. налицо прямой конфликт между игроками;
спостоянной разностью, в которых игроки и выигрывают, и проигрывают одновременно, так что им выгодно действовать сообща;
сненулевой суммой, где есть и конфликты, и согласованные действия игроков.
По возможности предварительных переговоров и взаимодействия между игроками в ходе игры различают кооперативные и некооперативные игры. Игра называется кооперативной, если до начала игры игроки образуют коалиции и принимают взаимообязывающие соглашения о своих стратегиях (например, образование коалиций в парламенте перед голосованием по некоторым вопросам).
Игра, в которой игроки не могут координировать свои стратегии подобным образом, называется некооперативной (например, все игры с нулевой суммой).
Рассмотрим примеры формального представления игр.
Обозначим через I множество всех игроков, через Si – множество возможных действий игрока i (i I), называемое множеством стратегий.
Например:
а) игра в орлянку
I = {1, 2}, Si = {Орел, Решка}; б) голосование в парламенте
I = {1, 2, …, n}, где n – число голосующих, Si = {За, Против, Воздержался};
в) взаимодействие на рынке двух продавцов
5
I = {1, 2} Si = {Pi: Pi > 0}, где Pi – цена продаваемого товара.
Впартии игроки выбирают каждый свою стратегию si Si, в результате чего складывается набор стратегий s = (s1, s2,…,sn), называемый
ситуацией.
Врассмотренных выше примерах приведем возможные ситуации: а) (Орел, Орел), (Орел, Решка), (Решка, Орел), (Решка, Решка); б) (За, За, Против, За, Воздержался, …, Против); в) (5 рублей, 3 рубля), (5 рублей, 7 рублей).
Заинтересованность игроков в конкретных ситуациях проявляется в
том, что каждому игроку i в каждой ситуации s присваивается число, выражающее степень удовлетворения его интересов в данной ситуации. Это число называется выигрышем игрока i и обозначается H i(s).
Вернемся к указанным выше примерам. В игре в орлянку:
H1(Орел, Орел) = H1(Решка, Решка) = 1,
H1(Орел, Решка ) = H1(Решка, Орел ) = –1,
H2(Орел, Орел) = H2(Решка, Решка) = –1,
H2(Орел, Решка) = H2(Решка, Орел) = 1.
Видно, что в любой ситуации H1 + H2 = 0.
Запишем это в виде матрицы выигрышей, где строки будут соответствовать стратегиям 1-го игрока, столбцы – стратегиям 2-го игрока.
H1 |
|
1 |
−1 |
H2 |
|
−1 |
1 |
= |
−1 |
, |
= |
1 |
. |
||
|
|
1 |
|
|
−1 |
При этом или H1 + H2 = 0.
Таким образом, орлянка является примером игры с нулевой суммой. При голосовании в парламенте:
10, |
если проголосовавших “За” больше, чем проголосовав- |
|
|
||
|
ших “Против” (вопрос прошел), |
|
|
если проголосовавших “За” меньше, чем проголосовав- |
|
Hi = |
||
|
||
−7, |
ших “Против” (вопрос не прошел), |
|
|
для участников голосования i = 1, 2, …, k (членов од- |
|
|
ной коалиции); |
|
|
6
10, |
если проголосовавших “За” больше, чем проголосовавших |
||
|
|||
|
|
“Против” (вопрос прошел), |
|
|
|
если проголосовавших “За” меньше, чем проголосовавших |
|
Hi = |
5, |
||
|
|||
|
“Против” (вопрос не прошел), |
||
|
|
для участников голосования i = k + 1, …, n (членов другой |
|
|
|
|
коалиции).
В случае взаимодействия на рынке двух продавцов предположим, что потребитель приобретет товар у фирмы, объявившей меньшую цену, или распределит свой спрос поровну между фирмами в случае, если цены равны.
Если d(p) – функция спроса в зависимости от цены на товар, то функция выигрыша:
|
|
p d( p ), |
p |
< p , |
|
|
|
1 |
1 |
1 |
2 |
1-й фирмы |
H1( p1, p2 ) = |
1/ 2 p1 d( p1), |
p1 = p2 , |
||
|
|
|
|
1 |
2 |
|
|
0, |
|
p |
> p ; |
|
|
0, |
|
p1 < p2 , |
|
|
H2 ( p1, p2 ) = |
|
p1 d( p1), p1 = p2 , |
||
2-й фирмы |
1/ 2 |
||||
|
|
p d( p ), |
p > p . |
||
|
|
2 |
2 |
1 |
2 |
3. Определение бескоалиционной игры
Бескоалиционной игрой будем называть такую игру, в которой целью каждого игрока является получение по возможности большего индивидуального выигрыша.
Обозначим:
I – множество всех игроков. Далее будем считать I конечным. Обычно принято различать игроков по номерам, т. е. считать I = {1, 2, …, n};
Si – множество стратегий игрока i I, т. е. множество возможных действий, имеющихся в распоряжении игрока i. Считается, что Si содержит не менее двух возможных стратегий, иначе его действия заранее определены.
Процесс игры состоит в выборе каждым из игроков одной своей стратегии si S. Таким образом, в результате каждой партии игры складывается система стратегий s = (s1, s2,…,sn), которая называется ситуацией.
Множество всех ситуаций S = S1 S2 ... Sn , т. е. S является декартовым произведением множеств стратегий всех игроков. Обозначим: Hi(s)
7
– выигрыш игрока i в ситуации s. Функция Hi , определенная на множестве всех ситуаций, называется функцией выигрыша игрока i.
Hi: S → R, т. е. каждой ситуации s S Hi – сопоставляет вещественное число.
Определение 1. Бескоалиционной игрой называется система
Г = < I, {Si }i I , {Hi }i I >, в которой I и Si (i I) являются множествами, а Hi – функции на множестве S = S1 × S2 ×... × Sn , , принимаю-
щие вещественные значения.
Определение 2. Бескоалиционная игра Г = < I, {Si }iI , {Hi }iI >, называется игрой с постоянной суммой, если существует такое посто-
янное число C, что ∑Hi (s) = C s S, т. е. сумма выигрышей игро-
iI
ков постоянна в любой ситуации.
4. Приемлемые ситуации и ситуации равновесия
Ситуацию s в игре Г естественно считать приемлемой для игрока i, если этот игрок, изменяя в ситуации s свою стратегию на какую-либо другую, не может увеличить этим своего выигрыша.
Пусть s = (s1, s2 , ..., si−1, si , si+1, ..., sn ) – произвольная ситуация в игре , а si – некоторая стратегия игрока i.
Рассмотримновуюситуацию s si′ = (s1, s2 , ..., si−1, si′, si+1,..., sn ),получившуюся из ситуации s заменой стратегии si игрока i на si′ . Очевидно,
что s si′ = s, если si′ совпадает с si (si′ = si ).
Определение 3. Ситуация s в игре Г называется приемлемой для
игрока i, если Hi (s si′) ≤ Hi (s), si′ Si .
Смысл названия «приемлемая» состоит в том, что, если в некоторой
ситуации |
s |
для |
игрока i найдется такая стратегия si′, что |
||||
Hi (s |
|
|
|
si′ ) |
> |
Hi (s), |
то игрок i в случае складывающейся ситуации s |
|
|
может получить больший выигрыш, выбирая si′, вместо si. В этом смысле ситуация s для игрока может считаться неприемлемой.
Определение 4. Ситуация s называется ситуацией равновесия (или равновесной ситуацией), если она приемлема для всех игроков, т. е.
Hi (s si′) ≤ Hi (s), i, si′ Si .
8
Из определения видно, что в ситуациях равновесия и только в них ни один игрок не заинтересован в отклонении от своей стратегии.
Определение 5. Равновесной стратегией игрока в бескоалиционной игре называется такая его стратегия, которая входит хотя бы в одну из равновесных ситуаций игры.
Процесс нахождения ситуаций равновесия в бескоалиционной игре называется решением игры.
5. Пример «Дилемма заключенных»
Предположим, игроками 1 и 2 являются преступники, находящиеся в предварительном заключении по подозрению в тяжком преступлении. Прямых улик против них нет, и возможность их обвинения в значительной мере зависит от того, сознаются ли преступники сами.
Имеем I = {1, 2}, Si = {Признаться, Не признаться}. Определим заинтересованность игроков в различных ситуациях.
Если оба признаются, то будут осуждены на длительный срок, но с учетом смягчающего обстоятельства (добровольного признания) каждый получит срок 5 лет (выигрыш (потери) каждого оценим в –5).
Если оба не сознаются, то за отсутствием улик обвинение в тяжком преступлении будет снято, но следствие сможет доказать виновность игроков в менее тяжком преступлении, в результате чего оба получат срок в 1 год (выигрыш (потери) каждого оценим в –1).
Если в участии в преступлении сознается один из игроков, то ему удается свалить всю вину на другого. В результате сознавшийся выходит на свободу (выигрыш (потери) 0), а его упорствующий соучастник получит полную меру возмездия – срок 10 лет (выигрыш (потери) –10).
Запишем функции выигрышей (потерь) игроков в рассмотренной игре.
Пусть П – признание, Н – непризнание, H1 – выигрыш 1-го игрока, H2 – выигрыш 2-го игрока.
H1 (П, П) = H2 (П, П) = –5 ,
H1 (П, П) = H2 (П, П) = –1,
H1 (П, Н) = H2 (H, П) = 0,
H1 (H, П) = H2 (П, Н) = –10.
В матричной записи, где строки соответствуют стратегиям 1-го, а столбцы стратегиям 2-го игрока, имеем
9
H1 |
= |
|
− 5 |
0 |
H2 |
= |
−5 |
−10 |
|
|
−10 |
, |
|
0 |
. |
||||
|
|
|
−1 |
|
|
|
− 1 |
Ситуацией равновесия в данной игре оказывается ситуация (П, П), в которой каждый из игроков должен признаться. В этой ситуации каждый из игроков теряет 5, т. е. оказывается осужденным на 5 лет. В ситуации же (Н, Н), когда ни один не признался, потери каждого всего 1 (каждый осужден на 1 год). Однако данная ситуация явно неустойчива, так как каждый из игроков заинтересован отклониться от выбранной стратегии и признаться, рассчитывая свалить вину на другого и избежать наказания, сведя свои потери к 0 (при этом потери партнера составят 10).
Таким образом разумной стратегией для каждого игрока является признание, так как оно гарантирует игроку неполучение максимального срока в 10 лет. Хотя более «выгодной» кажется тактика непризнания, дающая возможность получения незначительного наказания (срок
в1 год), однако чреватая неожиданностью в виде максимального срока
в10 лет в случае признания со стороны соучастника.
6. Стратегическая эквивалентность игр
Разнообразие бескоалиционных игр делает желательным объединение их в такие классы, внутри которых игры обладают одними и теми же свойствами. В качестве таких классов можно взять классы стратегически эквивалентных игр.
Определение 6. Пусть есть две бескоалиционной игры Г′ и Г′′ с одними и теми же множествами игроков и их стратегий, отличающиеся лишь функциями выигрыша:
Г′ = < I, {Si }i I , {Hi′}i I >
Г′′ = < I, {Si }i I , {Hi′′}i I > ,
и пусть существует k > 0, а для каждого игрока существует вещественное Ci такое, что в любой ситуации s
Нi′(s) = k Hi′′(s) + ci .
Тогда игры Г′ и Г′′ называются стратегически эквивалентными.
Стратегическая эквивалентность игры Г′ игре Г′′ обозначается
Г′ ~ Г′′.
10