Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

1danilovtseva_e_r_farafonov_i_g_d_yakova_g_n_teoriya_igr_osno

.pdf
Скачиваний:
2
Добавлен:
29.10.2019
Размер:
323.91 Кб
Скачать

МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ

Санкт-Петербургский государственный университет аэрокосмического приборостроения

Е.Р. Даниловцева, В. Г. Фарафонов,

Г.Н. Дьякова

ТЕОРИЯ ИГР. ОСНОВНЫЕ ПОНЯТИЯ

Текст лекций

Санкт-Петербург 2003

УДК 519.8 ББК 22.18 Д18

Даниловцева Е. Р., Фарафонов В. Г., Дьякова Г. Н.

Д18 Теория игр. Основные понятия: Текст лекций/ СПбГУАП. СПб., 2003, 36 с.: ил.

В тексте лекций излагаются основные понятия теории игр. Подробно рассмотрена теория антагонистических игр. Разобраны примеры решения матричных игр.

Текст лекций предназначен для студентов, обучающихся по специально-

сти “Математические методы в экономике”.

Рецензенты: кафедра высшей математики

Санкт-Петербургского государственного университета аэрокосмического приборостроения;

доцент Ю. П. Данилов

Утверждено редакционно-издательским советом университета

в качестве текста лекций

© СПбГУАП, 2003

Учебное издание

Даниловцева Елена Рафаиловна

Фарафонов Виктор Георгиевич Дьякова Галина Николаевна

ТЕОРИЯ ИГР. ОСНОВНЫЕ ПОНЯТИЯ

Текст лекций

Редактор А. В. Подчепаева

Компьютерная верстка М. А. Даниловой

Подписано к печати 26.09.03. Формат 60×84 1/16. Бумага офсетная. Печать офсетная. Усл. печ. л. 2,32. Уч. -изд. л. 2,13. Тираж 100 экз. Заказ №

Редакционно-издательский отдел Отдел электронных публикаций и библиографии библиотеки

Отдел оперативной полиграфии СПбГУАП

190000, Санкт-Петербург, ул. Б. Морская, 67

2

1.Конфликт – предмет рассмотрения теории игр

Вприроде и обществе часто встречаются явления, в которых те или иные участники имеют несовпадающие интересы и располагают различными путями для достижения своих целей. Такие явления называются конфликтами. Конфликты являются предметом рассмотрения теории игр.

Под конфликтом будем понимать всякое явление, применительно к которому можно говорить:

кто и как в этом явлении участвует; каковы возможные исходы этого явления;

кто в этих исходах заинтересован и в чем эта заинтересованность состоит. Рассмотрим возможные причины возникновения конфликтов. Одна из характерных черт всякого общественного, социально-эконо-

мического явления состоит в множественности, многосторонности интересов и в наличии сторон, выражающих эти интересы. Например:

продавец и покупатель, имеющие противоположные интересы; несколько производителей, фигурирующих на рынке и обладающих

достаточной силой воздействия на цену товара, имеющих в связи с этим как противоположные, так и совпадающие интересы;

объединения или коалиции лиц, участвующих в столкновении интересов, как в случаях определения ставок заработной платы союзами или объединениями рабочих и предпринимателей, голосования в парламенте и т. д.

Конфликт может возникать также из различия целей, которые отражают не только несовпадающие интересы, но многосторонние интересы одного и того же лица. Например:

конструктор согласует противоречивые технико-экономические требования в процессе конструирования изделия: минимизация габаритов, минимизация стоимости, максимизация надежности, простота в обращении; разработчики экономической политики согласуют противоречивые требования, предъявляемые к ситуации: рост объемов производства,

повышение доходов, снижение экологической нагрузки и т. д.; Конфликт может проявиться не только в результате сознательных

действий различных участников, но и как результат действия тех или иных «стихийных сил» (случай так называемых «игр с природой»).

Прямо противоположные интересы различных сторон явно проявляются в непосредственной борьбе: военной, дипломатической, экономической, спортивной.

3

Наконец, примерами конфликтных ситуаций являются обычные игры: салонные, карточные, шахматные, морской бой и т. д.

Для конфликта характерно следующее:

ни один из его участников заранее не знает решений, принимаемых остальными участниками, т. е. вынужден действовать в условиях неопределенности;

ход событий в конфликте зависит от решений, принимаемых каждой из сторон, поэтому поведение любого участника конфликта, если оно разумно, должно определяться с учетом возможного поведения всех его участников.

Подводя итог сказанному, отметим, что общим, объединяющим все конфликты, независимо от их физической и социальной природы, является:

1)столкновение интересов нескольких (двух или более) сторон, в том числе сознательных индивидуумов или природы;

2)преследование сторонами различных целей;

3)наличие наборов альтернатив для достижения этих целей, каждая из которых приводит к одному (или к одному из нескольких) возможных исходов.

2. Понятие игры. Классификация игр. Формальное представление игр

Игрой называется математическая модель конфликта. Математическая модель конфликта должна отражать присущие ему черты, а значит, должна описывать:

множество заинтересованных сторон (игроков); возможные действия каждой из сторон (стратегии и ходы);

интересы сторон, представленные функциями выигрыша ( платежа) для каждого из игроков.

В теории игр предполагается, что функции выигрыша и множество стратегий, доступных каждому из игроков общеизвестны, т. е. каждый из игроков знает свою функцию выигрыша и набор имеющихся в его распоряжении стратегий, а так же функции выигрыша и стратегии всех остальных игроков. В соответствии с этой информацией каждый из игроков организует свое поведение.

Различные виды игр можно классифицировать следующим образом: по числу игроков; по числу стратегий;

4

по свойствам функции выигрыша; по возможности предварительных переговоров и взаимодействия

между игроками в ходе игры.

По числу игроков различают игры с двумя, тремя и более участниками. В принципе возможны так же игры с бесконечным числом игроков.

По числу стратегий различают конечные и бесконечные игры. В конечных играх игроки располагают конечным числом возможных стратегий. Например, в игре в орлянку у игроков по две стратегии – «орел» или «решка». В бесконечных играх игроки имеют бесконечное число возможных стратегий. Например, при взаимодействии продавца и покупателя каждый из игроков может назвать любую цену и любое количество продаваемого (покупаемого) товара.

По свойствам функции выигрыша различают игры:

снулевой суммой, когда выигрыш одного игрока равен проигрышу другого, т. е. налицо прямой конфликт между игроками;

спостоянной разностью, в которых игроки и выигрывают, и проигрывают одновременно, так что им выгодно действовать сообща;

сненулевой суммой, где есть и конфликты, и согласованные действия игроков.

По возможности предварительных переговоров и взаимодействия между игроками в ходе игры различают кооперативные и некооперативные игры. Игра называется кооперативной, если до начала игры игроки образуют коалиции и принимают взаимообязывающие соглашения о своих стратегиях (например, образование коалиций в парламенте перед голосованием по некоторым вопросам).

Игра, в которой игроки не могут координировать свои стратегии подобным образом, называется некооперативной (например, все игры с нулевой суммой).

Рассмотрим примеры формального представления игр.

Обозначим через I множество всех игроков, через Si – множество возможных действий игрока i (i I), называемое множеством стратегий.

Например:

а) игра в орлянку

I = {1, 2}, Si = {Орел, Решка}; б) голосование в парламенте

I = {1, 2, …, n}, где n – число голосующих, Si = {За, Против, Воздержался};

в) взаимодействие на рынке двух продавцов

5

I = {1, 2} Si = {Pi: Pi > 0}, где Pi – цена продаваемого товара.

Впартии игроки выбирают каждый свою стратегию si Si, в результате чего складывается набор стратегий s = (s1, s2,…,sn), называемый

ситуацией.

Врассмотренных выше примерах приведем возможные ситуации: а) (Орел, Орел), (Орел, Решка), (Решка, Орел), (Решка, Решка); б) (За, За, Против, За, Воздержался, …, Против); в) (5 рублей, 3 рубля), (5 рублей, 7 рублей).

Заинтересованность игроков в конкретных ситуациях проявляется в

том, что каждому игроку i в каждой ситуации s присваивается число, выражающее степень удовлетворения его интересов в данной ситуации. Это число называется выигрышем игрока i и обозначается H i(s).

Вернемся к указанным выше примерам. В игре в орлянку:

H1(Орел, Орел) = H1(Решка, Решка) = 1,

H1(Орел, Решка ) = H1(Решка, Орел ) = –1,

H2(Орел, Орел) = H2(Решка, Решка) = –1,

H2(Орел, Решка) = H2(Решка, Орел) = 1.

Видно, что в любой ситуации H1 + H2 = 0.

Запишем это в виде матрицы выигрышей, где строки будут соответствовать стратегиям 1-го игрока, столбцы – стратегиям 2-го игрока.

H1

 

1

−1

H2

 

−1

1

=

−1

,

=

1

.

 

 

1

 

 

−1

При этом или H1 + H2 = 0.

Таким образом, орлянка является примером игры с нулевой суммой. При голосовании в парламенте:

10,

если проголосовавших “За” больше, чем проголосовав-

 

 

ших “Против” (вопрос прошел),

 

если проголосовавших “За” меньше, чем проголосовав-

Hi =

 

−7,

ших “Против” (вопрос не прошел),

 

для участников голосования i = 1, 2, …, k (членов од-

 

ной коалиции);

 

6

10,

если проголосовавших “За” больше, чем проголосовавших

 

 

 

“Против” (вопрос прошел),

 

 

если проголосовавших “За” меньше, чем проголосовавших

Hi =

5,

 

 

“Против” (вопрос не прошел),

 

 

для участников голосования i = k + 1, …, n (членов другой

 

 

 

коалиции).

В случае взаимодействия на рынке двух продавцов предположим, что потребитель приобретет товар у фирмы, объявившей меньшую цену, или распределит свой спрос поровну между фирмами в случае, если цены равны.

Если d(p) – функция спроса в зависимости от цены на товар, то функция выигрыша:

 

 

p d( p ),

p

< p ,

 

 

1

1

1

2

1-й фирмы

H1( p1, p2 ) =

1/ 2 p1 d( p1),

p1 = p2 ,

 

 

 

 

1

2

 

 

0,

 

p

> p ;

 

 

0,

 

p1 < p2 ,

 

H2 ( p1, p2 ) =

 

p1 d( p1), p1 = p2 ,

2-й фирмы

1/ 2

 

 

p d( p ),

p > p .

 

 

2

2

1

2

3. Определение бескоалиционной игры

Бескоалиционной игрой будем называть такую игру, в которой целью каждого игрока является получение по возможности большего индивидуального выигрыша.

Обозначим:

I – множество всех игроков. Далее будем считать I конечным. Обычно принято различать игроков по номерам, т. е. считать I = {1, 2, …, n};

Si – множество стратегий игрока i I, т. е. множество возможных действий, имеющихся в распоряжении игрока i. Считается, что Si содержит не менее двух возможных стратегий, иначе его действия заранее определены.

Процесс игры состоит в выборе каждым из игроков одной своей стратегии si S. Таким образом, в результате каждой партии игры складывается система стратегий s = (s1, s2,…,sn), которая называется ситуацией.

Множество всех ситуаций S = S1 S2 ... Sn , т. е. S является декартовым произведением множеств стратегий всех игроков. Обозначим: Hi(s)

7

– выигрыш игрока i в ситуации s. Функция Hi , определенная на множестве всех ситуаций, называется функцией выигрыша игрока i.

Hi: S → R, т. е. каждой ситуации s S Hi – сопоставляет вещественное число.

Определение 1. Бескоалиционной игрой называется система

Г = < I, {Si }i I , {Hi }i I >, в которой I и Si (i I) являются множествами, а Hi – функции на множестве S = S1 × S2 ×... × Sn , , принимаю-

щие вещественные значения.

Определение 2. Бескоалиционная игра Г = < I, {Si }iI , {Hi }iI >, называется игрой с постоянной суммой, если существует такое посто-

янное число C, что Hi (s) = C s S, т. е. сумма выигрышей игро-

iI

ков постоянна в любой ситуации.

4. Приемлемые ситуации и ситуации равновесия

Ситуацию s в игре Г естественно считать приемлемой для игрока i, если этот игрок, изменяя в ситуации s свою стратегию на какую-либо другую, не может увеличить этим своего выигрыша.

Пусть s = (s1, s2 , ..., si−1, si , si+1, ..., sn ) – произвольная ситуация в игре , а si – некоторая стратегия игрока i.

Рассмотримновуюситуацию s si′ = (s1, s2 , ..., si1, si, si+1,..., sn ),получившуюся из ситуации s заменой стратегии si игрока i на si′ . Очевидно,

что s si′ = s, если siсовпадает с si (si′ = si ).

Определение 3. Ситуация s в игре Г называется приемлемой для

игрока i, если Hi (s si) Hi (s), siSi .

Смысл названия «приемлемая» состоит в том, что, если в некоторой

ситуации

s

для

игрока i найдется такая стратегия si, что

Hi (s

 

 

 

si)

>

Hi (s),

то игрок i в случае складывающейся ситуации s

 

 

может получить больший выигрыш, выбирая si, вместо si. В этом смысле ситуация s для игрока может считаться неприемлемой.

Определение 4. Ситуация s называется ситуацией равновесия (или равновесной ситуацией), если она приемлема для всех игроков, т. е.

Hi (s si) Hi (s), i, siSi .

8

Из определения видно, что в ситуациях равновесия и только в них ни один игрок не заинтересован в отклонении от своей стратегии.

Определение 5. Равновесной стратегией игрока в бескоалиционной игре называется такая его стратегия, которая входит хотя бы в одну из равновесных ситуаций игры.

Процесс нахождения ситуаций равновесия в бескоалиционной игре называется решением игры.

5. Пример «Дилемма заключенных»

Предположим, игроками 1 и 2 являются преступники, находящиеся в предварительном заключении по подозрению в тяжком преступлении. Прямых улик против них нет, и возможность их обвинения в значительной мере зависит от того, сознаются ли преступники сами.

Имеем I = {1, 2}, Si = {Признаться, Не признаться}. Определим заинтересованность игроков в различных ситуациях.

Если оба признаются, то будут осуждены на длительный срок, но с учетом смягчающего обстоятельства (добровольного признания) каждый получит срок 5 лет (выигрыш (потери) каждого оценим в –5).

Если оба не сознаются, то за отсутствием улик обвинение в тяжком преступлении будет снято, но следствие сможет доказать виновность игроков в менее тяжком преступлении, в результате чего оба получат срок в 1 год (выигрыш (потери) каждого оценим в –1).

Если в участии в преступлении сознается один из игроков, то ему удается свалить всю вину на другого. В результате сознавшийся выходит на свободу (выигрыш (потери) 0), а его упорствующий соучастник получит полную меру возмездия – срок 10 лет (выигрыш (потери) –10).

Запишем функции выигрышей (потерь) игроков в рассмотренной игре.

Пусть П – признание, Н – непризнание, H1 – выигрыш 1-го игрока, H2 – выигрыш 2-го игрока.

H1 (П, П) = H2 (П, П) = –5 ,

H1 (П, П) = H2 (П, П) = –1,

H1 (П, Н) = H2 (H, П) = 0,

H1 (H, П) = H2 (П, Н) = –10.

В матричной записи, где строки соответствуют стратегиям 1-го, а столбцы стратегиям 2-го игрока, имеем

9

H1

=

 

5

0

H2

=

5

10

 

10

,

 

0

.

 

 

 

1

 

 

 

1

Ситуацией равновесия в данной игре оказывается ситуация (П, П), в которой каждый из игроков должен признаться. В этой ситуации каждый из игроков теряет 5, т. е. оказывается осужденным на 5 лет. В ситуации же (Н, Н), когда ни один не признался, потери каждого всего 1 (каждый осужден на 1 год). Однако данная ситуация явно неустойчива, так как каждый из игроков заинтересован отклониться от выбранной стратегии и признаться, рассчитывая свалить вину на другого и избежать наказания, сведя свои потери к 0 (при этом потери партнера составят 10).

Таким образом разумной стратегией для каждого игрока является признание, так как оно гарантирует игроку неполучение максимального срока в 10 лет. Хотя более «выгодной» кажется тактика непризнания, дающая возможность получения незначительного наказания (срок

в1 год), однако чреватая неожиданностью в виде максимального срока

в10 лет в случае признания со стороны соучастника.

6. Стратегическая эквивалентность игр

Разнообразие бескоалиционных игр делает желательным объединение их в такие классы, внутри которых игры обладают одними и теми же свойствами. В качестве таких классов можно взять классы стратегически эквивалентных игр.

Определение 6. Пусть есть две бескоалиционной игры Г′ и Г′′ с одними и теми же множествами игроков и их стратегий, отличающиеся лишь функциями выигрыша:

Г′ = < I, {Si }i I , {Hi}i I >

Г′′ = < I, {Si }i I , {Hi′′}i I > ,

и пусть существует k > 0, а для каждого игрока существует вещественное Ci такое, что в любой ситуации s

Нi(s) = k Hi′′(s) + ci .

Тогда игры Г′ и Г′′ называются стратегически эквивалентными.

Стратегическая эквивалентность игры Г′ игре Г′′ обозначается

Г′ ~ Г′′.

10