Добавил:

Ravochking Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Кузбасский государственный технический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

1danilovtseva_e_r_farafonov_i_g_d_yakova_g_n_teoriya_igr_osno

.pdf

Скачиваний:

Добавлен:

29.10.2019

Размер:

323.91 Кб

Скачать

☆

1 / 41 2 3 4 > Следующая >>>

МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ

Санкт-Петербургский государственный университет аэрокосмического приборостроения

Е.Р. Даниловцева, В. Г. Фарафонов,

Г.Н. Дьякова

ТЕОРИЯ ИГР. ОСНОВНЫЕ ПОНЯТИЯ

Текст лекций

Санкт-Петербург 2003

УДК 519.8 ББК 22.18 Д18

Даниловцева Е. Р., Фарафонов В. Г., Дьякова Г. Н.

Д18 Теория игр. Основные понятия: Текст лекций/ СПбГУАП. СПб., 2003, 36 с.: ил.

В тексте лекций излагаются основные понятия теории игр. Подробно рассмотрена теория антагонистических игр. Разобраны примеры решения матричных игр.

Текст лекций предназначен для студентов, обучающихся по специально-

сти “Математические методы в экономике”.

Рецензенты: кафедра высшей математики

Санкт-Петербургского государственного университета аэрокосмического приборостроения;

доцент Ю. П. Данилов

Утверждено редакционно-издательским советом университета

в качестве текста лекций

Учебное издание

Даниловцева Елена Рафаиловна

Фарафонов Виктор Георгиевич Дьякова Галина Николаевна

ТЕОРИЯ ИГР. ОСНОВНЫЕ ПОНЯТИЯ

Текст лекций

Редактор А. В. Подчепаева

Компьютерная верстка М. А. Даниловой

Подписано к печати 26.09.03. Формат 60×84 1/16. Бумага офсетная. Печать офсетная. Усл. печ. л. 2,32. Уч. -изд. л. 2,13. Тираж 100 экз. Заказ №

Редакционно-издательский отдел Отдел электронных публикаций и библиографии библиотеки

Отдел оперативной полиграфии СПбГУАП

190000, Санкт-Петербург, ул. Б. Морская, 67

1.Конфликт – предмет рассмотрения теории игр

Вприроде и обществе часто встречаются явления, в которых те или иные участники имеют несовпадающие интересы и располагают различными путями для достижения своих целей. Такие явления называются конфликтами. Конфликты являются предметом рассмотрения теории игр.

Под конфликтом будем понимать всякое явление, применительно к которому можно говорить:

кто и как в этом явлении участвует; каковы возможные исходы этого явления;

кто в этих исходах заинтересован и в чем эта заинтересованность состоит. Рассмотрим возможные причины возникновения конфликтов. Одна из характерных черт всякого общественного, социально-эконо-

мического явления состоит в множественности, многосторонности интересов и в наличии сторон, выражающих эти интересы. Например:

продавец и покупатель, имеющие противоположные интересы; несколько производителей, фигурирующих на рынке и обладающих

достаточной силой воздействия на цену товара, имеющих в связи с этим как противоположные, так и совпадающие интересы;

объединения или коалиции лиц, участвующих в столкновении интересов, как в случаях определения ставок заработной платы союзами или объединениями рабочих и предпринимателей, голосования в парламенте и т. д.

Конфликт может возникать также из различия целей, которые отражают не только несовпадающие интересы, но многосторонние интересы одного и того же лица. Например:

конструктор согласует противоречивые технико-экономические требования в процессе конструирования изделия: минимизация габаритов, минимизация стоимости, максимизация надежности, простота в обращении; разработчики экономической политики согласуют противоречивые требования, предъявляемые к ситуации: рост объемов производства,

повышение доходов, снижение экологической нагрузки и т. д.; Конфликт может проявиться не только в результате сознательных

действий различных участников, но и как результат действия тех или иных «стихийных сил» (случай так называемых «игр с природой»).

Прямо противоположные интересы различных сторон явно проявляются в непосредственной борьбе: военной, дипломатической, экономической, спортивной.

Наконец, примерами конфликтных ситуаций являются обычные игры: салонные, карточные, шахматные, морской бой и т. д.

Для конфликта характерно следующее:

ни один из его участников заранее не знает решений, принимаемых остальными участниками, т. е. вынужден действовать в условиях неопределенности;

ход событий в конфликте зависит от решений, принимаемых каждой из сторон, поэтому поведение любого участника конфликта, если оно разумно, должно определяться с учетом возможного поведения всех его участников.

Подводя итог сказанному, отметим, что общим, объединяющим все конфликты, независимо от их физической и социальной природы, является:

1)столкновение интересов нескольких (двух или более) сторон, в том числе сознательных индивидуумов или природы;

2)преследование сторонами различных целей;

3)наличие наборов альтернатив для достижения этих целей, каждая из которых приводит к одному (или к одному из нескольких) возможных исходов.

2. Понятие игры. Классификация игр. Формальное представление игр

Игрой называется математическая модель конфликта. Математическая модель конфликта должна отражать присущие ему черты, а значит, должна описывать:

множество заинтересованных сторон (игроков); возможные действия каждой из сторон (стратегии и ходы);

интересы сторон, представленные функциями выигрыша ( платежа) для каждого из игроков.

В теории игр предполагается, что функции выигрыша и множество стратегий, доступных каждому из игроков общеизвестны, т. е. каждый из игроков знает свою функцию выигрыша и набор имеющихся в его распоряжении стратегий, а так же функции выигрыша и стратегии всех остальных игроков. В соответствии с этой информацией каждый из игроков организует свое поведение.

Различные виды игр можно классифицировать следующим образом: по числу игроков; по числу стратегий;

по свойствам функции выигрыша; по возможности предварительных переговоров и взаимодействия

между игроками в ходе игры.

По числу игроков различают игры с двумя, тремя и более участниками. В принципе возможны так же игры с бесконечным числом игроков.

По числу стратегий различают конечные и бесконечные игры. В конечных играх игроки располагают конечным числом возможных стратегий. Например, в игре в орлянку у игроков по две стратегии – «орел» или «решка». В бесконечных играх игроки имеют бесконечное число возможных стратегий. Например, при взаимодействии продавца и покупателя каждый из игроков может назвать любую цену и любое количество продаваемого (покупаемого) товара.

По свойствам функции выигрыша различают игры:

снулевой суммой, когда выигрыш одного игрока равен проигрышу другого, т. е. налицо прямой конфликт между игроками;

спостоянной разностью, в которых игроки и выигрывают, и проигрывают одновременно, так что им выгодно действовать сообща;

сненулевой суммой, где есть и конфликты, и согласованные действия игроков.

По возможности предварительных переговоров и взаимодействия между игроками в ходе игры различают кооперативные и некооперативные игры. Игра называется кооперативной, если до начала игры игроки образуют коалиции и принимают взаимообязывающие соглашения о своих стратегиях (например, образование коалиций в парламенте перед голосованием по некоторым вопросам).

Игра, в которой игроки не могут координировать свои стратегии подобным образом, называется некооперативной (например, все игры с нулевой суммой).

Рассмотрим примеры формального представления игр.

Обозначим через I множество всех игроков, через Si – множество возможных действий игрока i (i I), называемое множеством стратегий.

Например:

а) игра в орлянку

I = {1, 2}, Si = {Орел, Решка}; б) голосование в парламенте

I = {1, 2, …, n}, где n – число голосующих, Si = {За, Против, Воздержался};

в) взаимодействие на рынке двух продавцов

I = {1, 2} Si = {Pi: Pi > 0}, где Pi – цена продаваемого товара.

Впартии игроки выбирают каждый свою стратегию si Si, в результате чего складывается набор стратегий s = (s1, s2,…,sn), называемый

ситуацией.

Врассмотренных выше примерах приведем возможные ситуации: а) (Орел, Орел), (Орел, Решка), (Решка, Орел), (Решка, Решка); б) (За, За, Против, За, Воздержался, …, Против); в) (5 рублей, 3 рубля), (5 рублей, 7 рублей).

Заинтересованность игроков в конкретных ситуациях проявляется в

том, что каждому игроку i в каждой ситуации s присваивается число, выражающее степень удовлетворения его интересов в данной ситуации. Это число называется выигрышем игрока i и обозначается H i(s).

Вернемся к указанным выше примерам. В игре в орлянку:

H1(Орел, Орел) = H1(Решка, Решка) = 1,

H1(Орел, Решка ) = H1(Решка, Орел ) = –1,

H2(Орел, Орел) = H2(Решка, Решка) = –1,

H2(Орел, Решка) = H2(Решка, Орел) = 1.

Видно, что в любой ситуации H1 + H2 = 0.

Запишем это в виде матрицы выигрышей, где строки будут соответствовать стратегиям 1-го игрока, столбцы – стратегиям 2-го игрока.

H1		1	−1	H2		−1	1
H1	=	−1	,	H2	=	1	.
		−1	1			1	−1

При этом или H1 + H2 = 0.

Таким образом, орлянка является примером игры с нулевой суммой. При голосовании в парламенте:

	10,	если проголосовавших “За” больше, чем проголосовав-
	10,
		ших “Против” (вопрос прошел),
		если проголосовавших “За” меньше, чем проголосовав-
	Hi =	если проголосовавших “За” меньше, чем проголосовав-
	Hi =
	−7,	ших “Против” (вопрос не прошел),
		для участников голосования i = 1, 2, …, k (членов од-
		ной коалиции);
		ной коалиции);

10,		если проголосовавших “За” больше, чем проголосовавших
10,
		“Против” (вопрос прошел),
		если проголосовавших “За” меньше, чем проголосовавших
Hi =	5,	если проголосовавших “За” меньше, чем проголосовавших
Hi =
		“Против” (вопрос не прошел),
		для участников голосования i = k + 1, …, n (членов другой

коалиции).

В случае взаимодействия на рынке двух продавцов предположим, что потребитель приобретет товар у фирмы, объявившей меньшую цену, или распределит свой спрос поровну между фирмами в случае, если цены равны.

Если d(p) – функция спроса в зависимости от цены на товар, то функция выигрыша:

		p d( p ),		p	< p ,
		1	1	1	2
1-й фирмы	H1( p1, p2 ) =	1/ 2 p1 d( p1),		p1 = p2 ,
				1	2
		0,		p	> p ;
		0,		p1 < p2 ,
	H2 ( p1, p2 ) =		p1 d( p1), p1 = p2 ,
2-й фирмы	H2 ( p1, p2 ) =	1/ 2	p1 d( p1), p1 = p2 ,
		p d( p ),		p > p .
		2	2	1	2

3. Определение бескоалиционной игры

Бескоалиционной игрой будем называть такую игру, в которой целью каждого игрока является получение по возможности большего индивидуального выигрыша.

Обозначим:

I – множество всех игроков. Далее будем считать I конечным. Обычно принято различать игроков по номерам, т. е. считать I = {1, 2, …, n};

Si – множество стратегий игрока i I, т. е. множество возможных действий, имеющихся в распоряжении игрока i. Считается, что Si содержит не менее двух возможных стратегий, иначе его действия заранее определены.

Процесс игры состоит в выборе каждым из игроков одной своей стратегии si S. Таким образом, в результате каждой партии игры складывается система стратегий s = (s1, s2,…,sn), которая называется ситуацией.

Множество всех ситуаций S = S1 S2 ... Sn , т. е. S является декартовым произведением множеств стратегий всех игроков. Обозначим: Hi(s)

– выигрыш игрока i в ситуации s. Функция Hi , определенная на множестве всех ситуаций, называется функцией выигрыша игрока i.

Hi: S → R, т. е. каждой ситуации s S Hi – сопоставляет вещественное число.

Определение 1. Бескоалиционной игрой называется система

Г = < I, {Si }i I , {Hi }i I >, в которой I и Si (i I) являются множествами, а Hi – функции на множестве S = S1 × S2 ×... × Sn , , принимаю-

щие вещественные значения.

Определение 2. Бескоалиционная игра Г = < I, {Si }iI , {Hi }iI >, называется игрой с постоянной суммой, если существует такое посто-

янное число C, что ∑Hi (s) = C s S, т. е. сумма выигрышей игро-

ков постоянна в любой ситуации.

4. Приемлемые ситуации и ситуации равновесия

Ситуацию s в игре Г естественно считать приемлемой для игрока i, если этот игрок, изменяя в ситуации s свою стратегию на какую-либо другую, не может увеличить этим своего выигрыша.

Пусть s = (s1, s2 , ..., si−1, si , si+1, ..., sn ) – произвольная ситуация в игре , а si – некоторая стратегия игрока i.

Рассмотримновуюситуацию s si′ = (s1, s2 , ..., si−1, si′, si+1,..., sn ),получившуюся из ситуации s заменой стратегии si игрока i на si′ . Очевидно,

что s si′ = s, если si′ совпадает с si (si′ = si ).

Определение 3. Ситуация s в игре Г называется приемлемой для

игрока i, если Hi (s si′) ≤ Hi (s), si′ Si .

Смысл названия «приемлемая» состоит в том, что, если в некоторой

ситуации		s	для	игрока i найдется такая стратегия si′, что
Hi (s	si′ )	>	Hi (s),	то игрок i в случае складывающейся ситуации s

может получить больший выигрыш, выбирая si′, вместо si. В этом смысле ситуация s для игрока может считаться неприемлемой.

Определение 4. Ситуация s называется ситуацией равновесия (или равновесной ситуацией), если она приемлема для всех игроков, т. е.

Hi (s si′) ≤ Hi (s), i, si′ Si .

Из определения видно, что в ситуациях равновесия и только в них ни один игрок не заинтересован в отклонении от своей стратегии.

Определение 5. Равновесной стратегией игрока в бескоалиционной игре называется такая его стратегия, которая входит хотя бы в одну из равновесных ситуаций игры.

Процесс нахождения ситуаций равновесия в бескоалиционной игре называется решением игры.

5. Пример «Дилемма заключенных»

Предположим, игроками 1 и 2 являются преступники, находящиеся в предварительном заключении по подозрению в тяжком преступлении. Прямых улик против них нет, и возможность их обвинения в значительной мере зависит от того, сознаются ли преступники сами.

Имеем I = {1, 2}, Si = {Признаться, Не признаться}. Определим заинтересованность игроков в различных ситуациях.

Если оба признаются, то будут осуждены на длительный срок, но с учетом смягчающего обстоятельства (добровольного признания) каждый получит срок 5 лет (выигрыш (потери) каждого оценим в –5).

Если оба не сознаются, то за отсутствием улик обвинение в тяжком преступлении будет снято, но следствие сможет доказать виновность игроков в менее тяжком преступлении, в результате чего оба получат срок в 1 год (выигрыш (потери) каждого оценим в –1).

Если в участии в преступлении сознается один из игроков, то ему удается свалить всю вину на другого. В результате сознавшийся выходит на свободу (выигрыш (потери) 0), а его упорствующий соучастник получит полную меру возмездия – срок 10 лет (выигрыш (потери) –10).

Запишем функции выигрышей (потерь) игроков в рассмотренной игре.

Пусть П – признание, Н – непризнание, H1 – выигрыш 1-го игрока, H2 – выигрыш 2-го игрока.

H1 (П, П) = H2 (П, П) = –5 ,

H1 (П, П) = H2 (П, П) = –1,

H1 (П, Н) = H2 (H, П) = 0,

H1 (H, П) = H2 (П, Н) = –10.

В матричной записи, где строки соответствуют стратегиям 1-го, а столбцы стратегиям 2-го игрока, имеем

H1	=	− 5	0	H2	=	−5		−10
		−10	,				0	.
			−1					− 1

Ситуацией равновесия в данной игре оказывается ситуация (П, П), в которой каждый из игроков должен признаться. В этой ситуации каждый из игроков теряет 5, т. е. оказывается осужденным на 5 лет. В ситуации же (Н, Н), когда ни один не признался, потери каждого всего 1 (каждый осужден на 1 год). Однако данная ситуация явно неустойчива, так как каждый из игроков заинтересован отклониться от выбранной стратегии и признаться, рассчитывая свалить вину на другого и избежать наказания, сведя свои потери к 0 (при этом потери партнера составят 10).

Таким образом разумной стратегией для каждого игрока является признание, так как оно гарантирует игроку неполучение максимального срока в 10 лет. Хотя более «выгодной» кажется тактика непризнания, дающая возможность получения незначительного наказания (срок

в1 год), однако чреватая неожиданностью в виде максимального срока

в10 лет в случае признания со стороны соучастника.

6. Стратегическая эквивалентность игр

Разнообразие бескоалиционных игр делает желательным объединение их в такие классы, внутри которых игры обладают одними и теми же свойствами. В качестве таких классов можно взять классы стратегически эквивалентных игр.

Определение 6. Пусть есть две бескоалиционной игры Г′ и Г′′ с одними и теми же множествами игроков и их стратегий, отличающиеся лишь функциями выигрыша:

Г′ = < I, {Si }i I , {Hi′}i I >

Г′′ = < I, {Si }i I , {Hi′′}i I > ,

и пусть существует k > 0, а для каждого игрока существует вещественное Ci такое, что в любой ситуации s

Нi′(s) = k Hi′′(s) + ci .

Тогда игры Г′ и Г′′ называются стратегически эквивалентными.

Стратегическая эквивалентность игры Г′ игре Г′′ обозначается

Г′ ~ Г′′.

1 / 41 2 3 4 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
29.10.20192.28 Mб1251chernov_s_a_istoriya_i_filosofiya_nauki.pdf
#
29.10.2019608.25 Кб861chernyaeva_a_s_istoriya_i_filosofiya_nauki_struktura_nauchno-1.pdf
#
29.10.2019608.25 Кб51chernyaeva_a_s_istoriya_i_filosofiya_nauki_struktura_nauchno.pdf
#
19.11.20192.58 Mб171chesnokov_g_d_sud_ba_ratsionalizma_v_istorii_filosofii_novog.pdf
#
19.11.2019378.76 Кб251chigrina_e_v_semeynoe_pravo.pdf
#
29.10.2019323.91 Кб51danilovtseva_e_r_farafonov_i_g_d_yakova_g_n_teoriya_igr_osno.pdf
#
29.10.2019929.8 Кб981dodel_tsev_r_f_kratkaya_istoriya_filosofii_nauki.pdf
#
19.11.20191.07 Mб331dukhno_n_a_sudenko_v_e_ugolovnoe_pravo_obshchaya_chast.pdf
#
19.11.20192.51 Mб291dyad_kin_d_s_teoretiko_metodologicheskie_osnovy_naznacheniya.pdf
#
19.11.20191.1 Mб51dyomin_i_v_filosofiya_nauki_i_tekhniki (1)-1.pdf
#
29.10.20191.1 Mб61dyomin_i_v_filosofiya_nauki_i_tekhniki (1).pdf