Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

основы теории игр

.doc
Скачиваний:
42
Добавлен:
26.03.2016
Размер:
187.39 Кб
Скачать

Основы теории игр

Наша задача в изучении теории игр

Знать основные определения, параметры и понятия игры: число игроков, множество ходов каждого игрока, правила, исходы и платежи игры

Знать формы представления игры:

1) стратегическая (нормальная);

2) развернутая (экстенсивная).

Владеть использованием терминов «полная и совершенная информация»; «доминирующая стратегия»; «статические, динамические и повторяемые игры»

Уметь находить равновесия различных типов в игре двух игроков (только для чистых стратегий)

БАЗОВЫЕ ПОНЯТИЯ ТЕОРИИ ИГР

1. Мы будем рассматривать минимальное число игроков равное двум. Дополнительно в число игроков может быть включена «природа» - условный игрок, который определяет экзогенные параметры модели, например, величину спроса (большой или маленький) в игре фирм на одном рынке,

2. Цель игры для каждого игрока состоит в получение максимально возможного платежа с учетом стратегий других агентов.

3. Игрок выбирает свою стратегию из числа возможных стратегий. Стратегия (si)– это план всей игры.

4. Мы будем рассматривать для каждого игрока только две различные стратегии. Пара конкретных стратегий определяет исход игры, когда игроки получают платежи.

5. Стратегическая (нормальная) форма игры для двух игроков – это представление игры как таблицы платежей, называемой «платежная функция» (u1i; u2j), где строки определяется стратегиями первого игрока (s1i), а столбцы стратегиями второго игрока (s2j).

Стратегии игроков

2-й игрок

S21

S22

1-й игрок

S11

1 ; 1

3 ; 0

S12

0 ; 3

2 ; 2

6. Развернутая (экстенсивная) форма игры – представляет игру в зависимости от хода игроков в виде дерева игры (и позволяет рассматривать более наглядно случаи, когда число игроков больше двух)

7. Детерминированный план игрока называется чистой стратегией (в отличие от смешенной стратегии, когда в повторяемой игре игрок случайным образом меняет стратегии с определенной вероятностью).

8. Дополнительно: если существует не две а n стратегий и они применяются с определенными вероятностями pi (i=1, ..n), то стратегия называется смешанной

9. Набор стратегий игроков (s1i, s2j) приводит к определенному исходу игры. 10. 10. Число различных наборов стратегий определяет число исходов игры.

11. В игре двух игроков с двумя стратегиями стратегия совпадает с ходом игрока.

12. Доминирующая стратегия (ДС) – это оптимальный план в игре без соглашений.

13. ДС обеспечивает оптимальный (наилучший) план игры, не зависящий от стратегий других игроков. ДС существует не всегда и не для всех игроков, а если существует, то не обязательно приводит к максимальному платежу.

ПРАВИЛА ИГРЫ.

14. Игроки могут делать свой ход

-         одновременно (статическая игра) или

-         последовательно (динамическая игра).

15. Если при заданных правилах игра повторяется – это повторяемая игра.

16. Шаг игры определяется последовательностью ходов. В статичной игре шаг игры равен единице, в динамической игре число шагов игры равно числу игроков, потому что все ходят по очереди.

17. Повторяемая игра может разыгрываться конечное или бесконечное число раз.

ИНФОРМАЦИЯ и ВЫБОР СТРАТЕГИЙ (или ИГРА)

18. Полная информация означает знание всеми игроками платежный функций (и других экзогенных параметров модели, если они заданы).

19. Совершенная информация (в динамической игре) – означает знание предыстории игры (то есть всех предыдущих ходов).

20. Выбор хода основывается на стратегии игрока.

21. Оптимальная стратегия игрока определяется целью максимизации платежа игры и зависит от стратегий остальных игроков и от наличия соглашений (или обязательств или выбора фокальной точки).

22. Соглашения элиминируют часть стратегий игроков и позволяют достичь исхода игры с более высокими платежами (например соглашение « не признаваться» в игре «дилемма заключённых).

23. В повторяемых играх возможно применение смешанных стратегий. Например, если равновесие в чистых стратегиях отсутствует, то чистые стратегии используются с определенными вероятностями при повторении игры для достижения оптимальных исходов (максимально достижимого выигрыша для каждого игрока).

24. Оптимальная стратегия игрока в повторяемой игре (если она существует) максимизирует дисконтированную сумму платежей.

СМ. также Литературу

Повторяем: Описание игры

Правила игры определяют порядок ходов и платежи (u1i; u2j) для каждой комбинации стратегий (S1i, S1i)

Стратегическая, нормальная форма игры для двух игроков – представляет игру как таблицу платежей: в i-той строке при i-той стратегии первого игрока (S1i), а в j-том столбце - второго (S2j).

Развернутая (экстенсивная) форма игры – представляет варианты хода игроков в виде дерева игры

Стратегия игрока– это план игры

Чистая стратегия (S) – это детерминированный план

Смешанная стратегия – набор планов Si, с определенной вероятностью применения pi (∑pi =1)

Доминирующая стратегия – это оптимальный план в игре без соглашений, он обеспечивает лучшие ответы при любых стратегиях других игроков

Стратегическая, нормальная форма игры.

Дилемма заключенных

Двое (1-й и 2-й) подозреваются в преступлении, за которое им грозит до 5 лет тюремного заключения. Они находятся в заключении в различных камерах.

От их поведения зависит сокращение сроков заключения. 1-й размышляет: «Если 2-й решит …».

2-й

S21, ДС

S2

1-й

S11, ДС

1 ; 1

N

3 ; 0

P

S12

0 ; 3

P

2 ; 2

Popt

Дилемма заключенных – это статическая игра. Существует множество прикладных трактовок этой игры ( в том числе конкуренция фирм на рынке).

Множество ходов в данном случае для обоих игроков одинаковое: {признавать вину; не признавать вину}. Стратегия здесь совпадает с ходом.

Существует 4 исхода игры– различные сочетания «признаний» или «не признаний» 1-го и 2-го подозреваемых (на основании серьезных улик.

«Признавать вину» - доминирующая стратегия для 1-го подозреваемого, потому что сокращение срока в этом случае на 1 год (если напарник тоже признается), или 3 года (если 2-й не признается).

2-й размышляет таким же образом и приходит к такому же выводу в этой игре: «признавать вину» - доминирующая стратегия

Две доминирующие стратегии пересекаются в исходе игры: «признавать; признавать».

Обратите внимание, что более благоприятный для преступников исход (2; 2) – сокращение срока на 2 года при непризнании вины, остается недоступным, потому что возможность соглашения (сговора) отсутствует.

Статические, динамические и повторяемые игры

Каждому набору стратегий игроков (S1i, S2j) соответствует определенный исход и платёж игры (u1i; u2j). Число различных наборов стратегий определяет число исходов игры.

Игроки могут делать ход одновременно (статическая игра) или последовательно (динамическая игра).

Если при заданных правилах игра повторяется – это повторяемая игра. В повторяемых играх возможно применение смешанных стратегий, например, когда равновесие в чистых стратегиях отсутствует и чистые стратегии используются с определенными вероятностями при повторении игры (для достижения равновесия)

Развернутая форма - дерево игры (Дилемма заключенных)

N (natura) – «природа» или экзогенные данные (здесь - о сроке заключения 5 лет, который они получили бы при наличии прямых улик). и «платежах», то есть снижении срока в зависимости от поведения подозреваемых)

В дилемме заключенных игроки имеют полную информацию, то есть знают все о состоянии «природы» и платежной функции игры.

В момент хода 1-й игрок не знает хода 2-го игрока (потому что сговор отсутствует). 2-й игрок не знает на которой ветке дерева он находится, потому что игра статическая.

Каждый анализирует платежную функцию (матрицу) и определяет свою доминирующую стратегию. В модели «дилемма заключенных» ДС существует для каждого игрока

Полная и совершенная информация

Полная информация означает знание всеми игроками платежной функции всех игроков

Совершенная информация – означает знание всех предыдущих ходов, т.е предыстории игры

Шаг игры определяется последовательностью ходов. В статичной игре шаг игры равен единице, в динамической игре число шагов игры равно числу игроков.

Оптимальная стратегия игрока определяет наилучший платёж и зависит от стратегий остальных игроков и от наличия информации и соглашений (или обязательств).

Соглашения элиминируют часть стратегий и позволяют достичь исхода игры с более высокими платежами

Типы равновесий

Равновесие доминирующих стратегий – исход игры при наличии доминирующих стратегий всех игроков

Равновесие по Нэшу определено двумя условиями:

u1(S1*; S2*) ≥ u1 (S1; S2*), где S1 ≠S1*

u2(S1*; S2*) ≥ u2 (S1*; S2), где S2 ≠S2*

Равновесие по Штакельбергу – это оптимальный исход в динамической, последовательной игре

Равновесие по Парето – исход игры, когда не существует другого исхода, где платежи обоих игроков не ниже, чем исходные

Свойства игр и равновесий

Теорема: Совокупность доминирующих стратегий всегда обеспечивает равновесие Нэша и равновесия Штакельберга: St1, St2 (обратное неверно)

Теорема: Единственный исход, где платеж любого из игроков имеет строгий максимум является Парето-равновесным. Не все Парето-равновесия могут исчерпываться условием теоремы.

В равновесии по Нэшу (S1*; S2*) ни одному из игроков не выгодно отклониться, т.е. выбрать другую стратегию, когда остальные игроки не отклоняются

В динамической игре Штакельберга последующий игрок знает предыдущие ходы (предысторию игры).

Еще раз повторяем: ТИПЫ СТРАТЕГИЙ

Доминирующая стратегия - наилучшая стратегия, независящая от выбора остальных игроков стратегия (существует не всегда).

Доминирующая стратегия всегда является максминной (обратное неверно)

Максминная стратегия – стратегия, максимизирующая минимальный выигрыш (существует не всегда).

ТИПЫ РАВНОВЕСИЯ (равновесие – это оптимальный исход игры, зависящий от правил игры, стратегий и платежной матрицы):

Равновесие доминирующих стратегий – равновесие при условии их существования у всех игроков

Равновесие по Нэшу определено двумя условиями на платежи и стратегии:

u1(S1*; S2*) ≥ u1 (S1; S2*), где S1 ≠S1*

u2(S1*; S2*) ≥ u2 (S1*; S2), где S2 ≠S2*

Равновесие по Нэшу означает, что ни одному игроку не выгодно изменить стратегию (отклониться от равновесия) в одностороннем порядке

Равновесие по Штакельбергу – это оптимальный исход в динамической, последовательной игре

Равновесие по Парето – исход игры, когда не существует другого исхода, где платежи обоих игроков не ниже, чем исходные

ПРИМЕРЫ

2-я фирма

Рекламировать ДС, МахМин

Не рекламировать

1-я

фирма

Рекламировать, ДС,

МахМин

10 ; 5

N, P, St1, St2

15 ; 0

P

Не рекламировать

6 ; 8

P

10 ; 2

Игра на опережение и риски: захват рынка

2-й

Входить

Не входить, МахМин

1-й

Входить

-10 ; -10

20 ; 0

N, St1, P

Не входить, МахМин

0 ; 20

N, St2, P

0 ; 0

Выбор стратегий в борьбе за власть

демократы

Социальный пакет

Борьба с коррупцией

республиканцы

Борьба за демократию

-5 ; -5

10 ; 10

N, P, St1, St2

Усиление армии

10 ; 10

N, P, St1, St2

-5 ; -5

Ожидания «экономической рациональности» игроков и максминная стратегия

Оппозиция

Left

Right, ДС, МахМин

Партия

власти

Top, МахМин

1 ; 0

1 ; 1

Bottom

-1000 ; 0

2 ; 1

N, P, St1, St2

Обоснованные и необоснованные угрозы

В статичной игре два равновесия по Нэшу. Какое равновесие будет выбрано? Рассмотрим стратегическое взаимодействие с применением понятия «угрозы».

Угрозой называется воздействие на ожидания конкурента.

Обоснованная угроза позволяет добиться желаемого исхода, а необоснованная угроза (неподтверждаемая анализом платежной матрицы при условии рациональности поведения конкурентов) не оказывает желаемого влияния.

Угроза партии власти. Предположим, что партия власти объявляет о необходимости поддержки олигархов для увеличения бюджета, т.е. угрожает выбрать стратегию «олигархи». Если бы оппозиция поверила угрозе и решила (максимизируя полезность) также выбрать стратегию «олигархи», то партия власти получила бы максимальную полезность. Однако эта угроза необоснована, потому, что у оппозиции существует контр-угроза, которой пария власти не будет пренебрегать.

Угроза оппозиции. Оппозиция угрожает широкомасштабной программой поддержки среднего класса, что привлечет голоса избирателей. Эта угроза является обоснованной, т.к. общественное мнение имеет значение, и грозит вероятной потерей власти на выборах

Оппозиция

Средний класс МахМин

Олигархи

Партия

власти

Средний класс МахМин

3 ; 6

N, P, St2

3 ; 0

Олигархи

1 ; 1

8 ; 3

N, P, St1

Платежные матрицы из учебника Олейника в оригинальной трактовке

Встреча в «фокальной точке»

Доминирующих стратегий здесь не существует.

Судя по полезности (по платежной функции) студенты надоели друг другу своей болтовней в комнате совместного проживания так, что больше полезности им приносит раздельная жизнь (вне комнаты). Первый явно любит кофе (или пиво), а второй книги.

Если 2-й ищет первого, лучшая стратегия искать его в кафе. Если 1-й ищет второго он найдет его в библиотеке.

Проблема в том, как же им встретится днем, если они договорились о встрече и о времени, но не оговорили места встречи?

Интуитивные рассуждения подсказывают нам, что при встрече в библиотеке второй не сможет заниматься, болтать там нельзя, а кафе – это общепринятое место встречи, и они независимо выбирают кафе как фокальную точку встречи. Выбор фокальной точки может быть основан на широко распространенной обычае, традиции, известных правилах действий в ситуации неопределённости.

2-й

библиотека

кафе

1-й

библиотека

1; 2

3 ; 3

N

кафе

4 ; 4

N, St1, St2, P

2 ; 1

Жесткий «конфликт интересов»

Две доминирующие стратегии приводят к выпуску экономистов, в то время на заводе больше востребованы менеджеры (завод их переучивает по необходимости)

Высшая школа

Экономисты, ДС

менеджеры

Завод

экономисты

1 ; 3

P

0 ; 0

Менеджеры, ДС

2 ; 2

N, St1, St2, P

3 ; 1

P

Дуополия (тип игры - дилемма заключенных)

Достижение исхода (3; 3) возможно только при наличии картельного соглашения, но картель неустойчив, потому, что каждая может пытается отклониться в одиночку, чтобы получить большой размер платежа

Фирма 2

Большой выпуск, ДС

Малый выпуск

Фирма 1

Большой выпуск, ДС

2 ; 2

N, St1, St2

4 ; 1

P

Малый выпуск

1 ; 4

P

3 ; 3

P

Мягкий конфликт интересов (координация действий)

Если министерство следует своей доминирующей стратегии, т.е. обещает повысить зарплату учителям, то доминирующие стратегии поведения обоих агентов «приводят к равновесию» (3;3), но денег не хватает и зарплату повысят только пенсионерам.

Министерство образования «соглашается» на исход (3; 4) повышение пенсий, потому что «переговорная сила» у Думы выше, она «делит» бюджет, пенсионеров больше – а это электорат. Кроме того, у министров тоже есть родственники-пенсионеры.

Дума

Повысить пенсии, ДС

Зарплату учителям

Мин. обр.

Повысить пенсии

3; 4

St2, P

1 ; 1

Зарплату учителям, ДС

3 ; 3

N

4 ; 2

St1, P

Угроза войны и проблема разоружения

Производство ядерной энергии в мирных целях очень легко перевести в производство ядерного оружия, и это соображение использует страна А, решая объявлять или не объявлять войну стране Б.

Страна Б имеет доминирующую стратегию « не производить ядерное оружие», кроме того исход (4;2) является равновесием по Нэшу и равновесием в последовательной игре Штакельберга St1 (страна А объявляет войну, страна Б выбирает «не производить») – возможно это случай Ирака

Если бы страна Б в игре Штакельберга сделала первый ход, начав производить ядедное топливо, то оптимальным выбором страны А было бы «не объявлять войну» - возможно это случай Ирана

Страна Б

Производить ядерное топливо

Не производить ядерное топливо

Страна А

Объявить войну

1 ; 1

4 ; 2

N, St1, P

Не объявлять

3 ; 3

St2, P

2 ; 4

Доллары в коробке - игра-угадайка

Это статичная игра. Правила игры:

каждый игрок имеет в начале игры по 2 доллара, и они кладут по одному доллару в коробку, которая передается одному из игроков.

У него два возможных хода (бросить в колодец или нет). Если другой игрок предугадает ход, то получит доллар, если не угадает, то отдаст. Если коробку не бросят в колодец, то сумму разделят пополам.

При повторяемой игре долгое бросание долларов в колодец может принести прибыль. Если достать их через 200 лет, то их можно продать за большие деньги. Это похоже на совместное инвестирование в долгосрочные проекты, типа добывания полезных ископаемых на Луне.

Невозможность точного угадывания приводит к отсутствию равновесия в статичной игре. В случае повторяемой игры необходимо анализировать смешанные стратегии

Игра Штакельберга, т.е. случай динамической игры, где игрок наблюдает результат- «бросил или не бросил») не имеет смысла.

2-й

Бросит в колодец

Не бросит

1-й

Бросит в колодец

0 ; 2

2 ; 0

Не бросит

3 ; 1

St2, P

1 ; 3

St1, P