- •Министерство образования российской федерации челябинский государственный университет миасский филиал с.С.Саитгараев
- •Учебное пособие
- •Isbn 5-7271-0505-6
- •1. Теоретические основы предмета "теория игр"
- •1.1. Предмет теории игр, ее цели и задачи
- •1.2. Основные понятия теории игр
- •1.3. Классификация игр
- •1.4. Предпочтение и полезность. Бинарные соотношения как средство описания предпочтительности исходов
- •1.5. Способы описания игр
- •1.6. Классификация и учет неопределенностей
- •2. Конечные парные игры с нулевой суммой 2.1. Платежная матрица. Некоторые примеры конечных игр
- •2.2. Нижняя и верхняя цена игры
- •2.3. Проблема равновесия в игре
- •2.4. Смешанные стратегии
- •3. Методы решения конечных игр в смешанных стратегиях 3.1. Постановка вопроса
- •3.2. Аналитический метод решения игры 2x2, 2хш и nx2
- •3.4. Общие методы решения конечных игр. Приведение матричной игры к задаче линейного программирования
- •3.5. Приближенные методы решения игр
- •4. Методы решения некоторых бесконечных игр
- •5. Биматричные бескоалиционные игры 5.1. Постановка биматричных игр
- •5.2. Ситуации равновесия и поведение участников биматричных игр
- •5.3. Решение биматричных игр
- •5.4. Почти антагонистические игры
- •6. Биматричные коалиционные игры
- •6.1. Проблемы и формы кооперирования
- •6.2. Парето-оптимальные решения кооперативных игр. Модель игры с угрозами
- •6.3. Общие методы решения кооперативных игр. Характеристические функции
- •6.4. Дележи в кооперативных играх. Принципы формирования справедливых решений. Аксиомы Нэша
- •7. Элементы теории статистических решений
- •7.1. Постановка задачи
- •7.2. Решение состязательных задач в играх с природой
- •7.3. Задача оптимизации систем в условиях неопределенности
- •Саитгараев Сабит Сагитович Элементы теории игр Учебное пособие
- •Задания по теме «Теория игр»
2. Конечные парные игры с нулевой суммой 2.1. Платежная матрица. Некоторые примеры конечных игр
Конечная игра nxm, описанная в нормальной форме, может быть представлена платежной матрицей, приведенной на рис. 1.4. Элементами этой матрицы является пара чисел, первое из которых W1ij определяет величину выигрыша игрока 1 (игрока А) при применении этим игроком i-й стратегии, игроком 2 (игроком В) - j-й стратегии. Второе число W2ij определяет выигрыш игрока 2 (игрока В) при применении игроками тех же стратегий. Для упрощения записи выигрыш игрока А при i-й стратегии игрока А и j-й стратегии игрока В обозначается ay, выигрыш игрока В при тех же стратегиях - by, сами стратегии записывают в виде А и Вj, соответственно.
Как было отмечено в разделе 1 .3, существуют игры, в которых общая сумма выигрышей игроков равна нулю, т. е. выигрыш одного из игроков равен проигрышу (возможно и поражению) другого, т. е. налицо прямой конфликт между игроками. Такие игры называются играми с нулевой суммой или антагонистическими играми. В этих играх можно записать
aij + bij = 0, то есть aij = - by .
Рассмотрим парную конечную игру с нулевой суммой. Пусть игрок А располагает n личными стратегиями, которые обозначим A1, A2,..., An, игрок В - m личными стратегиями, обозначим их B1, Вт. Говорят, что игра имеет размерность nxm. В результате выбора игроками любой пары стратегий Ау и Bj (i = 1,n, j=1,m) однозначно определяется исход игры, т.е. выигрыш ау игрока А (положительный или отрицательный) и проигрыш (-aij) игрока В. Предположим, что значения ау известны для любой пары стратегий (Ai, Bj).
В такой ситуации, если игра представлена в нормальной форме, вполне достаточно исследовать платежную матрицу только игрока А, которая может быть представлена в виде, приведенном в табл. 2.1, либо в виде матрицы А = {ау}, i = 1,n; j = 1,m, элементами которой являются выигрыши aij, соответствующие стратегиям Ai и Bj.
Таблица 2.1
Платежная таблица игры nm Платежная матрица игры nxm
|
В1 |
В2 |
|
В1 |
|
Bm |
|
an |
a12 |
|
a1j |
|
|
A2 |
a21 |
a22 |
|
a2j |
|
|
|
|
|
|
|
|
|
Ai |
Ai1 |
ai2 |
|
aij |
|
aim |
|
|
|
|
|
|
|
An |
an1 |
an2 |
|
anj |
|
|
a11
a21
a12 a22
Ai1 ai2
an1 an2
a1j
a1n a2n
aim
anm
Рассмотрим несколько элементарных примеров игр.
Пример 2.1. Составим платежную матрицу для игры «поиск». Игрок А может спрятаться в одном из двух укрытий (I или II); игрок В ищет игрока А и если найдет, то получает штраф 1 ден. ед. от А, в противном случае платит 1 ден. ед. игроку А.
Необходимо построить платежную матрицу игры.
Решение. Для составления платежной матрицы следует проанализировать поведение каждого из игроков.
Рассмотрим возможные стратегии игроков:
А1 - игрок А прячется в укрытии I;
А2 - игрок А прячется в укрытии II;
81 - игрок В ищет игрока А в укрытии I;
82 - игрок В ищет игрока А в укрытии II.
Рассмотрим комбинации стратегий сторон и определим соответствующие выигрыши сторон:
А1-В1 - игрок А прячется в укрытии I и там его обнаруживает игрок В, игрок А платит штраф, т.е. аи = -1.
А1-В2 - игрок А прячется в укрытии I, игрок В ищет его в укрытии II и не находит его там, игрок А получает штраф, т.е. а12 = 1.
А2-В1 - игрок А прячется в укрытии II, игрок В ищет его в укрытии I и не находит его там, игрок А получает штраф, т.е. а21 = 1.
А2-В2 - игрок А прячется в укрытии II и там его обнаруживает игрок В, игрок А платит штраф, т. е. а22 = -1.
Таким образом, для игры «поиск» размера 2x2 получаем платежную матрицу
-1 1
А=
1 -1
Пример 2.2. Два игрока А и В, не глядя друг на друга, кладут на стол по монете вверх гербом или цифрой, по своему усмотрению. Если игроки выбрали одинаковые стороны (у обоих герб или цифра), то игрок А забирает обе монеты; иначе их забирает игрок В. Требуется проанализировать игру и составить ее матрицу, считая выигрыш монеты за +1.
Решение. Игра состоит только из двух ходов: наш ход (игрок А) и ход противника (игрок В), оба личные. Игра не принадлежит к играм с полной информацией, так как в момент хода игрок не знает, что сделал другой.
У нас две стратегии: А1 - выбирать герб и А2 - выбирать цифру; у противника такие же две стратегии: В1 - герб и В2 - цифра. Таким образом, данная игра есть игра 2x2.
Матрица игры приведена в табл.2.2.
Пример
2.3. Игроки
А и В одновременно и независимо друг
от друга записывают каждый одно из трех
чисел: 1 , 2 или 3. Если сумма
написанных чисел четная, то В платит А эту сумму в рублях; если она нечетная, то, наоборот, А платит В эту сумму.
Требуется проанализировать игру и составить ее матрицу. Решение. Игра состоит из двух ходов; оба - личные. У нас (А) три стратегии: А! - писать 1; А2 - писать 2; А3 - писать 3. У противника (В) - те же три стратегии. Игра представляет собой игру 3x3 с матрицей, приведенной в табл. 2.3.
Пример 2.4. В нашем распоряжении имеются три вида вооружения: Аь А2, А3; у противника - три вида самолетов: В2, В3. Наша задача поразить самолет; задача противника сохранить его непораженным. При применении вооружения А! самолеты В2, В3 поражаются соответственно с вероятностями 0,9, 0,4, 0,2; при вооружении А2 - с вероятностями 0,3, 0,6 и 0,8; при вооружении А3 - с вероятностями 0,5, 0,7 и 0,2. Требуется сформулировать ситуацию в терминах теории игр.
Решение. Ситуация может рассматриваться как игра 3x3 с двумя личными ходами и одним случайным. Наш личный ход - выбор типа вооружения; личный ход противника - выбор самолета для участия в бою. Случайный ход - применение вооружения; этот ход может закончиться поражением или непоражением самолета. Наш выигрыш равен единице, если самолет поражен, и равен нулю в противном случае. Нашими стратегиями являются три варианта вооружения; стратегиями противника - три варианта самолетов.
Среднее значение выигрыша при каждой заданной паре стратегий есть не что иное, как вероятность поражения каждого самолета данным оружием. Матрица игры приведена в табл. 2.4.
Таблица 2.4
А |
В! |
В2 |
В3 |
А! |
0,9 0,4 0,2 0,3 0,6 0,8 0,5 0,7 0,2 |
||
|
|||
А3 |
|||
