Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Игра лекция.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
648 Кб
Скачать

Игра

В практической деятельности людей часто возникают конфликтные ситуации, когда нескольким участникам приходится взаимодействовать при обстоятельствах, в которых каждый из них старается достичь своей цели доступными им способами, однако каждый в отдельности полностью не влияет на ход событий, т.е. исход “борьбы” лишь частично зависит от действий каждого участника. В этих ситуациях имеются несколько заинтересованных сторон, каждая из которых старается получить максимальный выигрыш. Примерами таких ситуаций являются игры в шахматы и карты, спортивные состязания, торговые отношения, экономическая, хозяйственная, политическая, военная деятельность, медицинское обслуживание и т.п. Такие ситуации называют конфликтными, их изучением занимается теория игр.

Теория игр - раздел математики, предметом которого является изучение математических моделей принятия оптимальных решений в условиях конфликта. При этом под конфликтом понимается всякое явление, в котором участвуют различные стороны, наделенные несовпадающими интересами. К конфликтам относятся явления экономического, социального, правового, военного содержания, а также спортивные состязания и так называемые салонные игры. При принятии решений может возникнуть неопределенность, например, на основе недостаточных данных. Поэтому теория игр может также рассматриваться как теория принятия оптимальных решений в условиях неопределенности.

Математическая модель конфликтной ситуации, в которой сталкиваются не менее двух сторон с различными интересами, называется игрой. Заинтересованные стороны называются игроками. Стратегия – это установленный игроком метод выбора ходов в течение игры. Можно понимать стратегию как план проведения игры, причем этот план настолько исчерпывающий, что он не может быть нарушен действиями противника. Основная цель теории игр – нахождение «оптимальной стратегии» для каждого из игроков. Оптимальной стратегией считается та стратегия, которая при многократно повторяющейся игре гарантирует игроку максимально возможный средний выигрыш.

В зависимости от количества игроков определяют игры: одного игрока, двух игроков, n игроков; при этом игры одного игрока (типа пасьянса) интереса не представляют и не рассматриваются в теории игр.

По количеству стратегий игры делятся на конечные и бесконечные. Если в игре каждый из игроков имеет конечное число возможных стратегий, то она называется конечной, если хотя бы один из игроков имеет бесконечное количество возможных стратегий, то бесконечной.

По характеру взаимоотношений игры делятся на бескоалиционные, кооперативные и коалиционные.

Бескоалиционные – игры, в которых игроки не имеют права вступать в соглашение; коалиционные – те, в которой игроки могут вступать в соглашение и образовывать коалиции; в кооперативной игре коалиции заранее определены.

По характеру выигрышей они делятся на игры с нулевой суммой и игры с ненулевой суммой. В игре с нулевой суммой сумма выигрышей всех игроков в каждой партии равна нулю, т.е. общий капитал всех игроков не меняется, а перераспределяется между игроками в зависимости от получающихся исходов.

Игра двух игроков с нулевой суммой называется антагонистической, т.к. цели игроков прямо противоположны: выигрыш одного игрока происходит за счет проигрыша другого.

Примером игры с ненулевой суммой является всякая игра, в которой надо вносить взнос за право участия в игре, в пользу лица, не принимающего в ней участия.

Матричной игрой называется антагонистическая игра с нулевой суммой. Далее будут рассматриваться только матричные игры.

Любую матричную игру определяют с помощью так называемой платежной матрицы , , которая определяет, какой платеж должен быть сделан одним участником другому. Строки платежной матрицы соответствуют стратегиям первого игрока (игрока A), а столбцы – стратегиям второго игрока (игрока B). Каждый элемент этой матрицы равен выигрышу игрока A (проигрышу игрока B).

Приведем несколько примеров формализаций конфликтных ситуаций.

Пример 1. (Игра с двумя пальцами) Два человека одновременно показывают один или два пальца и называют цифру один или два, которая, по их мнению, означает количество пальцев, показываемых вторым человеком. После того, как пальцы показаны и названы числа происходит распределение выигрышей по правилам: если оба угадали сколько пальцев показал каждый человек, то фиксируется ничья – выигрыш 0 у каждого человека; если оба не угадали, то также фиксируется ничья; если только один человек угадал сколько пальцев показал второй, то угадавший получает выигрыш за счет не угадавшего в виде денег или очков равный сумме показанных пальцев обоими участниками игры.

Итак, в этой конфликтной ситуации только два человека, у которых прямо противоположные цели – получить максимальный выигрыш за счет второго участника, поэтому каждого участника можно считать игроком. Отсюда следует, что формализованная игра будет матричной.

Что считать стратегиями игроков? Очевидно, возможности каждого из игроков выбрать пару чисел {a, b}, где a – количество показанных им пальцев, b – предполагаемое число пальцев, которые покажет противник. Давая возможные значения a = 1, 2 и b = 1, 2, получаем 4 возможные стратегии:

{1,1} – показать один палец и назвать цифру 1;

{1,2} – показать один палец и назвать цифру 2;

{2,1} – показать два пальца и назвать цифру 1;

{2,2} – показать два пальца и назвать цифру 2.

Итак, каждый из игроков имеет по 4 стратегии. Построим матрицу Н выигрышей первого игрока в соответствии с введенными правилами:

.

Например, если первый игрок применит четвертую стратегию {2,2}, а второй – вторую {1,2}, то угадает второй игрок и он получает от первого сумму 2+1=3, соответствующую количеству пальцев, показанных обоими игроками. Значит, первый игрок выигрывает –3, и элемент матрицы .

Если оба игрока применяют одинаковые стратегии, то они оба угадывают и выигрыш первого игрока равен 0. Это соответствует элементам главной диагонали: a11=0, a22=0, a33=0, a44=0. Побочная диагональ соответствует обоюдному неугадыванию, поэтому a14=0, a23=0, a32=0, a41=0. Положительный выигрыш у первого игрока a12=2 будет, если первый игрок применит первую стратегию {1,1}, а второй – вторую: {1,2}. В этом случае угадывает только первый игрок и он получает от второго сумму 1+1=2, соответствующую количеству пальцев, показанных обоими игроками.

Пpимеp 2. (Игра в монеты) Пусть двое игроков, одновременно и не зная выбора противника, кладут на стол по монете. При совпадении сторон обе монеты забирает первый игрок, при несовпадении обе монеты забирает второй игрок. Так как монета имеет только две стороны, у каждого игрока имеется только по две стратегии и . Число возможных ситуаций - четыре. Пусть выигрыш первого игрока (+1), его проигрыш (-1). Тогда матрица игры имеет вид:

Г

Р

Г

1

-1

Р

-1

1


где слева выписаны стратегии первого игрока, над матрицей – стратегии второго.

Пример 3. В город можно войти только по двум мостам. Город обороняют 3 роты, на город нападают 2 роты, город будет взят, если на одном из мостов наступающие окажутся в численном превосходстве. Надо построить матрицу игры для обороняющихся, считая, что успешная оборона дает выигрыш (+1), потеря города дает (-1). Стратегии первого игрока таковы: выделить на защиту первого моста 0, 1, 2, 3 роты (остальные отправить защищать второй мост); стратегии второго игрока: атаковать первый мост силами 0, 1, 2 рот (остальные отправить атаковать второй мост). Матрица игры будет иметь вид:

В1

В2

В3

0

1

2

А1

0

1

-1

-1

А2

1

1

1

-1

А3

2

-1

1

1

А4

3

-1

-1

1

где слева от матрицы – стратегии защитников, над матрицей – стратегии нападающих.

Рассмотрим выигрыш защитников при выборе ими третьей стратегии, а нападающими - их первой стратегии (0 рот атакуют первый мост). В этом случае на первом мосту превосходство сил на стороне обороняющихся и противник по этому мосту в город не пройдет. Но на втором мосту обороняющихся только одна рота, а нападающих – две, поэтому нападающие в город ворвутся, следовательно, выигрыш обороняющихся: (-1).

Пpимеp 4. (Оптимальный план) (природа) Фирма выпускает два вида скоропортящейся продукции П1 и П2. Ежедневные расходы не должны превышать 4 000 рублей. Руководству фирмы требуется определить ежедневный объем производства каждого вида продукции с целью получения наибольшей прибыли. Для этого были проведены исследования, которые показали, что:

1) себестоимость единицы продукции П1 равна 0,8 рублей, отпускная цена – 1,2 рублей; себестоимость единицы продукции П2 равна 0,5 рублей, отпускная цена – 0,8 рублей;

2) если продукция не реализуется в день выпуска, то ее качества значительно снижаются, и она продается на следующий день по цене в 4 раза меньше отпускной;

3) реализация продукции зависит от состояния погоды – в хорошую погоду реализуется 1 000 единиц продукции П1 и 6 000 единиц П2; в плохую погоду реализуется 4 000 единиц продукции П1 и 1 200 единиц П2;

4) на реализацию всей произведенной за день продукции расходуется 200 рублей.

Итак, для предприятия важно знать состояние погоды и производить продукцию в таком объеме и ассортименте, чтобы она максимально реализовывалась в тот же день. Если бы можно было точно знать состояние погоды на следующий день, то оптимальным вариантом был бы план выпуска продукции, ориентированный на известную погоду. Но это, к сожалению, невозможно. Поэтому ситуацию можно трактовать следующим образом: один игрок – фирма, которая заинтересована производить продукцию с максимальной выгодой для себя; другой игрок – природа, которая может навредить фирме. Значит, это снова матричная игра: фирма – природа.

У фирмы две стратегии:

первая стратегия – производить продукцию в расчете на хорошую погоду;

вторая стратегия – производить продукцию в расчете на плохую погоду.

У природы тоже имеется две стратегии:

первая стратегия – хорошая погода;

вторая стратегия – плохая погода.

В результате приходим к игре с матрицей

.

Подсчитаем элементы матрицы игры. Прибыль , где Zij – сумма выручки за реализованную продукцию при соответствующем выборе стратегий; Сi – затраты на производство и реализацию продукции (i – стратегия фирмы). Если фирма применяет 1-ю стратегию и погода на самом деле хорошая (первая стратегия погоды), то вся произведенная продукция будет реализована. Подсчитаем затраты

C1 = 0,81 000 + 0,56 000 + 200 = 4 000 (рублей)

и доход от реализации

Z11=1,21 000+0,86 000=6 000 (рублей).

Следовательно, в этом случае прибыль составит

P11=Z11 C1,

P11=6 000 – 4 000=2 000 (рублей).

Если предприятие применяет первую стратегию, а погода плохая (2-я стратегия погоды), то затраты на производство продукции у фирмы остаются те же самые C1=4 000 (рублей), а сумма выручки будет другая.

При плохой погоде реализуются 4 000 единиц продукции П1, а произведено 1 000 в расчете на хорошую погоду, значит, вся продукция вида П1 будет реализована по 1,2 рублей. Для продукции П2: в расчете на хорошую погоду фирма произвела 6 000 единиц продукции П2, но при плохой погоде реализуется 1 200 единиц П2, следовательно, 1 200 единиц П2, будут реализованы по 0,8 рублей, а оставшиеся 6 000 –1 200 = 4 800 единиц на следующий день по цене 0,8:4=0,2 (рублей). Поэтому сумма выручки

Z12=1,21 000+0,81 200+0,24 800=3 120 (рублей)

и прибыль фирмы составит

P12=3 120 – 4 000 = – 880 (рублей),

то есть в этом случае фирма терпит убытки.

Пусть теперь фирма применит свою 2-ю стратегию, а погода – первую. Тогда

C2 = 0,84 000+0,51 200+200=4 000 (рублей),

Z21=1,21 000+0,81 200+0,33 000=3 060 (рублей),

P21=3 060 – 4 000= – 940 (рублей).

Наконец, при применении фирмой и погодой вторых стратегий, получаем

Z22=1,24 000+0,81 200=5 760 (рублей),

P22=5 760 – 4 000=1 760 (рублей).

Итак, матрица игры имеет вид

.

Стратегии, указываемые в приведенных примерах слева от платежной матрицы и над ней, называются чистыми, каждый игрок применяет только одну из своих возможных стратегий.

Теоретическая часть

1. Основные понятия

Определение 1.1. Матричная игра – это конечная игра двух игроков с нулевой суммой, в которой задаются выигрыши первого игрока в виде матрицы.

(1.1).

Обратно, если задана матрица (1.1), то ее можно рассматривать как игру, если считать, что строки этой матрицы соответствуют стратегиям одного из игроков (А), а столбцы – другого (В). Часто матрицу игры называют платежной матрицей.

Стратегией игрока А в матричной игре с матрицей Hmn называется m – мерный вектор , в котором  – вероятность того, что А выбирает i-ю строку (i=1,2,...,m).

Стратегией игрока В в матричной игре с матрицей Hmn называется n-мерный вектор , в котором  – вероятность того, что В выбирает j-ю столбец (j=1,2,...,n).

Отметим, что чистым стратегиям игроков соответствуют векторы, одна координата которых равна 1, а остальные – 0.

Чистой стратегией для игрока А (или для В) является решение выбирать для каждого хода одну и ту же строку (столбец). Если оба игрока используют чистые стратегии, то игра полностью предсказуема. Если же игрок А (или В) на разных ходах игры выбирает более чем одну строку (столбец), то говорят, что игрок использует смешанную стратегию. Когда оба игрока используют смешанные стратегии, игра усложняется. Если, например, игрок А решает играть по смешанной стратегии, то он будет рандомизировать (то есть делать случайным) выбор строки таким способом, который увеличивает его доход.

Понятие о нижней и верхней цене игры. Решение игры в чистых стратегиях

Каждый из игроков стремится максимизировать свой выигрыш с учетом поведения противодействующего ему игрока. Поэтому для игрока 1 необходимо определить минимальные значения выигрышей в каждой из стратегий, а затем найти максимум из этих значений, то есть определить величину

или найти минимальные значения по каждой из строк платежной матрицы, а затем определить максимальное из этих значений.

Определение 1.2. Число называется нижней чистой ценой игры.

Значение показывает, какой максимальный выигрыш может гарантировать себе первый игрок, применяя свои чистые стратегии при всевозможных действиях игрока В.

Величина выигрыша игрока А равна, по определению матричной игры, величине проигрыша игрока В. Поэтому для игрока В необходимо определить значение

или найти максимальные значения по каждому из столбцов платежной матрицы, а затем определить минимальное из этих значений.

Определение 1.3. Число называется верхней чистой ценой игры.

Это значение показывает, какой минимальный проигрыш может гарантировать себе игрок B, применяя свои чистые стратегии при всевозможных действиях игрока А.

В матричной игре нижняя чистая цена игры не превосходит верхней чистой цены игры, т. е. .

Определение 1.4. Если в игре с платежной матрицей Hmxn нижняя и верхняя чистые цены игры совпадают, , то говорят, что игра имеет седловую точку в чистых стратегиях и чистую цену игры V= . При этом, элемент платежной матрицы akl, являющийся одновременно минимальным в строке и максимальным в столбце, называется седловой точкой.

Из сказанного выше ясно, как проверять платежную матрицу на наличие седловой точки:

  1. в каждой строке находится минимальный элемент, а среди них берется максимальный;

  2. в каждом столбце находится максимальный, а среди них берется минимальный;

  3. если эти два элемента совпадают, то матрица имеет седловую точку, в противном случае нет.

Седловая точка может быть не единственной. Для пояснения рассмотрим пример.

Пример 1. Найти седловые точки следующих платежных матриц:

1)

В1

В2

В3

А1

0

2

9

0

А2

6

4

8

4

А3

7

3

1

1

7

4

9

Седловая точка , .

2)

В1

В2

А1

2

-2

-2

А2

-2

2

-2

2

2

Седловой точки нет ( ).

3)

В1

В2

В3

А1

12

13

12

12

А2

10

31

9

9

12

31

12

Две седловые точки (1, 1), (1, 3), цена игры = 12.

Поскольку и справа, и внизу в финал для сравнения выходят по одному числу, постольку получается, что цена игры для разных седловых точек (если их несколько) одна и та же.

При наличии у платежной матрицы седловой точки, естественно, выбирают стратегии, соответствующие этой точке. Такое решение гарантирует одному из игроков «выигрыш» не меньше определенной величины (цены игры ), другому – «проигрыш» не больше этой величины. Отклонение от этих стратегий может дать одному из игроков выигрыш как больше, так и меньше цены игры (никаких гарантий нет), а другому – проигрыш как больше, так и меньше цены игры.

Другими словами, если у матрицы игры имеется более чем одна седловая точка, то эти седловые точки, соответствующие им численные значения платежной матрицы равны.