Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Оптимиз. модели,Парето,.docx
Скачиваний:
139
Добавлен:
05.06.2015
Размер:
2.56 Mб
Скачать

6. Элементы теории матричных игр.

6.1. Игровой подход к принятию решений в условиях неопределённости.

Достаточно часто решения приходится принимать в условиях неопределенности, когда или про­цесс выполнения операции является неопределенным, или нам со­знательно противодействует противник, или нет ясных и четких целей (задач) операции. Следствием неопределенности является то, что успех операции зависит не только от наших решений, но и от чьих-то решений или действий.

В целом ряде задач приходится анализировать ситуации, в ко­торых сталкиваются какие-то противоборствующие стороны (две или более), каждая из которых преследует свою цель, причем ре­зультат любого мероприятия каждой из сторон зависит от того, какие действия предпримет противник. Столкновение противоположных интересов участников приводит к возникновению конфликтных ситуаций. Необходимость анализировать такие ситуации, в свою очередь, привела к возникновению теории игр, задачей которой является выработка рекомендаций по рациональному образу действия участников конфликта. Теорию игр можно определить как теорию математических моделей при­нятия решений в условиях конфликта. Теория игр – это теория математических моделей, интересы участников которых различны.

Чтобы исключить трудности, возникающие при анализе практических конфликтных ситуаций в результате наличия многих несущественных факторов, строится упрощённая модель ситуации. Такая модель называется игрой. Конфликтная ситуация в игровой модели развивается по определённым правилам (обратите внимание на то, что крайний экстремизм: «На­рушать любое правило» является правилом). Естественным примером конфликтных ситуаций служат широко распространённые игры – шахматы, шашки, карточные игры. Поэтому теории игр свойственна следующая терминология: «игроки» (стороны, участвующие в конфликте), «выигрыш» (исход конфликта) и т.д.

Среди задач, требующих применения теории игр, можно на­звать следующие:

- анализ конфликтных ситуаций в экономике (простым экономическим примером конфликтной ситуа­ции, для описания которой применяется теория игр, является кон­курентная борьба торговых фирм или промышленных предприя­тий);

- обменные и торговые операции;

- анализ и проектирование иерархических структур управле­ния и экономических механизмов (например, анализ различных моделей стимулирования);

- анализ коалиционного поведения.

Теория игр предназначена для получения решений в играх, ко­торые играются только один раз. Если игра повторяется, то надо использовать статистические методы. В единичной, неповторяющейся игре теория игр либо позволяет выбрать одно определенное “хорошее” в том или ином смысле решение из множества возможных решений, либо по­лучить характеристики того случайного механизма, с помощью которого один раз выбирается какое-то одно из возможных решений.

6.2. Основные понятия теории игр.

Обычно, достижение цели сопровождается каким-то выигры­шем, который является своего рода мерой эффективности. Конеч­но, при разных решениях участников могут быть разные величи­ны выигрышей. Если участников двое, то совокупность всех выиг­рышей можно представить в виде таблицы — матрицы выигры­шей или платежной матрицы, которая определяет, какой платеж должен быть сделан одним участником другому. Игра двух лиц с нулевой суммой — это такая игра, в которой сумма выигры­шей участников после конца игры равна нулю (сколько один выиграл, столько другой проиграл).

Важным понятием теории игр яв­ляется понятие стратегии. Стратегия,— это установленный игро­ком метод выбора ходов в течение игры. Можно понимать страте­гию как план проведения игры, причем этот план настолько ис­черпывающий, что он не может быть нарушен действиями про­тивника.

Суммируя все сказанное, можно сказать, что матричная игра с нулевой суммой двух лиц, у каждого из которых имеется конеч­ное множество стратегий, представляется в виде матрицы выигры­шей одного из игроков (выигрыши другого противоположны по знаку), которые являются элементами матрицы и показывают, что получает этот игрок при каждой комбинации какой-то своей стра­тегии и какой-то стратегии противника. Обычно считается, что строки матрицы соответствуют стратегиям первого игрока, столб­цы — стратегия второго, первый выбирает строку, второй — столбец, на пересечении стоит выигрыш первого игрока (возможно, что он отрицателен, то есть первый игрок в проигрыше). Если раз­мерность матрицы , то игра называетсяигрой , то есть размерность игры определяется числом стратегий. Матричные иг­ры — не единственный тип игр, но мы займемся иг­рами этого типа.

Рассмотрим пример.

Пример 6.1. Пусть двое игроков, одновременно и не зная выбора против­ника, кладут на стол по монете. При совпадении сторон обе мо­неты забирает первый игрок, при несовпадении обе монеты заби­рает второй игрок У каждого из игроков по две стратегии {Г, Р} и {Г, Р}. Число возможных ситуаций — четыре. Пусть выигрыш первого игрока (+1), его проигрыш (-1). Тогда матрица игры имеет вид:

,

где слева выписаны стратегии первого игрока, над матрицей — стратегии второго.

Надо отметить важную терминологическую деталь: стратегии, указываемые в приведенных примерах слева от платежной матри­цы и над ней, называются чистыми, каждый игрок применяет в игре только одну из своих возможных стратегий.

Теперь, используя понятие чистой стратегии, рассмотрим сле­дующую ситуацию [2]. На один и тот же рынок первая фирма A может поставлять какие-то три своих продукта А1, А23, вторая - B— че­тыре продукта B1, B2, B3, B4. В силу некоторых обстоятельств, в частности из-за нежелания устраивать конкуренцию между соб­ственными продуктами, каждая из фирм собирается поставлять на данный рынок только какой-то один из своих продуктов. Пла­тежная матрица для первой фирмы имеет вид:

.

Элемент aij матрицы — размер выигрыша 1-ой фирмы, если она поставляет на рынок продукт Ai, а вторая фирма – продукт Bj.

Принятие решений каждой фирмой о том, какой продукт по­ставлять на данный рынок, и есть выбор определенной чистой стратегии. Ясно, что первой фирме хотелось бы поставлять на ры­нок продукт A1, но она опасается, что вторая фирма поставит про­дукт B1 и тогда вместо выигрыша в 20 единиц фирме грозит про­игрыш в 5 единиц. Ясно, что вторая фирма хотела бы поставлять на рынок либо B1, либо B4 ,так как при этом первая фирма имела бы максимальный проигрыш, что означает максимальный выиг­рыш второй фирмы. Но для второй фирмы очевидна рискован­ность этих решений: B1 или B4, встретившись на рынке с продук­том A1 или A2 первой фирмы (который дает этой фирме выигрыш в 20 или 18 единиц), принесут второй фирме 20 или 18 единиц убытков. Даже в ситуации, когда вторая фирма только осваивает новый рынок, она, естественно, хочет иметь эти потери поменьше.

Представляется логичным следующее осторожное поведение каждой из фирм. Первая фирма смотрит, какой минимальный вы­игрыш она получает при каждой из своих стратегий: A1 дает (-5), A2 дает (0), A3 дает (-5). Выбрав стратегию A2 (она дает макси­мальный выигрыш среди минимально возможных), первая фирма получает не меньше чем (0). Более того, если вторая фирма выбе­рет, например, четвертую стратегию, то первая выиграет (+6). Ви­дим, что осторожное поведение для первой фирмы диктует ей та­кое поведение: среди выигрышей aij в каждой строке найти выиг­рыш ai = , а затем выбрать стратегию с таким номером i , для которого выигрыш ai максимален =. Окончательно получается,что при разумной осторожности 1-ая фирма может получить не меньше . Величина - гарантированный выигрыш первого игрока, называетсянижней ценой игры. Стратегия Ai0, обеспечиваю­щая получение , называетсямаксиминной.

Поскольку платежная матрица выписана как матрица выигрышей первой фирмы, постольку вто­рая фирма, действуя с разумной осторожностью, будет рассуж­дать так. В каждом столбце (она ведь «контролирует» столбцы, выбирая, какой товар отправить на рынок) определяется максималь­ный проигрыш этой фирмы, то есть максимальный выигрыш пер­вой фирмы, bj = , потом выбирается тот столбец, то есть та стратегия, для которой = . В этом случае вторая фирма потеряет не больше чем . Величина называетсяверхней ценой игры, а соответствующая выигрышу стратегия Bj0 минимаксной.

Достаточно просто доказывается, что всегда

= <==

В самом деле, пусть ars=, aqp=.

Ясно, что ars — минимальный элемент r-ой строки, значит, ars <= arp, элемент aqp — максимален в р-ом столбце, поэтому arp<= aqp, следовательно, ars<= arp<= aqp, что и требовалось дока­зать.

Фактический выигрыш игрока А при разумных дейст­виях партнеров ограничен нижней и верхней ценой игры. Если же эти выражения равны, т. е.

==v,

то выигрыш игрока А — вполне определенное число, игра называется вполне определенной, а выигрыш v называет­ся значением игры или ценой игры и равен элементу матрицы ai0j0. Вполне определенные игры называют играми с седловой точ­кой. Элемент ai0j0 в матрице такой игры является одновре­менно минимальным в строке i0, максимальным в столбце j0 и называется седловой точкой. Седловой точке соответ­ствуют оптимальные стратегии игроков, их совокупность является решением игры, которое обладает следующим свой­ством: если один из игроков придерживается своей опти­мальной стратегии, то для другого отклонение от его опти­мальной стратегии не может быть выгодно.

Седловая точка может быть не единственной, но при этом значение aij во всех седловых точках будет одним и тем же, равным цене игры v .

Пример 6.2. Определить нижнюю и верхнюю цены для игр, заданных платежными матрицами A1 и А2:

Решение. Минимальные значения aij в строках мат­рицы А1 равны соответственно 2, 3, 1. Максимальное значе­ние из них равно 3. Следовательно, — нижняя цена игры, которой соответствует матрица A1, равна 3.

Для определения (верхней цены данной игры) найдем максимальные значения элементов в столбцах матрицы. По столбцам соответственно имеем: 4, 5, 6, 5. Следовательно,= 4. Для матрицы А2

,

.

Таким образом, ==v — цена игры. Решение дан­ной игры состоит в выборе игроком А стратегии А2, при этом его выигрыш не меньше 2; для игрока В оптимальной является стратегия В2, позволяющая ограничить его про­игрыш этим же числом. Легко видеть, что отклонение одним из игроков от оптимальной стратегии приводит к уменьше­нию выигрыша (для игрока А) и увеличению проигрыша (для игрока В).

Итак, если игровая матрица содержит седловую точку, то решение игры известно. Каждый из игроков применяет свою оптимальную стратегию. Возникает вопрос нахождения ре­шения для игр, матрицы которых не содержат седловой точ­ки. В этих играх . Применение минимаксных страте­гий для каждого из игроков обеспечивает выигрыш, не превышающий, и проигрыш, не меньший. Естествен­ным для каждого игрока является вопрос увеличения вы­игрыша (уменьшения проигрыша). Поиски такого решения состоят в том, что игроки применяют не одну, а несколько стратегий. Выбор стратегий осуществляется случайным образом. Случайный выбор игроком своих стратегий называетсясмешанной стратегией.

В игре, матрица которой имеет размерность , стра­тегии игрока А задаются наборами вероятностейX = (х1, х2,…,хm), с которыми игрок применяет свои чистые стратегии. Эти наборы можно рассматривать как m-мерные векторы, для компонент которых выполняются условия

Аналогично, для игрока В определяют n-мерные векторы Y = (y1,y2,…,yn), соответствующие его смешанным стра­тегиям. Стратегии игроков А и В, для которых вероятности xi и yj отличны от нуля, называются активными.

Согласно основной теореме теории игр, каждая конечная игра имеет по крайней мере одно решение, которым может быть и определенная смешанная стратегия. Выигрыш игрока А при использовании смешанных стратегий определяется как математическое ожидание выигрыша, т.е. или (в векторной записи)XAY'. Применение оптимальной стратегии позволяет получить выигрыш, равный цене игры [3]

.

Для оптимальных стратегий игроков имеет место соот­ношение

.

Применение игроком А оптимальной стратегии X* должно обеспечивать ему при любых действиях игрока В выигрыш не меньше цены игры v. Поэтому выполняются следующие соотношения:

(3.1)

Аналогично, для игрока В оптимальная стратегия Y* долж­на обеспечить при любых стратегиях игрока А проигрыш, не превышающий величину v, т. е. справедливо соотноше­ние

(3.2)

Доминирование стратегий. Если платежная матрица такова, что каждый элемент некоторой строки i не меньше соответствующе­го элемента строки к и по меньшей мере один ее элемент строго больше соответствующего элемента строки к, то говорят, что стра­тегия Aj игрока 1 доминирует его стратегию Ak. Доминируемая стра­тегия не может быть оптимальной чистой стратегией игрока 1 и даже не может войти в его оптимальную смешанную стратегию с ненулевой вероятностью, поэтому ее можно исключить из рас­смотрения, вычеркнув из матрицы строку к. Аналогично: если каждый элемент некоторого столбца j не больше соответству­ющего элемента столбца r и по меньшей мере один его элемент строго меньше соответствующего элемента столбца r, то гово­рят, что стратегия Bj игрока 2 доминирует его стратегию Br. Поэтому столбец r матрицы можно вычеркнуть.

Пример 6.3 [2]. Рассмотрим пример использования теории игр при решении экономической задачи, которая может возникнуть в практике менеджера.

Предположим, есть две фирмы А и В, торгующие одним и тем же товаром, который пользуется спросом в течение N единиц времени. Пусть cдоход от продажи товара в едини­цу времени, причем продажа товара по заниженной цене законо­дательно запрещена. Далее, пусть качество товара зависит от вре­мени поступления на рынок: чем позже товар поступает на ры­нок, тем качество выше, причем реализуется только товар более высокого качества. Наконец, пусть фирма В хочет разорить фир­му А, не заботясь о своих доходах. Фирма В может использовать в качестве законного средства только момент поступления своего товара на рынок. Пусть i — момент поступления товара на ры­нок от фирмы А, j — момент поступления товара от фирмы В, выбор моментов — единственно возможные управленческие ре­шения, фирма А хочет максимизировать свой доход, фирма В, как уже сказано, хочет минимизировать доход фирмы А.

Найдем функцию выигрыша, то есть доход фирмы А. Если А выпустит товар в момент i, а В — в момент j > i (скажем, i = 2, j= 5), то А не будет иметь конкурентов в течение j - i единиц времени и получит за это время доход с(ji). Начиная с момен­та j, на рынке будет более «свежий» товар фирмы В, поэтому с момента j фирма А теряет свой доход. Если j < i, то есть фирма В раньше А выбрасывает на рынок свой товар; то доход фирмы А будет равен c(n + 1 - i). Если, наконец, i =j, то товары обеих фирм имеют одинаковый спрос, и каждая из фирм получает до­ход с(п+ 1 - i)/2. Получаем функцию выигрыша фирмы А (она же функция проигрыша В):

Пусть, например, п = 4. Тогда платежная матрица игры имеет вид:

Даже без строгих доказательств, на уровне здраво­го смысла, видно, что величину c в записи матрицы можно опус­тить.

Во-вторых, размерность матрицы можно уменьшить, удалив доминируемые стратегии: для фир­мы В, контролирующей столбцы, первый столбец заведомо хуже второго, так как первая стратегия этой фирмы несет ей больший проигрыш, чем вторая. Фирма В свою первую стратегию исполь­зовать не будет (эта стратегия — доминируемая), поэтому можно перейти к матрице:

.

Фирма А не станет использовать свою четвертую стратегию, так как при выборе этой фирмой третьей стратегии ее выигрыш может быть лишь больше или равен выигрышу, соответствующе­му четвертой стратегии.

Поэтому можно перейти к матрице:

Теперь видим, что фирме В не стоит использовать третью из оставшихся стратегий, так как она доминируется второй, при вы­боре которой проигрыш этой фирмы меньше.

Поэтому переходим к матрице:

.

Наконец, видим, что фирма А не станет использовать свою вто­рую из оставшихся стратегий, так как выигрыш по ней меньше, чем по третьей. В итоге получаем матрицу:

которая не имеет седловой точки, то есть решение надо искать не в чистых, а в смешанных стратегиях.

Для последней матрицы оптимальные вероятности мож­но найти, например, графически и получить для А: X*= (0,5; 0,5), для В: Y*= (0,5; 0,5), что дает для исходной матрицы (с учетом отбрасывания второй и четвертой стратегии для А и первой и чет­вертой стратегии для В): X*= (0,5; 0; 0,5; 0), Y* = (0; 0,5; 0,5; 0). Цена игры (выигрыш, доход А или проигрыш В):

то есть, возвращаясь к истинной стоимости, v=1.5c. Смысл полу­ченного результата ясен: фирма А должна с равными вероятнос­тями выпускать товар в 1-й или 3-й момент, а фирма В — во 2-й или 3-й. При этом ожидаемый выигрыш А равен 1,5с (разорит ли А такой уровень дохода, это уже другой вопрос).