Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Московский государственный университет экономики, статистики и информатики (МЭСИ)

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Оптимиз. модели,Парето,.docx

Скачиваний:

139

Добавлен:

05.06.2015

Размер:

2.56 Mб

Скачать

☆

<<< < Предыдущая 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 2324 / 3024 25 26 27 28 29 30 > Следующая >>>

6. Элементы теории матричных игр.

6.1. Игровой подход к принятию решений в условиях неопределённости.

Достаточно часто решения приходится принимать в условиях неопределенности, когда или процесс выполнения операции является неопределенным, или нам сознательно противодействует противник, или нет ясных и четких целей (задач) операции. Следствием неопределенности является то, что успех операции зависит не только от наших решений, но и от чьих-то решений или действий.

В целом ряде задач приходится анализировать ситуации, в которых сталкиваются какие-то противоборствующие стороны (две или более), каждая из которых преследует свою цель, причем результат любого мероприятия каждой из сторон зависит от того, какие действия предпримет противник. Столкновение противоположных интересов участников приводит к возникновению конфликтных ситуаций. Необходимость анализировать такие ситуации, в свою очередь, привела к возникновению теории игр, задачей которой является выработка рекомендаций по рациональному образу действия участников конфликта. Теорию игр можно определить как теорию математических моделей принятия решений в условиях конфликта. Теория игр – это теория математических моделей, интересы участников которых различны.

Чтобы исключить трудности, возникающие при анализе практических конфликтных ситуаций в результате наличия многих несущественных факторов, строится упрощённая модель ситуации. Такая модель называется игрой. Конфликтная ситуация в игровой модели развивается по определённым правилам (обратите внимание на то, что крайний экстремизм: «Нарушать любое правило» является правилом). Естественным примером конфликтных ситуаций служат широко распространённые игры – шахматы, шашки, карточные игры. Поэтому теории игр свойственна следующая терминология: «игроки» (стороны, участвующие в конфликте), «выигрыш» (исход конфликта) и т.д.

Среди задач, требующих применения теории игр, можно назвать следующие:

- анализ конфликтных ситуаций в экономике (простым экономическим примером конфликтной ситуации, для описания которой применяется теория игр, является конкурентная борьба торговых фирм или промышленных предприятий);

- обменные и торговые операции;

- анализ и проектирование иерархических структур управления и экономических механизмов (например, анализ различных моделей стимулирования);

- анализ коалиционного поведения.

Теория игр предназначена для получения решений в играх, которые играются только один раз. Если игра повторяется, то надо использовать статистические методы. В единичной, неповторяющейся игре теория игр либо позволяет выбрать одно определенное “хорошее” в том или ином смысле решение из множества возможных решений, либо получить характеристики того случайного механизма, с помощью которого один раз выбирается какое-то одно из возможных решений.

6.2. Основные понятия теории игр.

Обычно, достижение цели сопровождается каким-то выигрышем, который является своего рода мерой эффективности. Конечно, при разных решениях участников могут быть разные величины выигрышей. Если участников двое, то совокупность всех выигрышей можно представить в виде таблицы — матрицы выигрышей или платежной матрицы, которая определяет, какой платеж должен быть сделан одним участником другому. Игра двух лиц с нулевой суммой — это такая игра, в которой сумма выигрышей участников после конца игры равна нулю (сколько один выиграл, столько другой проиграл).

Важным понятием теории игр является понятие стратегии. Стратегия,— это установленный игроком метод выбора ходов в течение игры. Можно понимать стратегию как план проведения игры, причем этот план настолько исчерпывающий, что он не может быть нарушен действиями противника.

Суммируя все сказанное, можно сказать, что матричная игра с нулевой суммой двух лиц, у каждого из которых имеется конечное множество стратегий, представляется в виде матрицы выигрышей одного из игроков (выигрыши другого противоположны по знаку), которые являются элементами матрицы и показывают, что получает этот игрок при каждой комбинации какой-то своей стратегии и какой-то стратегии противника. Обычно считается, что строки матрицы соответствуют стратегиям первого игрока, столбцы — стратегия второго, первый выбирает строку, второй — столбец, на пересечении стоит выигрыш первого игрока (возможно, что он отрицателен, то есть первый игрок в проигрыше). Если размерность матрицы , то игра называетсяигрой , то есть размерность игры определяется числом стратегий. Матричные игры — не единственный тип игр, но мы займемся играми этого типа.

Рассмотрим пример.

Пример 6.1. Пусть двое игроков, одновременно и не зная выбора противника, кладут на стол по монете. При совпадении сторон обе монеты забирает первый игрок, при несовпадении обе монеты забирает второй игрок У каждого из игроков по две стратегии {Г, Р} и {Г, Р}. Число возможных ситуаций — четыре. Пусть выигрыш первого игрока (+1), его проигрыш (-1). Тогда матрица игры имеет вид:

где слева выписаны стратегии первого игрока, над матрицей — стратегии второго.

Надо отметить важную терминологическую деталь: стратегии, указываемые в приведенных примерах слева от платежной матрицы и над ней, называются чистыми, каждый игрок применяет в игре только одну из своих возможных стратегий.

Теперь, используя понятие чистой стратегии, рассмотрим следующую ситуацию [2]. На один и тот же рынок первая фирма A может поставлять какие-то три своих продукта А₁, А₂,А₃, вторая - B— четыре продукта B₁, B₂, B₃, B₄. В силу некоторых обстоятельств, в частности из-за нежелания устраивать конкуренцию между собственными продуктами, каждая из фирм собирается поставлять на данный рынок только какой-то один из своих продуктов. Платежная матрица для первой фирмы имеет вид:

Элемент a_ij матрицы — размер выигрыша 1-ой фирмы, если она поставляет на рынок продукт A_i, а вторая фирма – продукт B_j.

Принятие решений каждой фирмой о том, какой продукт поставлять на данный рынок, и есть выбор определенной чистой стратегии. Ясно, что первой фирме хотелось бы поставлять на рынок продукт A_1, но она опасается, что вторая фирма поставит продукт B₁ и тогда вместо выигрыша в 20 единиц фирме грозит проигрыш в 5 единиц. Ясно, что вторая фирма хотела бы поставлять на рынок либо B₁, либо B₄ ,так как при этом первая фирма имела бы максимальный проигрыш, что означает максимальный выигрыш второй фирмы. Но для второй фирмы очевидна рискованность этих решений: B₁ или B₄, встретившись на рынке с продуктом A₁ или A₂ первой фирмы (который дает этой фирме выигрыш в 20 или 18 единиц), принесут второй фирме 20 или 18 единиц убытков. Даже в ситуации, когда вторая фирма только осваивает новый рынок, она, естественно, хочет иметь эти потери поменьше.

Представляется логичным следующее осторожное поведение каждой из фирм. Первая фирма смотрит, какой минимальный выигрыш она получает при каждой из своих стратегий: A₁ дает (-5), A₂ дает (0), A₃ дает (-5). Выбрав стратегию A₂ (она дает максимальный выигрыш среди минимально возможных), первая фирма получает не меньше чем (0). Более того, если вторая фирма выберет, например, четвертую стратегию, то первая выиграет (+6). Видим, что осторожное поведение для первой фирмы диктует ей такое поведение: среди выигрышей a_ij в каждой строке найти выигрыш a_i = , а затем выбрать стратегию с таким номером i , для которого выигрыш a_i максимален =. Окончательно получается,что при разумной осторожности 1-ая фирма может получить не меньше . Величина - гарантированный выигрыш первого игрока, называетсянижней ценой игры. Стратегия Ai₀, обеспечивающая получение , называетсямаксиминной.

Поскольку платежная матрица выписана как матрица выигрышей первой фирмы, постольку вторая фирма, действуя с разумной осторожностью, будет рассуждать так. В каждом столбце (она ведь «контролирует» столбцы, выбирая, какой товар отправить на рынок) определяется максимальный проигрыш этой фирмы, то есть максимальный выигрыш первой фирмы, b_j = , потом выбирается тот столбец, то есть та стратегия, для которой = . В этом случае вторая фирма потеряет не больше чем . Величина называетсяверхней ценой игры, а соответствующая выигрышу стратегия Bj₀— минимаксной.

Достаточно просто доказывается, что всегда

= <==

В самом деле, пусть a_rs=, a_qp=.

Ясно, что a_rs — минимальный элемент r-ой строки, значит, a_rs <= a_rp, элемент a_qp — максимален в р-ом столбце, поэтому a_rp<= a_qp, следовательно, a_rs<= a_rp<= a_qp, что и требовалось доказать.

Фактический выигрыш игрока А при разумных действиях партнеров ограничен нижней и верхней ценой игры. Если же эти выражения равны, т. е.

==v,

то выигрыш игрока А — вполне определенное число, игра называется вполне определенной, а выигрыш v называется значением игры или ценой игры и равен элементу матрицы ai₀j₀. Вполне определенные игры называют играми с седловой точкой. Элемент ai₀j₀в матрице такой игры является одновременно минимальным в строке i₀, максимальным в столбце j₀ и называется седловой точкой. Седловой точке соответствуют оптимальные стратегии игроков, их совокупность является решением игры, которое обладает следующим свойством: если один из игроков придерживается своей оптимальной стратегии, то для другого отклонение от его оптимальной стратегии не может быть выгодно.

Седловая точка может быть не единственной, но при этом значение a_ijво всех седловых точках будет одним и тем же, равным цене игры v .

Пример 6.2. Определить нижнюю и верхнюю цены для игр, заданных платежными матрицами A₁ и А₂:

Решение. Минимальные значения a_ij в строках матрицы А₁ равны соответственно 2, 3, 1. Максимальное значение из них равно 3. Следовательно, — нижняя цена игры, которой соответствует матрица A₁, равна 3.

Для определения (верхней цены данной игры) найдем максимальные значения элементов в столбцах матрицы. По столбцам соответственно имеем: 4, 5, 6, 5. Следовательно,= 4. Для матрицы А₂

Таким образом, ==v — цена игры. Решение данной игры состоит в выборе игроком А стратегии А₂, при этом его выигрыш не меньше 2; для игрока В оптимальной является стратегия В₂, позволяющая ограничить его проигрыш этим же числом. Легко видеть, что отклонение одним из игроков от оптимальной стратегии приводит к уменьшению выигрыша (для игрока А) и увеличению проигрыша (для игрока В).

Итак, если игровая матрица содержит седловую точку, то решение игры известно. Каждый из игроков применяет свою оптимальную стратегию. Возникает вопрос нахождения решения для игр, матрицы которых не содержат седловой точки. В этих играх . Применение минимаксных стратегий для каждого из игроков обеспечивает выигрыш, не превышающий, и проигрыш, не меньший. Естественным для каждого игрока является вопрос увеличения выигрыша (уменьшения проигрыша). Поиски такого решения состоят в том, что игроки применяют не одну, а несколько стратегий. Выбор стратегий осуществляется случайным образом. Случайный выбор игроком своих стратегий называетсясмешанной стратегией.

В игре, матрица которой имеет размерность , стратегии игрока А задаются наборами вероятностейX = (х₁, х₂,…,х_m), с которыми игрок применяет свои чистые стратегии. Эти наборы можно рассматривать как m-мерные векторы, для компонент которых выполняются условия

Аналогично, для игрока В определяют n-мерные векторы Y = (y₁,y₂,…,y_n₎, соответствующие его смешанным стратегиям. Стратегии игроков А и В, для которых вероятности x_i и y_j отличны от нуля, называются активными.

Согласно основной теореме теории игр, каждая конечная игра имеет по крайней мере одно решение, которым может быть и определенная смешанная стратегия. Выигрыш игрока А при использовании смешанных стратегий определяется как математическое ожидание выигрыша, т.е. или (в векторной записи)XAY'. Применение оптимальной стратегии позволяет получить выигрыш, равный цене игры [3]

Для оптимальных стратегий игроков имеет место соотношение

Применение игроком А оптимальной стратегии X* должно обеспечивать ему при любых действиях игрока В выигрыш не меньше цены игры v. Поэтому выполняются следующие соотношения:

_(3.1)

Аналогично, для игрока В оптимальная стратегия Y* должна обеспечить при любых стратегиях игрока А проигрыш, не превышающий величину v, т. е. справедливо соотношение

(3.2)

Доминирование стратегий. Если платежная матрица такова, что каждый элемент некоторой строки i не меньше соответствующего элемента строки к и по меньшей мере один ее элемент строго больше соответствующего элемента строки к, то говорят, что стратегия A_j игрока 1 доминирует его стратегию A_k. Доминируемая стратегия не может быть оптимальной чистой стратегией игрока 1 и даже не может войти в его оптимальную смешанную стратегию с ненулевой вероятностью, поэтому ее можно исключить из рассмотрения, вычеркнув из матрицы строку к. Аналогично: если каждый элемент некоторого столбца j не больше соответствующего элемента столбца r и по меньшей мере один его элемент строго меньше соответствующего элемента столбца r, то говорят, что стратегия B_j игрока 2 доминирует его стратегию B_r. Поэтому столбец r матрицы можно вычеркнуть.

Пример 6.3 [2]. Рассмотрим пример использования теории игр при решении экономической задачи, которая может возникнуть в практике менеджера.

Предположим, есть две фирмы А и В, торгующие одним и тем же товаром, который пользуется спросом в течение N единиц времени. Пусть c — доход от продажи товара в единицу времени, причем продажа товара по заниженной цене законодательно запрещена. Далее, пусть качество товара зависит от времени поступления на рынок: чем позже товар поступает на рынок, тем качество выше, причем реализуется только товар более высокого качества. Наконец, пусть фирма В хочет разорить фирму А, не заботясь о своих доходах. Фирма В может использовать в качестве законного средства только момент поступления своего товара на рынок. Пусть i — момент поступления товара на рынок от фирмы А, j — момент поступления товара от фирмы В, выбор моментов — единственно возможные управленческие решения, фирма А хочет максимизировать свой доход, фирма В, как уже сказано, хочет минимизировать доход фирмы А.

Найдем функцию выигрыша, то есть доход фирмы А. Если А выпустит товар в момент i, а В — в момент j > i (скажем, i = 2, j= 5), то А не будет иметь конкурентов в течение j - i единиц времени и получит за это время доход с(j – i). Начиная с момента j, на рынке будет более «свежий» товар фирмы В, поэтому с момента j фирма А теряет свой доход. Если j < i, то есть фирма В раньше А выбрасывает на рынок свой товар; то доход фирмы А будет равен c(n + 1 - i). Если, наконец, i =j, то товары обеих фирм имеют одинаковый спрос, и каждая из фирм получает доход с(п+ 1 - i)/2. Получаем функцию выигрыша фирмы А (она же функция проигрыша В):

Пусть, например, п = 4. Тогда платежная матрица игры имеет вид:

Даже без строгих доказательств, на уровне здравого смысла, видно, что величину c в записи матрицы можно опустить.

Во-вторых, размерность матрицы можно уменьшить, удалив доминируемые стратегии: для фирмы В, контролирующей столбцы, первый столбец заведомо хуже второго, так как первая стратегия этой фирмы несет ей больший проигрыш, чем вторая. Фирма В свою первую стратегию использовать не будет (эта стратегия — доминируемая), поэтому можно перейти к матрице:

Фирма А не станет использовать свою четвертую стратегию, так как при выборе этой фирмой третьей стратегии ее выигрыш может быть лишь больше или равен выигрышу, соответствующему четвертой стратегии.

Поэтому можно перейти к матрице:

Теперь видим, что фирме В не стоит использовать третью из оставшихся стратегий, так как она доминируется второй, при выборе которой проигрыш этой фирмы меньше.

Поэтому переходим к матрице:

Наконец, видим, что фирма А не станет использовать свою вторую из оставшихся стратегий, так как выигрыш по ней меньше, чем по третьей. В итоге получаем матрицу:

которая не имеет седловой точки, то есть решение надо искать не в чистых, а в смешанных стратегиях.

Для последней матрицы оптимальные вероятности можно найти, например, графически и получить для А: X*= (0,5; 0,5), для В: Y*= (0,5; 0,5), что дает для исходной матрицы (с учетом отбрасывания второй и четвертой стратегии для А и первой и четвертой стратегии для В): X*= (0,5; 0; 0,5; 0), Y* = (0; 0,5; 0,5; 0). Цена игры (выигрыш, доход А или проигрыш В):

то есть, возвращаясь к истинной стоимости, v=1.5c. Смысл полученного результата ясен: фирма А должна с равными вероятностями выпускать товар в 1-й или 3-й момент, а фирма В — во 2-й или 3-й. При этом ожидаемый выигрыш А равен 1,5с (разорит ли А такой уровень дохода, это уже другой вопрос).

<<< < Предыдущая 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 2324 / 3024 25 26 27 28 29 30 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
27.10.2018568.83 Кб50ООП.doc
#
05.06.2015214.61 Кб30Оперативный анализ данных (OLAP).rtf
#
05.06.201527.65 Кб12Операции банка с ценными бумагами (Головин).doc
#
30.04.20194.28 Mб32Определенный интеграл.doc
#
18.09.201964 Кб1Опт и роз торг.doc
#
05.06.20152.56 Mб139Оптимиз. модели,Парето,.docx
#
05.06.2015208.6 Кб15Оптовые торговые предприятия так же.docx
#
05.06.201525.56 Кб26организационное-поведение алф.docx
#
14.11.2019340.77 Кб3Осло, в доке.docx
#
28.09.20191.11 Mб5Основная часть дипломной работы Кочубей Констан...docx
#
23.09.20191.55 Mб26основное содержание работы.doc