
- •1 Основные положения теории принятия решений
- •1.1 Особенности задач принятия решений
- •Критерии
- •Главные функции руководителей разного уровня
- •2.1 Механизм ситуации и постановка задачи
- •Матрица решений
- •2.2 Классические критерии принятия решения
- •2.3 Применение классических критериев
- •2.4 Производные критерии
- •В противном случае следует воздержаться от эксперимента и применить ту стратегию х*, для которой достигается этот самыйминимальный средний риск. Пример 4. Рассматривается игра с природой (табл. 9).
- •Решение. Перейдем к матрице рисков:
- •Предположим, что эксперимент приводит к появлению одного изBkнесовместных событий в1, в2,…, Вk:
- •Рассмотрим предыдущий пример(табл. 6) с неидеальным экспериментом, который имеет три возможных исхода:b1, b2, b3. Их условные вероятности приведены в табл. 8:
- •3 Принятие решения при неопределенности целей
- •3.1 Постановка многокритериальной задачи
- •3.2 Множество Парето
- •3.3 Построение интегрального критерия
- •Простейший метод
- •3.5 Метод анализа иерархий
- •При сравнении критериев: какой из критериев более важен,
- •Матрица сравнений критериев
- •Значения случайной согласованности
- •Матрица глобальных приоритетов
- •4 Принятие решений в условиях конфликта
- •4.2 Классификация игр
- •4.3 Матричные игры
- •4.4 Ситуация равновесия
- •Упрощение игры
- •4.5 Решение игр 2х2
- •4.6 Решение игр 2n и m2
- •4.7 Решение игр mxn
- •4.7 Симметричные игры
- •4.8 Биматричные игры
4.3 Матричные игры
Рассмотрим конечную бескоалиционную игру двух лиц: I={I,II}.
Множество стратегий первого игрока обозначим Х={х},
Множество стратегий второго – Y{y}.
Выбор каждым игроком своих стратегий определяет некоторый исход игры (x,y). Заинтересованность игроков в исходе (x,y) будем выражать функцией выигрыша:
f1(x,y)– функция выигрышей первого игрока и
f2(x,y)– функция выигрышей второго.
Поскольку игра с нулевой суммой, то f1(x,y)=-f2(x,y).
В антагонистической игре цели игроков также должны быть противоположны: если цель первого –выиграть как можно больше, то цель второго -проиграть как можно меньше.
Например, цель первого игрока – получить для своей продукции определенную долю рынка, тогда цель конкурента – не дать ему это сделать.
Для анализа игры информация записывается в виде матрицы, строками которой являются стратегии первого игрока, а столбцами – стратегии второго. На пересечении строки и столбца находится выигрыш первого игрока (он же проигрыш второго) при соответствующем исходе.
Игра решается с точки зрения первого игрока. Его цель – выиграть как можно больше. Поскольку выигрыш первого является проигрышем второго (антагонистическая игра), то цель второго -проиграть как можно меньше.
Решить игру– значит найти оптимальные стратегии каждого игрока и оценить результат, т.е. выигрыш первого игрока.
Таблица 20
Матрица игры
-
y
x
y1
y2
…
yn
x1
f1(x1,y1)
f1(x1,y2)
…
f1(x1,yn)
x2
f1(x2,y1)
f1(x2,y2)
…
f1(x2,yn)
…
…
…
…
…
xm
f1(xm,y1)
f1(xm,y2)
…
f1(xm,yn)
4.4 Ситуация равновесия
В игре может существовать ситуация равновесия – (x*, y*).
Эта точка характеризуется следующим свойством:если один игрок придерживается стратегии, соответствующей ситуации равновесия, то второму игроку невыгодно отступать от своей стратегии, соответствующей ситуации равновесия.
Пусть f1(x,y) – выигрыш первого игрока в ситуации (x,y);f2(x,y) – выигрыш второго игрока. Тогда принцип равновесия запишется в виде
f1(x,y*)f1(x*,y*)
f2(x*,y)f2(x*,y*).
Умножим второе неравенство на (-1):
-f2(x*,y-f2(x*,y*),
или, учитывая, что f1(x,y)=-f2(x,y),
f1(x*,y)f1(x*,y*),откуда
f1(x,y*)f1 (x*,y*)f1(x*,y)
Таким образом, ситуация равновесия – точка, выигрыш в которой первого игрока минимален по yи максимален поx:
.
П
y1 y2 y3
,
тогда первый игрок выбирает 1-ую стратегию, ориентируясь на максимальный выигрыш 5. Второй игрок выбирает свою вторую стратегию, чтобы проиграть 1, а не 5. На следующем шаге 1-ый игрок ходит своей второй стратегией, чтобы максимизировать свой выигрыш при 2-ой стратегии 2-го игрока, на что тот отвечает опять же своей второй стратегией, чтобы минимизировать свой проигрыш. Далее игра становится устойчивой, т.к. ситуация (x2,y2) выгодна обоим игрокам.
Когда в игре есть ситуация равновесия, то через какое-то число ходов игра сойдется и станет устойчивой – игрокам нет смысла скрывать свои стратегии. Если игра не имеет ситуации равновесия, то игроки сохраняют свои стратегии в тайне.
Чтобы определять ситуации равновесия, надо научиться находить гарантирующие стратегии для каждого из игроков.
Вернемся к Примеру 1. Анализируя
матрицу игры,Iигрок
должен выбрать для каждой своей стратегии
тот гарантированный результат, который
он получит независимо от того, какую
стратегию применитIIигрок. Очевидно, этот результат равен.
Тогда из всех стратегий он должен выбрать
ту, для которой этот минимум максимален:
.
Здесь 1 – гарантированный результатдляIигрока: он не получит меньше, чем1, при любой стратегииIIигрока. Следует заметить, что аналогичного принципа придерживается ЛПР в нестратегической игре с природой, когда, не желая рисковать, он выбирает минимаксный критерий.
Аналогично, IIигрок выбирает для каждой своей стратегии максимальный проигрыш, а затем из всех стратегий выбирает ту, для которой этот максимальный проигрыш является минимальным:
.
Здесь 2 – гарантированный результатдляIIигрока:
он не проиграет больше, чем 2, при любой стратегии первого игрока.
Соответствующие стратегии носят названия: максиминная- дляIигрока, - иминимаксная – для второго.
Гарантированные результаты:1=
– нижняя цена игры, 2=
– верхняя цена игры.
Можно показать, что всегда ,
или
.
Действительно,
- по свойству с.р. Но еслиf(x)<g(x),minf(x)<ming(x),
т.е.
,
справа стоит константа. Если функция
ограничена сверху константой, то и
максимум этой функции ограничен ею же.
Т.е.
,
ч.т.д.
Это неравенство носит название неравенство минимаксови успешно используется для решения игр.
Если =,то это ситуация равновесия, илиседловаяточка. Соответствующая
пара стратегий является решением игры.
Пример. Пусть задана матрица игры:
Найдем гарантированные результаты каждого игрока:
=maxxminyfij=2;
=minymaxxfij=2
– в игре есть седловая точка. Тогда
цена игры равна 2, а решение игры – (х2,y2).
Седловых точек в игре может быть несколько, причем цена игры в каждой одинакова.
Стремление игроков к ситуации равновесия, описываемой седловой точкой, носит название принципа достижимости целей, т.к. только ситуации равновесия могут быть предметом договоров, которые будут соблюдаться (игрокам невыгодно отступать от такой ситуации).
К сожалению, далеко не все игры имеют седловые точки, они скорее исключение, чем правило. Обычно гарантированные результаты игроков не совпадают. Как же решать игру в этом случае? Существуют ли оптимальные решения в играх без седловых точек?
Теорема Неймана гарантирует, что каждая антагонистическая игра имеет оптимальные стратегии.
Пример 2. Задана матрица игры:
=4;
=6.
Если первый игрок будет придерживаться своей оптимальной стратегии (х2), то его выигрыш будет не меньше, чем 4. Второй игрок, придерживаясь своей гарантирующей стратегииy1, проиграет не больше, чем 6. Анализируя поведение игроков при выборе хода, можно сообразить, что пока твои ходы знает противник, ситуации равновесия не будет. В играх без седловой точки свои ходы надотщательно скрывать. Это игры сзакрытойинформацией. Однако интервал [4;6] каждый из игроков хочет перераспределить в свою пользу, и это выгодно им обоим. Значит, надо придумать такую процедуру поведения, чтобы[4;6]. Правильное поведение состоит в том, чтобы стратегию выбирать случайно – не на основании каких-то разумных соображений, - но сама схема рандомизации должна выбираться разумно. В этом состоит идея использования смешанных стратегий.
Смешанная стратегия – это случайная величина, значениями которой являются чистые стратегии игрока. Это сложная стратегия, состоящая в случайном чередовании двух или более чистых стратегий с определенными частотами.
В теории игр доказано, что устойчивое решение в играх без седловой точки лежит в области смешанных стратегий.
Тогда смешанная стратегия первого игрока – это случайная величина
=
,
или просто вероятностное распределение
на
множестве чистых стратегий Р = (р1,
р2, ,
рm), причем.
Смешанная стратегия второго игрока – это случайная величина
=
,Q = (q1,
q2, ,
qn),
.
При использовании смешанной стратегии перед каждой партией игры пускается в ход какой-то механизм случайного выбора, обеспечивающий появление каждой стратегии с некоторой частотой, затем берется та стратегия, на которую пал жребий. Применение смешанной стратегии - это гибкая тактика, при которой противник не знает и не может знать заранее, с чем ему придется встретиться.
Очевидно, что любая чистая стратегия
является частным случаем смешанной:
например, х1=Р(1,0,…,0). Таким образом,
для любой игры существует пара (P,Q)
смешанных стратегий. Платеж, соответствующий
паре (P,Q),
называется ценой игры.
Поскольку первый игрок гарантирует
себе при этом выигрыш,а второй игрок гарантирует себе
проигрыш
,
то применение смешанных стратегий
выгодно обоим игрокам.
Некоторые чистые стратегии могут не войти в PилиQ. Их частоты тогда будут равны нулю. В этом случае стратегии, которые входят в оптимальную смешанную стратегию (им соответствуют ненулевые вероятности), называютсяактивными стратегиями.
Решить игру – значит найти цену игры и оптимальные стратегии каждого игрока.
Таким образом, можно выделить следующий алгоритм решения игры.
Упростить игру.
Найти гарантированные результаты для каждого игрока.
Если существует седловая точка, то найти решение игры в чистых стратегиях.
Если седловой точки нет, то найти решение игры в смешанных стратегиях.
Рассмотрим по очереди каждый из этапов.