- •Тема 3. Принятие решений в условиях неопределенности.
- •3.1. Классификация зпр в условиях неопределенности и обзор методов их решения
- •3.2. Принятие решений в условиях повторяющейся одноуровневой конфликтной ситуации (элементы теории стратегических игр)
- •3.3. Формальное описание парной антагонистической игры
- •3.4. Игры с седловой точкой
- •3.5. Методы решения игр.
3.4. Игры с седловой точкой
Для того чтобы определить понятие седловой точки, необходимо определиться с тем, что понимается под максимином и минимаксом платежной матрицы.
Максимином или нижней ценой игры называется элемент платежной матрицы, равный максимуму из минимумов по строкам матрицы. Если обозначить максимин через v1, то
(3.9)
Минимаксом или верхней ценой игры называется такой элемент матрицы, который равен минимуму из максимумов по столбцам матрицы. Если обозначить минимакс через v2, то
(3.10)
Например:
|
y1 |
y2 |
y3 |
y4 |
qi min |
x1 |
3 |
8 |
2 |
3 |
2 |
x2 |
4 |
3 |
8 |
5 |
3 maxmin |
x3 |
7 |
2 |
1 |
6 |
1 |
qj max |
7 |
8 |
8 |
6 minmax |
|
Очевидно, что величины максимина и минимакса связаны соотношением
v1 ≤ v2 (3.11)
Стратегия игрока 1, соответствующая максимину v1 называется максиминной стратегией. Стратегия игрока 2, соответствующая минимаксу v2, называется минимаксной стратегией. Минимаксная и максиминная стратегии образуют пару минимаксных стратегий.
Если игрок 1 будет придерживаться своей максиминной стратегии, то он независимо от поведения противника гарантирует себе выигрыш не менее чем максимин v1, то есть не менее нижней цены игры. Если игрок 2 будет придерживаться своей минимаксной стратегии, то он гарантирует себе, что проиграет не более чем минимакс v2, то есть не более верхней цены игры. Минимаксные стратегии часто называют стратегиями предельной осторожности или стратегиями гарантированного результата (выигрыша или проигрыша).
Принцип осторожности, диктующий игрокам выбор соответствующих стратегий (максиминной или минимаксной), является в теории игр одним из основных и называется принципом минимакса. Он вытекает из предположения о разумности каждого игрока, стемящегося в операции достигнуть цели, противоположной цели противника.
Существуют игры, для которых максимин равен минимаксу, то есть v1 = v2. Соответствующий элемент платежной матрицы называется седловой точкой. Иначе, седловой точкой называется элемент, который является одновременно минимальным в своей строке и максимальным в своем столбце.
|
y1 |
y2 |
y3 |
qi min |
x1 |
1 |
3 |
10 |
1 |
x2 |
6 |
4 |
5 |
4 maxmin |
x3 |
8 |
3 |
2 |
2 |
qj max |
8 |
4 minimax |
10 |
|
Элемент платежной матрицы, соответствующий ее седловой точке (если она существует), называется чистой ценой игры. Обозначим ее через v. Совокупность минимаксных стратегий и чистая цена игры v являются решением игры с седловой точкой или, иначе, решением игры в чистых стратегиях (стратегия, выбираемая игроком в результате сознательного акта, без привлечения какого-либо случайного механизма).
В этих условиях если один из игроков узнает о намерении другого придерживаться минимаксной стратегии, то эта информация вынуждает его придерживаться своей минимаксной стратегии, а, значит, в игре с седловой точкой нет необходимости скрывать свои намерения.
