- •Тема 5. Принятие решений в условиях неопределенности
- •Тема 5. Принятие решений в условиях неопределенности 1
- •5.1.Критерии в условиях неопределенности
- •5.1.1.Критерий Лапласа
- •5.1.2. Минимаксный критерий
- •5.1.3.Критерий Сэвиджа
- •5.1.4. Критерий Гурвица
- •5.1.5. Пример.
- •5.2. Теоретико-игровые модели
- •5.2.1. Оптимальность в форме равновесия
- •5.2.2. Почти антагонистические игры
- •5.2.3. Принципы оптимальности в условиях обмена информацией
- •5.2.4.Смешанные стратегии
- •5.3. Игры с нулевой суммой
- •5.3.1. Оптимальное решение игры двух лиц с нулевой суммой
- •5.3.2. Теорема о минимаксе
- •5.3.3. Решение игр с нулевой суммой в смешанных стратегиях
- •5.4. Методы решения матричных игр в смешанных стратегиях
- •5.4.1. Графическое решение игр
- •5.4.2. Метод последовательных приближений
- •5.4.3. Решение матричных игр методами линейного программирования
5.1.2. Минимаксный критерий
[Розен 4 н]
Рассмотрим одну из важнейших гипотез о поведении среды, называемую гипотезой антагонизма. Она состоит в предположении, что среда ведет себя наихудшим (для принимающего решение) образом. При принятии этой гипотезы каждая альтернатива оценивается наименьшим из числовых значений исходов, возможных при выборе этой альтернативы. Если задача принятия решения представлена в форме табл.5.1, то оценкой альтернативы xi (показателем «полезности» альтернативы xi) является . При принятии гипотезы антагонизма наилучшей (оптимальной) надо признать ту альтернативу, которая максимизирует этот показатель, т. е. альтернативу с тем номером i, для которого будет наибольшим.
Формально она характеризуется тем условием, что на ней достигается внешний экстремум в выражении .
Такой принцип выбора решения называется принципом максимина, а альтернатива, на которой достигается внешний экстремум в выражении – максиминной.
Значение принципа максимина как принципа выбора решения состоит не только (и даже не столько) в том, что поведение, при котором стороны преследуют противоположные цели и, следовательно, могут рассматриваться как антагонисты, является довольно распространенным. Дело еще в том, что число представляет собой важную характеристику альтернативы xi – является ее гарантированным уровнем. Если будет выбрана альтернатива xi, то, что бы ни произошло, результат не может быть хуже, чем , поэтому – это наибольший из гарантированных результатов. В силу этого принцип максимина называют также «принципом наибольшего гарантированного результата» (см. Ю. Б. Гермейер. Введение в теорию исследования операций. — М.: Наука, 1971). Максиминная оценка является единственной абсолютно надежной оценкой при принятии решения в условиях неопределенности.
Таким образом, максиминный критерий основан на консервативном осторожном поведении лица, принимающего решение, и сводится к выбору наилучшей альтернативы из наихудших. Если величина a(xi,yj) представляет получаемую прибыль, то в соответствии с максиминным критерием в качестве оптимального выбирается решение, обеспечивающее
.
Если величина a(xi,yj) представляет потери, используется минимаксный критерий, который определяется следующим соотношением.
.
Для примера «брать ли билет?» гипотеза антагонизма формулируется в виде следующего предположения: если Некто берет билет, то контролер не появляется; если Некто не берет билета, контролер появляется.
Показателем «полезности» первой альтернативы (брать билет) является ее гарантированный уровень min (-2, -3)=-3, второй альтернативы (не брать билета) – число min(-200, 0)=-200. Наибольший из гарантированных результатов (максимин) равен здесь -3, а альтернатива «брать билет» является максиминной.
В примере «зонтики, шляпы, плащи» гарантированные уровни трех имеющихся альтернатив равны соответственно 40, 25 и 50, третья альтернатива является максиминной.
5.1.3.Критерий Сэвиджа
Критерий Сэвиджа стремится смягчить консерватизм минимаксного (максиминного) критерия путем замены матрицы платежей (выигрышей или проигрышей) a(xi,yj) матрицей потерь r(xi,yj), которая определяется следующим образом.
Чтобы показать, как критерий Сэвиджа «смягчает» минимаксный (максиминный) критерий, рассмотрим следующую матрицу платежей a(xi,yj):
|
y1 |
y2 |
Максимум строк |
x1 |
$11000 |
$90 |
$11000 |
x2 |
$10000 |
$10000 |
$10000 |
Применение минимаксного критерия приводит к тому, что решение x2 с фиксированными потерями в 10000 долларов является предпочтительным.
Однако, здравый смысл подсказывает, что можно выбрать и альтернативу x1, так как в этом случае имеется возможность потерять лишь 90 долларов, если реализуется состояние y2 что на 9910 долларов меньше гарантированных потерь при выборе альтернативы x2.
Посмотрим, какой результат получится, если в минимаксном критерии вместо матрицы платежей a(xi,yj) используем матрицу потерь r(xi,yj)
|
y1 |
y2 |
Максимум строк |
x1 |
$1000 |
$0 |
$1000 |
x2 |
$0 |
$9910 |
$9910 |
Как видим, минимаксный критерий, применяемый к матрице потерь, приводит к выбору решения x1, в качестве предпочтительного.