Лабораторная работа №8. Решение задач по принятию оптимальных решений в условиях конфликтных ситуаций
Цель работы:
Целью лабораторной работы является получение навыков самостоятельной алгоритмической реализации решения статистических игр для принятия оптимальных решений, изучение сущности игровых моделей, возможностей их использования на практике, а также изучение многообразия постановок статистических игр.
Требования к содержанию, оформлению и порядку выполнения
Номер варианта индивидуального задания определяется последней цифрой в зачетной книжке студента (цифра 0 соответствует варианту № 10) или порядковым номером компьютера в компьютерном классе, за которым работает студент.
Лабораторные работы заключаются в изучении и программной реализации методов, рассмотренных в теоретическом курсе дисциплины.
Перед работой непосредственно на компьютере студенты обязаны внимательно изучить соответствующий теоретический материал, разобрать примеры, представленные на лекциях.
Программирование методов, указанных в заданиях лабораторных работ, следует выполнять самостоятельно, используя команды языка программирования пакета Matlab.
После завершения создания m-файлов в пакете Matlab, реализующих указанные методы, следует выполнить вычисления на основании данных своего варианта. Обязательно следует выполнить проверку полученных на компьютере результатов вычислений.
Отчет оформляется в соответствии с приведенным образцом.
Отчет о выполнении задания лабораторной работы должен содержать следующие разделы:
1. Формулировка задания на программирование.
2. Краткое описание исследуемого метода - фрагмент лекционного материала.
3. Текст программы в виде m-файла - является основным результатом выполнения работы.
4. Исходные данные, номер варианта.
5. Результаты вычислений, включая промежуточные результаты - копии текстовых файлов или копии экранных форм, графики.
6. Результаты проверки полученных данных
Общая постановка задачи
В результате выполнения заданий лабораторной работы студенты должны уметь создавать алгоритмическую поддержку для реализации решения статистических игр, описывающих конфликтные ситуации, на основе использования критериев Байеса, Лапласа, Вальда, Сэвиджа или Гурвица.
Лабораторные занятия проводятся в компьютерных классах.
Теоретическая часть
В особую группу игр выделяют статистические игры. Их особенность состоит в том, что сознательный игрок А (т.е. статистик) заинтересован в наиболее выгодном для него исходе игры. Играет он против игрока В, который совершенно безразличен к результату игры. В его качестве выступают возможные состояния природы (т. е. П). Стратегии игрока П обозначают совокупность внешних условий, в которых игрок А выбирает свою стратегию. Поэтому, при решении статистической игры находят только наилучшие рекомендации для игрока А. Если он имеет возможность численно оценить (величиной аij) последствия применения каждой чистой стратегии Аi при любом состоянии Пj природы, то игру задают платежной матрицей (таблица 1).
Таблица 1. Платежная матрица игры
Стратегия игроков |
П1 |
П2 |
… |
П n |
А1 |
a11 |
a12 |
… |
a1n |
А2 |
a21 |
a22 |
… |
a2n |
… |
… |
… |
… |
… |
Аm |
am1 |
am2 |
… |
amn |
При поиске оптимальных стратегий для игрока А обращаются к различным критериям, применение которых описано на конкретных примерах в разделе Пример выполнения работы.
Критерий Байеса
Критерий Байеса (принцип математического ожидания) предполагает полное доверие лица, принимающего решение, известным вероятностям состояний окружающей среды. Следовательно, данная задача – это задача принятия решения в условиях риска. При выборе оптимальной стратегии игрока А используют критерий Байеса. В качестве оптимальной принимается такая чистая стратегия Аi, которая обеспечивает игроку максимальный средний выигрыш:
,
где
— средний выигрыш игрока А при применении
стратегии i;
аij
— выигрыш
игрока А при применении им стратегии i
в условиях реализации
природы стратегии j;
qj
— вероятности,
с которыми природа реализует
состояния Пj.
Критерий Лапласа
Критерий Лапласа (принцип недостаточного основания) предполагает недоверие лица, принимающего решение, известным вероятностям состояний окружающей среды. Если игроку А представляются в равной мере правдоподобными все состояния природы Пj, т. е. q1 = q2 = ... = qn, то для определения его оптимальной стратегии используют критерий Лапласа:
Критерий Вальда
Критерий Вальда предполагает полное недоверие лица, принимающего решение, известным вероятностям состояний окружающей среды. Либо же вероятности состояний окружающей среды считаются неизвестными. Следовательно, данная задача – это задача принятия решения в условиях неопределенности.
При неопределенности выбор наилучшей стратегии может основываться на введении различных разумных гипотез о поведении окружающей среды.
Одна из важнейших и основополагающих гипотез такого типа называется гипотезой антагонизма. Она состоит в предположении, что окружающая среда ведет себя наихудшим для ЛПР образом. На этой гипотезе основывается принцип максимина (критерий Вальда), называемый также принципом гарантированного результата. Если вероятности qj состояний природы Пj неизвестны, то для нахождения оптимальной стратегии игрока А используют критерии Вальда, Сэвиджа и Гурвица.
По критерию Вальда в качестве оптимальной рекомендуется выбирать ту стратегию, которая гарантирует в наихудших условиях максимальный выигрыш:
.
Критерий Сэвиджа
Критерии Сэвиджа и Вальда являются критериями крайнего пессимизма. В соответствии с критерием Сэвиджа оптимальной будет стратегия, в наихудших условиях обеспечивающая наименьшую величину риска. Для обоснования оптимальной стратегии игрока А по нему необходимо:
построить матрицу риска (определить значение коэффициентов риска rij):
,
где i — номер строки; j — номер столбца; аij — элемент матрицы a, стоящий в i-й строке j-го столбца; mах аij — максимальный элемент аij в каждом столбце;
определить максимальное значение коэффициентов риска по каждой строке, т.е.
;найти минимальное значение коэффициентов риска по столбцу, полученному выше, т. е.
.
В результате определим стратегию предприятия, характеризующуюся наименьшим максимальным риском:
.
Критерий Гурвица
Критерий Гурвица называется критерием обобщенного максимума или пессимизма — оптимизма. Решение принимается в условиях неопределенности. Оптимальная стратегия игрока А согласно этому критерию выбирается по формуле
,
где 0
1.
Коэффициент
выбирается на основании субъективных
соображений
(опыта, здравого смысла, оценок экспертов
и т. д.). Если
= 1, критерий
Гурвица превращается в критерий крайнего
пессимизма, если
= 0 — в критерий крайнего оптимизма.
