
- •Раздел 5. Основы теории игр
- •Раздел 1. Структура оптимизационной модели. Классификация моделей.
- •Раздел 2. Линейное программирование
- •Характеристика линейной оптимизационной модели. Примеры задач линейного программирования и графический метод их решения.
- •2 .2. Симплекс-метод
- •2.3. Теория двойственности в линейном программировании
- •Раздел 3. Нелинейное программирование.
- •3.1.Общая характеристика нелинейной оптимизационной модели.
- •3.2.Способы решения задач нелинейного программирования.
- •Раздел 4. Динамическое программирование.
- •4.1. Общая характеристика метода динамического программирования.
- •4.2. Задача транспортировки груза по сети дорог.
- •4.3.Задача распределения ресурсов.
- •4.4. Задача определения оптимальной политики замены оборудования.
- •Раздел 5. Основы теории игр.
- •5.1.Основные понятия теории игр. Парные матричные игры с нулевой суммой.
- •5.2. Методы решения матричных игр.
- •5.3. Статистические игры.
- •6. Основы теории управления запасами.
- •6.1.Основные понятия теории управления запасами.
- •6.2. Детерминированные модели управления запасами.
- •6.3. Стохастические модели управления запасами.
- •Раздел 7. Основы теории систем массового обслуживания.
- •7.1. Основные понятия теории систем массового обслуживания.
- •7.2. Основные характеристики функционирования смо с отказами.
- •7.3. Основные характеристики функционирования смо с очередью.
- •Нелинейное программирование
5.3. Статистические игры.
Статистические
игры образуют специальный класс матричных
игр, в которых одним из участников
является субъект, принимающий решение
(игрок А – статистик), а другим – «природа»
(игрок П). Под термином «природа»
подразумевается весь комплекс внешних
условий, в которых статистику приходится
принимать решение.
Статистик может осуществлять выбор
решения из m
возможных стратегий
. Природа может находиться в одном из
n
возможных состояниий
.
Если
статистик может численно оценить
величиной
последствия применения каждой своей
стратегии
при любом
состоянии природы
,
то игру можно задать платежной матрицей
следующего вида:
Содержание платежной матрицы определяется условием задачи. В частности, знак любого исхода зависит от того, каким образом данный исход удовлетворяет интересы игрока A. Любой позитивный ( с точки зрения интересов A ) исход выражается положительным числом, а негативный – отрицательным.
В играх с природой оптимальную стратегию игрока невозможно определить на базе основного неравенства теории игр, так как у природы нет осознанной стратегии, направленной против интересов A. Для определения оптимальной стратегии игрока А применяют некоторые критерии.
Начнем с рассмотрения ситуации с максимальной неопределенностью, когда о математических или статистических вероятностях наступления того или иного состояния природы ничего не известно. Для таких случаев предусмотрено применение критериев Вальда, Сэвиджа и Гурвица. Можно выделить два фактора, определяющих предпочтительный выбор того или иного критерия: 1) специфика условий, в которых приходится принимать решение; 2) субъективные склонности игрока А.
Критерий Вальда
будет выбран наиболее осторожным игроком
или же игроком, вынужденным принимать
решение в крайне неблагоприятных
условиях (ограниченность ресурсов,
отсутствие резервов и невозможность
позволить себе нести потери и т.д.).
Ориентиром в выборе оптимального решения
в таком случае будет максимин, уже
известное нам число
,
определяемое по платежной матрице как
наибольшее среди наименьших по строкам
матрицы чисел
.
Игрок, более
склонный к риску или имеющий резервы,
для того чтобы рискнуть ради более
ощутимого выигрыша, вероятнее всего
остановит свой выбор на критерии Сэвиджа.
Чтобы воспользоваться данным критерием,
игроку придется рассчитать вспомогательные
показатели
,
именуемые рисками. Для расчета рисков
в платежной матрице выделяют наилучшие
исходы по каждому состоянию природы (
максимальные числа в столбцах). Их
обозначают
.
В
каждом столбце риск определяется как
отклонение фактического исхода от
наилучшего при данном состоянии природы
по формуле
. Затем в строках матрицы
выделяют максимальные риски, которые
именуют
.
Оптимальной по критерию Сэвиджа будет
альтернатива, соответствующая наименьшему
среди
.
В
ситуации максимальной неопределенности
лицо, принимающее решение, может
полагаться не только на логически
структурированный выбор, но и на оценки
частоты наступления наихудших и наилучших
исходов, то есть на субъективное
экспертное суждение. В таком случае
выбор оптимальной альтернативы опирается
на критерий Гурвица. Базовой основой
данного критерия является параметр
,
именуемый характеристикой
«оптимизма-пессимизма», поскольку
соответствует частоте наступления
наихудших исходов. Чем ближе
к единице, тем более пессимистичен
эксперт.
Технология выбора
по критерию Гурвица такова. По строкам
платежной матрицы выбираются наихудшие
и наилучшие
исходы. Затем для каждой альтернативы
вычисляются величины
.
Оптимальной по критерию Гурвица является
альтернатива с максимальным
.
Выбор оптимальной альтернативы по критерию Лапласа опирается на максимальное математическое ожидание выигрыша игрока, рассчитанное с использованием равных вероятностей состояний природы. Делать выбор на основе критерия Лапласа вполне допустимо в ситуации с неизвестными вероятностями состояний ( при этом игрок исходит из допущения о равной вероятности наступления любого из состояний природы), но абсолютно правомерно его применение в тех случаях, когда состояния природы равновероятны, например, в силу того, что известна их математическая вероятность.
Технология выбора на основе критерия Лапласа основана на расчете ожидаемого выигрыша. Поскольку состояния равновероятны
,
то математическое ожидание выигрыша
рассчитывается по формуле
.
Максимальное математическое ожидание
указывает на оптимальную альтернативу.
В
ситуациях с известными вероятностями
состояний природы используется критерий
Байеса, который также базируется на
расчете ожидаемого выигрыша. Для
определения величины последнего вектор
вероятностей состояний природы
необходимо умножить на вектор исходов
в платежной матрице
Оптимальна по
критерию Байеса та альтернатива, у
которой значение ожидаемого выигрыша
максимально.
Рассмотрим применение разнообразных критериев выбора на примере.
Оборудование предприятия после нескольких лет эксплуатации может находиться в одном из следующих состояний: 1) требуется незначительный ремонт; 2) требуется частичная замена деталей; 3) требуется капитальный ремонт. Менеджмент предприятия определил следующие альтернативы выбора решения: 1) провести ремонт своими силами; 2) пригласить ремонтников со стороны; 3) заменить оборудование. Необходимо дать рекомендации относительно выбора оптимального решения для следующих ситуаций: а) вероятности состояний оборудования неизвестны; б) стали доступны статистические данные об опыте эксплуатации аналогичного оборудования, что позволило определить вероятность наступления каждого из его состояний.
Оценки затрат для каждого варианта решения приведены в таблице 26.
Таблица 26. Затраты, связанные с реализацией решений ( в ден. ед.).
Состояния
Альтернативы |
1 |
2 |
3 |
1 |
2 |
6 |
10 |
2 |
10 |
4 |
8 |
3 |
14 |
12 |
6 |
Предположим, вероятности состояний оборудования неизвестны. Следовательно, мы можем опираться на критерии Вальда, Сэвиджа, Гурвица или, с известной долей условности, на критерий Лапласа.
Первым шагом к оптимальному выбору будет являться составление платежной матрицы. В нашем случае она формируется на основе данных таблицы 26. Необходимо определить лишь знаки исходов. Поскольку в условии задачи приведены данные о затратах, исходы платежной матрицы – отрицательные числа (табл. 27).
Таблица 27. Платежная матрица задачи.
-
-2
-6
-10
-10
-4
-8
-14
-12
-6
Рассмотрим выбор на основе критерия Вальда ( табл. 28).
Таблица 28. Иллюстрация выбора на основе критерия Вальда.
-
-2
-6
-10
-10
-10
-4
-8
-10
-14
-12
-6
-14
По критерию Вальда можно с одинаковым основанием выбрать либо первую, либо вторую альтернативу.
Теперь выберем оптимальную альтернативу по критерию Сэвиджа ( табл. 29 и 30). Сначала выберем наилучшие исходы по каждому из состояний.
Таблица 29. Выбор .
-
-2
-6
-10
-10
-4
-8
-14
-12
-6
-2
-4
-6
Далее рассчитаем риски и сделаем выбор.
Таблица 30. Иллюстрация выбора по критерию Сэвиджа.
|
1 |
2 |
3 |
|
1 |
0 |
2 |
4 |
4 |
2 |
8 |
0 |
2 |
8 |
3 |
12 |
8 |
0 |
12 |
Критерий Сэвиджа предписывает остановить выбор на первой альтернативе.
Покажем применение
критерия Лапласа (табл. 31). В данной
задаче использование критерия Лапласа
основано на допущении о равновероятности
состояний оборудования. Вероятность
каждого состояния в данном случае
составляет
Таблица 31. Иллюстрация выбора по критерию Лапласа.
-
-2
-6
-10
-6
-10
-4
-8
-7,33
-14
-12
-6
-10,67
Критерий Лапласа указывает на первую альтернативу.
И в завершение
анализа ситуации с неизвестными
вероятностями состояний покажем
использование критерия Гурвица (табл.
32), предположив, что авторитетный эксперт
оценил частоту наступления наихудших
исходов на уровне 60%, то есть
.
Основой выбора является вычисление
величин
Таблица 32. Иллюстрация выбора по Гурвицу.
-
-2
-6
-10
-10
-2
-6,8
-10
-4
-8
-10
-4
-7,6
-14
-12
-6
-14
-6
-10,8
По критерию Гурвица оптимальна первая альтернатива.
Перейдем к анализу
ситуации «б». Предположим, стали доступны
данные об опыте эксплуатации аналогичного
оборудования, из которых следует, что
в 30% наблюдаемых случаев наступало
первое состояние, в 60% - второе и лишь в
10% - третье. Следовательно, вектор
вероятностей
Д
ля
вычисления ожидаемых выигрышей
воспользуемся формулой
Выбор по критерию Байеса показан в таблице 33.
Таблица 33. Иллюстрация выбора по критерию Байеса.
-
-2
-6
-10
-5,2
-10
-4
-8
-6,2
-14
-12
-6
-12
На основе критерия Байеса рекомендуется выбрать первую альтернативу.
Особенность данной задачи в том, что выбор по всем критериям совпадает. Однако часто разные критерии указывают на разные альтернативы, и к этому следует относиться как к естественному явлению. В таких случаях игрок должен определиться с предпочтениями и ориентировать выбор оптимальной альтернативы по самому важному и значимому для него критерию.