- •Глава 3. Моделирование поведения фирмы в различных рыночных условиях.
- •1. Типы рынков.
- •2. Планирование производства в условиях совершенной конкуренции
- •3. Математическое моделирование поведения продавца в условиях монополии
- •4. Дуополия Курно.
- •Распространение модели Курно на n предприятий.
- •5. Введение в теорию игр.
- •Матричные игры с седловой точкой.
- •Матричные игры без седловой точки.
- •Связь матричных игр с линейным программированием
- •6. Игры с природой.
- •Принятие решений в условиях риска, т.Е. При известных вероятностях состояний природы.
6. Игры с природой.
Задача принятия решения в условиях неопределенности называется «игрой с природой». Под «природой» будем понимать совокупность неопределенных факторов, влияющих на эффективность принимаемых решений. Неопределенность в принятии решения возникает в тех случаях, когда отсутствует достаточно полная информация о состоянии объекта управления и о состоянии внешней среды. Природа выступает в качестве внешней среды. Предполагается, что множество состояний природы известно. Лицо, принимающее решение (ЛПР), является первым игроком А, который в процессе игры выбирает одну из m возможных строк платежной матрицы (они же стратегии) A1, А2,…, Am. Второй игрок П – природа, основной особенностью которой является её незаинтересованность в выигрыше. Этот противник пассивен и не противодействует достижению намеченной цели, меняя свои состояния стихийно. Пусть стратегии природы П1, …, Пn – это её состояния. Выигрыши игрока А при каждой паре стратегий Аi и Пj известны и заданы платежной матрицей (aij). Задача заключается в определении такой стратегии, применение которой обеспечило бы наибольший выигрыш игроку А. Для оценки эффективности стратегии используется критерий – числовая функция - вычисляемый по элементам платежной матрицы.
К наиболее часто используемым подходам для обоснования выбора решения ЛПР (методам выбора оптимальной стратегии) в условиях неопределенности можно отнести:
Название критерия |
Критерий выбора оптимальной стратегии |
Критерий Вальда (пессимиста) |
|
Критерий оптимиста |
|
Критерий Гурвица |
|
Критерий Сэвиджа (минимальных сожалений) |
|
Критерий Лапласа |
|
Анализ матрицы выигрышей игры с природой начинается с выявления и отбрасывания дублирующих и доминируемых стратегий ЛПР – игрока А. Но! Ни одну из стратегий природы отбросить нельзя, так как каждое из состояний природы может наступить случайным образом, независимо от действий игрока А.
Критерий Вальда (пессимиста, или гарантированного результата) считает наилучшей стратегией максиминную стратегию, т.е. ту, которая гарантирует в наихудших условиях максимальный выигрыш.
Критерий Сэвиджа также является критерием крайнего пессимизма. Разность между максимально возможным выигрышем при данном состоянии природы и выигрышем, который будет получен при применении стратегии в тех же условиях, называется в теории игр риском. Согласно этому критерию, надо выбирать ту стратегию, при которой в наихудших условиях величина риска принимает наименьшее значение.
Критерий Гурвица помогает найти компромиссное решение между крайне пессимистичной оценкой по критерию Вальда (α=1) и крайне оптимистичной оценкой при α=0, используя промежуточное значение показателя пессимизма-оптимизма, которое характеризует степень активного «противодействия» природы с точки зрения ЛПР. Коэффициент выбирается на основании опыта, здравого смысла и т.д.
Принцип Лапласа применяется, когда ни одно состояние природы нельзя предпочесть другому, поэтому субъективно они оцениваются как равновероятные.
Пример. Руководство торговой фирмы разработало 4 плана продажи товаров A1, А2, A3, А4. В зависимости от конъюнктуры рынка П1, П2, П3, П4 рассчитаны значения прибыли (в млн.руб.) для каждой стратегии, представленные в виде матрицы выигрышей:
-
П1
П2
П3
П4
A1
9
8
11
8
А2
8
13
7
9
A3
11
10
9
10
А4
12
9
8
10
Определить оптимальный план продажи товаров.
► Проанализировав платежную матрицу, убеждаемся, что дублирующих и доминирующих стратегий у игрока А нет.
Найдем минимальный элемент в каждой строке и впишем его в дополнительный столбец – наихудший результат применения данной стратегии. Максимальный элемент этого столбца 9. Следовательно, оптимальной стратегией по критерию Вальда является А3, которая гарантирует прибыль не менее 9 млн.руб.
В следующий столбец впишем максимальный элемент матрицы выигрышей по каждой строке. Оптимист выбрал бы план продажи А2, дающий наибольшую прибыль 13 при состоянии рынка П2. Но кто даст гарантию, что именно это состояние рынка наступит? Поэтому воспользуемся критерием Гурвица с показателем пессимизма α=0.4. Посчитаем линейную комбинацию минимальной и максимальной величины прибыли по каждой строке и внесем её в последний столбец. Наибольшее значение критерия Гурвица Gi достигается в строке А2, значит, по критерию Гурвица следует выбрать план продажи А2.
|
П1 |
П2 |
П3 |
П4 |
|
|
Gi=0.4 aij + 0.6 aij |
A1 |
9 |
8 |
11 |
8 |
8 |
11 |
G1=0.4*8+0.6*11=9.8 |
А2 |
8 |
13 |
7 |
9 |
7 |
13 |
G2=0.4*7+0.6*13=10.6 |
A3 |
11 |
10 |
9 |
10 |
9 |
11 |
G3=0.4*9+0.6*11=10.2 |
А4 |
12 |
9 |
8 |
10 |
8 |
12 |
G1=0.4*8+0.6*12=10.4 |
|
12 |
13 |
11 |
10 |
|
|
|
Если мы вычислим средний выигрыш по каждой строке, то по критерию Лапласа оптимальной будет стратегия А3.
Построим матрицу рисков. Для этого найдем максимальный элемент в каждом столбце состояния природы. Затем вычислим разность между ним и каждым элементом матрицы в этом столбце и занесем найденное значение rij в новую таблицу (матрицу рисков):
-
П1
П2
П3
П4
rij
A1
3
5
0
2
5
А2
4
0
3
1
4
A3
1
3
2
0
3
А4
0
4
3
0
4
Согласно критерию Сэвиджа, рекомендуется выбрать ту стратегию, при которой в наихудших условиях величина риска (упущенная прибыль) принимает наименьшее значение. В каждой строке матрицы риска ищем наибольший элемент, заносим его в дополнительный столбец, сравниваем элементы этого столбца. Итак, минимальны будут сожаления при выборе плана продаж А3. Окончательный выбор между вторым и третьим планами продаж должно сделать руководство торговой фирмы (ЛПР), а критерии помогли оценить принимаемое решение с разных позиций, дабы избежать грубых ошибок. ◄
