6. Игры с природой.

Задача принятия решения в условиях неопределенности называется «игрой с природой». Под «природой» будем понимать совокупность неопределенных факторов, влияющих на эффективность принимаемых решений. Неопределенность в принятии решения возникает в тех случаях, когда отсутствует достаточно полная информация о состоянии объекта управления и о состоянии внешней среды. Природа выступает в качестве внешней среды. Предполагается, что множество состояний природы известно. Лицо, принимающее решение (ЛПР), является первым игроком А, который в процессе игры выбирает одну из m возможных строк платежной матрицы (они же стратегии) A_1,А₂,…, A_m. Второй игрок П – природа, основной особенностью которой является её незаинтересованность в выигрыше. Этот противник пассивен и не противодействует достижению намеченной цели, меняя свои состояния стихийно. Пусть стратегии природы П_{1, …,} П_n – это её состояния. Выигрыши игрока А при каждой паре стратегий А_i и П_j известны и заданы платежной матрицей (a_ij). Задача заключается в определении такой стратегии, применение которой обеспечило бы наибольший выигрыш игроку А. Для оценки эффективности стратегии используется критерий – числовая функция - вычисляемый по элементам платежной матрицы.

К наиболее часто используемым подходам для обоснования выбора решения ЛПР (методам выбора оптимальной стратегии) в условиях неопределенности можно отнести:

Название критерия	Критерий выбора оптимальной стратегии
Критерий Вальда (пессимиста)
Критерий оптимиста
Критерий Гурвица	где  - показатель пессимизма
Критерий Сэвиджа (минимальных сожалений)	- матрица рисков (минимальных сожалений)
Критерий Лапласа

Анализ матрицы выигрышей игры с природой начинается с выявления и отбрасывания дублирующих и доминируемых стратегий ЛПР – игрока А. Но! Ни одну из стратегий природы отбросить нельзя, так как каждое из состояний природы может наступить случайным образом, независимо от действий игрока А.

Критерий Вальда (пессимиста, или гарантированного результата) считает наилучшей стратегией максиминную стратегию, т.е. ту, которая гарантирует в наихудших условиях максимальный выигрыш.

Критерий Сэвиджа также является критерием крайнего пессимизма. Разность между максимально возможным выигрышем при данном состоянии природы и выигрышем, который будет получен при применении стратегии в тех же условиях, называется в теории игр риском. Согласно этому критерию, надо выбирать ту стратегию, при которой в наихудших условиях величина риска принимает наименьшее значение.

Критерий Гурвица помогает найти компромиссное решение между крайне пессимистичной оценкой по критерию Вальда (α=1) и крайне оптимистичной оценкой при α=0, используя промежуточное значение показателя пессимизма-оптимизма, которое характеризует степень активного «противодействия» природы с точки зрения ЛПР. Коэффициент выбирается на основании опыта, здравого смысла и т.д.

Принцип Лапласа применяется, когда ни одно состояние природы нельзя предпочесть другому, поэтому субъективно они оцениваются как равновероятные.

Пример. Руководство торговой фирмы разработало 4 плана продажи товаров A_1,А₂, A_3,А₄. В зависимости от конъюнктуры рынка П_1,П₂, П₃, П₄ рассчитаны значения прибыли (в млн.руб.) для каждой стратегии, представленные в виде матрицы выигрышей:

	П₁	П₂	П₃	П₄
A₁	9	8	11	8
А₂	8	13	7	9
A₃	11	10	9	10
А₄	12	9	8	10

Определить оптимальный план продажи товаров.

► Проанализировав платежную матрицу, убеждаемся, что дублирующих и доминирующих стратегий у игрока А нет.

Найдем минимальный элемент в каждой строке и впишем его в дополнительный столбец – наихудший результат применения данной стратегии. Максимальный элемент этого столбца 9. Следовательно, оптимальной стратегией по критерию Вальда является А₃, которая гарантирует прибыль не менее 9 млн.руб.

В следующий столбец впишем максимальный элемент матрицы выигрышей по каждой строке. Оптимист выбрал бы план продажи А₂, дающий наибольшую прибыль 13 при состоянии рынка П₂. Но кто даст гарантию, что именно это состояние рынка наступит? Поэтому воспользуемся критерием Гурвица с показателем пессимизма α=0.4. Посчитаем линейную комбинацию минимальной и максимальной величины прибыли по каждой строке и внесем её в последний столбец. Наибольшее значение критерия Гурвица G_i достигается в строке А₂, значит, по критерию Гурвица следует выбрать план продажи А₂.

	П₁	П₂	П₃	П₄	a_ij	a_ij	G_i=0.4 a_ij+ 0.6 a_ij
A₁	9	8	11	8	8	11	G₁=0.48+0.611=9.8
А₂	8	13	7	9	7	13	G₂=0.47+0.613=10.6
A₃	11	10	9	10	9	11	G₃=0.49+0.611=10.2
А₄	12	9	8	10	8	12	G₁=0.48+0.612=10.4
a_ij	12	13	11	10

Если мы вычислим средний выигрыш по каждой строке, то по критерию Лапласа оптимальной будет стратегия А₃.

Построим матрицу рисков. Для этого найдем максимальный элемент в каждом столбце состояния природы. Затем вычислим разность между ним и каждым элементом матрицы в этом столбце и занесем найденное значение r_ij в новую таблицу (матрицу рисков):

	П₁	П₂	П₃	П₄	r_ij
A₁	3	5	0	2	5
А₂	4	0	3	1	4
A₃	1	3	2	0	3
А₄	0	4	3	0	4

Согласно критерию Сэвиджа, рекомендуется выбрать ту стратегию, при которой в наихудших условиях величина риска (упущенная прибыль) принимает наименьшее значение. В каждой строке матрицы риска ищем наибольший элемент, заносим его в дополнительный столбец, сравниваем элементы этого столбца. Итак, минимальны будут сожаления при выборе плана продаж А₃. Окончательный выбор между вторым и третьим планами продаж должно сделать руководство торговой фирмы (ЛПР), а критерии помогли оценить принимаемое решение с разных позиций, дабы избежать грубых ошибок. ◄

<<< < Предыдущая 1 2 3 4 5 67 / 87 8 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
24.09.2019388.55 Кб27matan2.docx
#
17.04.20192.45 Mб19matan_1.doc
#
12.07.2019435.2 Кб21math.doc
#
01.04.2025363.01 Кб8Menedzhment-1_shpory.doc
#
01.07.2025942.08 Кб1Met- 2.doc
#
01.07.2025744.96 Кб1Met- 3.doc
#
18.04.2015410.35 Кб21met10-2012.pdf
#
18.04.2015258.63 Кб32met34-2010.pdf
#
18.04.2015517.66 Кб33met70-2012.pdf
#
01.07.202535.12 Кб0Metodicheskie_rekomendatsii_po_napisaniyu_refer...docx
#
18.04.2015199.68 Кб10Metodichka_po_vyp_dipl_rabot.doc