Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Met- 3.doc
Скачиваний:
1
Добавлен:
01.07.2025
Размер:
744.96 Кб
Скачать

6. Игры с природой.

Задача принятия решения в условиях неопределенности называется «игрой с природой». Под «природой» будем понимать совокупность неопределенных факторов, влияющих на эффективность принимаемых решений. Неопределенность в принятии решения возникает в тех случаях, когда отсутствует достаточно полная информация о состоянии объекта управления и о состоянии внешней среды. Природа выступает в качестве внешней среды. Предполагается, что множество состояний природы известно. Лицо, принимающее решение (ЛПР), является первым игроком А, который в процессе игры выбирает одну из m возможных строк платежной матрицы (они же стратегии) A1, А2,…, Am. Второй игрок П – природа, основной особенностью которой является её незаинтересованность в выигрыше. Этот противник пассивен и не противодействует достижению намеченной цели, меняя свои состояния стихийно. Пусть стратегии природы П1, …, Пn – это её состояния. Выигрыши игрока А при каждой паре стратегий Аi и Пj известны и заданы платежной матрицей (aij). Задача заключается в определении такой стратегии, применение которой обеспечило бы наибольший выигрыш игроку А. Для оценки эффективности стратегии используется критерий – числовая функция - вычисляемый по элементам платежной матрицы.

К наиболее часто используемым подходам для обоснования выбора решения ЛПР (методам выбора оптимальной стратегии) в условиях неопределенности можно отнести:

Название критерия

Критерий выбора оптимальной стратегии

Критерий Вальда (пессимиста)

Критерий оптимиста

Критерий Гурвица

где  - показатель пессимизма

Критерий Сэвиджа (минимальных сожалений)

- матрица рисков (минимальных сожалений)

Критерий Лапласа

Анализ матрицы выигрышей игры с природой начинается с выявления и отбрасывания дублирующих и доминируемых стратегий ЛПР – игрока А. Но! Ни одну из стратегий природы отбросить нельзя, так как каждое из состояний природы может наступить случайным образом, независимо от действий игрока А.

Критерий Вальда (пессимиста, или гарантированного результата) считает наилучшей стратегией максиминную стратегию, т.е. ту, которая гарантирует в наихудших условиях максимальный выигрыш.

Критерий Сэвиджа также является критерием крайнего пессимизма. Разность между максимально возможным выигрышем при данном состоянии природы и выигрышем, который будет получен при применении стратегии в тех же условиях, называется в теории игр риском. Согласно этому критерию, надо выбирать ту стратегию, при которой в наихудших условиях величина риска принимает наименьшее значение.

Критерий Гурвица помогает найти компромиссное решение между крайне пессимистичной оценкой по критерию Вальда (α=1) и крайне оптимистичной оценкой при α=0, используя промежуточное значение показателя пессимизма-оптимизма, которое характеризует степень активного «противодействия» природы с точки зрения ЛПР. Коэффициент выбирается на основании опыта, здравого смысла и т.д.

Принцип Лапласа применяется, когда ни одно состояние природы нельзя предпочесть другому, поэтому субъективно они оцениваются как равновероятные.

Пример. Руководство торговой фирмы разработало 4 плана продажи товаров A1, А2, A3, А4. В зависимости от конъюнктуры рынка П1, П2, П3, П4 рассчитаны значения прибыли (в млн.руб.) для каждой стратегии, представленные в виде матрицы выигрышей:

П1

П2

П3

П4

A1

9

8

11

8

А2

8

13

7

9

A3

11

10

9

10

А4

12

9

8

10

Определить оптимальный план продажи товаров.

► Проанализировав платежную матрицу, убеждаемся, что дублирующих и доминирующих стратегий у игрока А нет.

Найдем минимальный элемент в каждой строке и впишем его в дополнительный столбец – наихудший результат применения данной стратегии. Максимальный элемент этого столбца 9. Следовательно, оптимальной стратегией по критерию Вальда является А3, которая гарантирует прибыль не менее 9 млн.руб.

В следующий столбец впишем максимальный элемент матрицы выигрышей по каждой строке. Оптимист выбрал бы план продажи А2, дающий наибольшую прибыль 13 при состоянии рынка П2. Но кто даст гарантию, что именно это состояние рынка наступит? Поэтому воспользуемся критерием Гурвица с показателем пессимизма α=0.4. Посчитаем линейную комбинацию минимальной и максимальной величины прибыли по каждой строке и внесем её в последний столбец. Наибольшее значение критерия Гурвица Gi достигается в строке А2, значит, по критерию Гурвица следует выбрать план продажи А2.

П1

П2

П3

П4

aij

aij

Gi=0.4 aij + 0.6 aij

A1

9

8

11

8

8

11

G1=0.4*8+0.6*11=9.8

А2

8

13

7

9

7

13

G2=0.4*7+0.6*13=10.6

A3

11

10

9

10

9

11

G3=0.4*9+0.6*11=10.2

А4

12

9

8

10

8

12

G1=0.4*8+0.6*12=10.4

aij

12

13

11

10

Если мы вычислим средний выигрыш по каждой строке, то по критерию Лапласа оптимальной будет стратегия А3.

Построим матрицу рисков. Для этого найдем максимальный элемент в каждом столбце состояния природы. Затем вычислим разность между ним и каждым элементом матрицы в этом столбце и занесем найденное значение rij в новую таблицу (матрицу рисков):

П1

П2

П3

П4

rij

A1

3

5

0

2

5

А2

4

0

3

1

4

A3

1

3

2

0

3

А4

0

4

3

0

4

Согласно критерию Сэвиджа, рекомендуется выбрать ту стратегию, при которой в наихудших условиях величина риска (упущенная прибыль) принимает наименьшее значение. В каждой строке матрицы риска ищем наибольший элемент, заносим его в дополнительный столбец, сравниваем элементы этого столбца. Итак, минимальны будут сожаления при выборе плана продаж А3. Окончательный выбор между вторым и третьим планами продаж должно сделать руководство торговой фирмы (ЛПР), а критерии помогли оценить принимаемое решение с разных позиций, дабы избежать грубых ошибок. ◄

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]