Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1513.pdf
Скачиваний:
6
Добавлен:
07.01.2021
Размер:
1.24 Mб
Скачать

3. ИГРЫ С ПРИРОДОЙ

На практике при решении ряда экономических задач, приводящихся к игровым моделям, имеется неопределенность, вызванная отсутствием информации об условиях, в которых осуществляются действия (например, погода или покупательский спрос). Эти условия зависят не от сознательных действий другого игрока, а от объект вной действительности. Такие игры называются играми с пр родой. При этом если человек в них старается действовать осмотр тельно, то второй игрок действует случайно.

Предполож м, что некий экономический субъект (игрок)

С

 

из некоторого множества 1,2,...,m. Он знает,

выбирает свои стратег

что внешн й

р (природа) независимо от его действий может

наход ться

в одном

з состояний: 1,2,...,n. Эти состояния можно

условно сч тать стратегиями природы, каждая из которых в

сочетан

 

со стратег

игрока приводит к определённым исходам.

ями

 

 

 

Каждый

сход оцен вается игроком в зависимости от полезности для

него этого

 

схода. Так м о разом, множество исходов и заданная на

них функция полезности экономического субъекта задают платёжную

матрицу

a

ij

.

 

 

 

 

 

 

 

m n

 

 

 

 

 

Следовательно, игру против природы можно считать частным

случаем матричной игры. Её особенность заключается в том, что

второй игрок (природа) не преследует собственные цели, а является

 

 

бА

 

безразличным игроком. Модели выбора решения в игре против

природы можно поделить на два типа: с использованием критериев

оптимальности и с использованием смешанных стратегий.

 

Критерии оптимальности

Д

 

 

 

 

 

 

Рассмотрим

случай, когда

лицо, принимающее

решение

(экономический субъект), не располагает информацией о том, как

распределены вероятности состояний среды, и даже не знает, какие из

этих состояний более вероятны. В таких случаяхИприменяют критерий

оптимальности.

 

 

 

 

 

Критерий оптимальности – это правило выбора наилучшего

решения в условиях неопределённости, основанное на конкретных

предположениях

относительно

 

поведения окружающей

среды

(природы) и предпочтений игрока (лица, принимающего решение).

53

При этом желательно, чтобы критерий оптимальности обладал свойствами, согласующимися со здравым смыслом.

Для выбора оптимальной стратегии при решении игр с природой существует несколько критериев. Рассмотрим наиболее часто применяемые.

1. Критерий Вальда.

В соответствии с критерием Вальда в качестве оптимальной выбирается стратег я, гарантирующая выигрыш не меньший, чем

нижняя

цена

гры

с природой.

Правило

выбора

решения в

соответств

 

с

 

кр терием

 

Вальда

можно

интерпретировать

следующ м образом: матрица решений дополняется еще одним

С

 

 

 

 

 

каждой

строки. Выбрать

столбцом

з на меньших результатов

надлеж

т тот вар

 

ант, в строке которого стоит наибольшее значение

этого столбца.

 

Вы ранное

таким

образом

решение

полностью

 

 

р ск. Это означает, что принимающий решение не может

столкнуться с худш м результатом, чем тот, на который он

исключает

 

 

 

 

 

соответствующий

ориент руется.

Как е

ы условия не встретились,

результат не может оказаться ниже W . Это свойство заставляет

считать критерий Вальда одним из фундаментальных. Поэтому в

технических задачах он применяется чаще всего как сознательно, так

и неосознанно. Однако в практических ситуациях излишний

пессимизм этого критерия может оказаться очень невыгодным.

Применение этого критерия может быть оправдано, если

ситуация,

в которой принимается решение, характеризуется

 

 

бА

 

 

следующими обстоятельствами:

Д

- о вероятности появления состояния Vj ничего не известно;

- с появлением состояния Vj

необходимо считаться;

 

И

- реализуется лишь малое количество решений; - не допускается никакой риск.

2. Критерий максимума.

Суть критерия состоит в том, что выбирается условие maxmaxaij , поэтому он является оптимистическим, т.к. считается, что

природа будет наиболее благоприятна для человека.

3. Критерий Гурвица.

Рекомендует применять стратегию, определяемую формулой

max min aij 1 max aij ,

где – степень оптимизма, 0;1 .

54

Критерий придерживается промежуточной позиции. При 1 критерий превращается в критерий Вальде, а при 0– в критерий

максимума.

 

 

 

На число

влияет

степень

ответственности лица,

принимающего решение по выбору стратегии: чем больше желание

С

 

 

 

застраховаться, тем ближе к 1.

 

 

Недостатком

критерия

Гурвица

является субъективная

обоснованность выбора значения параметра . 4. Кр тер й Сэв джа.

. Наход тся матрица рисков, элементы которой отражают убытки от ош бочного действия, т.е. выгоду, упущенную в результате принят я i-го решен я в j-м состоянии. Т.е. элементы матрицы

привестиуть этого кр терия заключается в выборе такой стратегии чтобы не допуст ть чрезмерно высоких потерь, к которым она может

рисков показывают, какой у ыток понесет человек (фирма), если для

критер ю выберетВальда, дающее наименьшее значение максимального сожаления.

каждого состоян я пр роды он не

наилучшей стратегии.

Затем по матр це вы ирается решение по пессимистическому

В соответствии с критерием Сэвиджа в качестве оптимальной

выбирается такая стратегия, при которой величина риска принимает

наименьшее значение в самой не лагополучной ситуации.

 

Элементы

 

 

Д

 

 

матрицы рисков находятся по формуле

r

maxa

ij

a

ij

,

гдеАmaxa – максимальный элемент в столбце

ij

 

 

 

ij

 

исходной матрицы.

Оптимальная стратегия находится из выражения minmaxrij .

Выбирается тот вариант, в строке которогоИстоит наименьшее значение.

Критерий Сэвиджа отличается от критерия Вальда тем, что по нему реализуется принцип минимакса для матрицы потерь, а для критерия Вальда – принцип максимина для матрицы выигрышей.

5. Критерий Лапласа.

В основе этого критерия лежит принцип недостаточного основания. Если нет достаточных оснований считать, что вероятности того или иного спроса имеют неравномерное распределение, то они принимаются одинаковыми. Для решения задачи для каждого решения подсчитывается сумма всех стратегий, которая делится на вероятность появления этой стратегии; выбирается то решение, при котором величина этого выигрыша максимальна.

55

Пример 1. Определение производственной программы предприятия в условиях риска и неопределенности. Некоторая фармацевтическая фирма производит лекарственные препараты, при этом на одни из них (1-я группа) пик спроса приходится на летний период, а на другие (2-я группа) – на осенний и весенний периоды.

Затраты фирмы на 1 условную единицу продукции за сентябрь – октябрь составили: по первой группе – 20 у.д.е., по второй – 15 у.д.е.

По данным наблюдений службы маркетинга фирмы за некоторый пер од, установлено, что она может реализовать в течение этих рассматр ваемых двух месяцев в условиях теплой погоды

3050 усл.ед. продукц

первой и 1100 усл.ед. продукции второй

С

 

 

 

 

 

группы; а в услов ях холодной погоды – 1525 усл. ед. продукции

первой группы 3690 усл.ед. продукции второй группы.

 

В связи

возможными изменениями погоды ставится задача –

определ ть

стратег ю

фирмы

в

выпуске

продукции,

обеспеч вающую

 

доход от

реализации

при цене

максимальный

 

 

 

 

продажи 40 у.д.е. за 1 усл.ед. продукции первой группы и 30 у.е. –

второй группы.

 

 

 

 

 

Решение. О означим стратегии фирмы:

 

 

A1 – в этом году удет теплая погода;

 

 

A2 – холодная, а стратегии природы: B1

и B2 соответственно.

Пусть фирма примет стратегию A1

и в действительности погода

будет тёплая (стратегия природы B1), тогда доход фирмы составит

бА

 

 

С 3050(40 20) 1100(30 15) 77500 у.д.е.

Если фирма примет стратегию A1,

а погода будет холодная (т.е.

стратегия природы B2), тоДчасть препаратов останется

нереализованной и доход будет равен

 

 

 

С 1525(40 20) 1100(30 15) 20(3050 1525) 16500 у.д.е.,

 

 

 

 

И

т.е. препараты второй группы будут все проданы, а первой – только в количестве 1525, а остальные – останутся.

Аналогично если фирма примет стратегию A2 и действительно погода будет холодная, то доход

С 1525(40 20) 3690(30 15) 85850 у.д.е.,

56

при теплой погоде (т.е. стратегии природы B1) доход составит

C 1525(40 20) 1100 (30 15) (3690 1100) 15 8150 у.д.е.

Запишем платежную матрицу игроков, рассматривая в качестве

С

 

 

 

 

 

 

таковых фирму и природу.

 

 

 

 

 

 

 

 

B

B

min

 

 

A1

 

2

2

 

 

 

7750

16500 16500

и

 

 

 

 

P

 

 

8150

85850 8150

 

 

A

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

max

7750 85850

бА

Найдём н жнюю

верхнюю цены игры:

max(16500;8150) 16500; min(77500;85850) 77500.

Цена игры лежит в диапазоне 16500 77500. Так как нет седловой точки, то игра решается в смешанных стратегиях.

Обозначим

вероятности

применения

фирмой стратегий

соответственно x1

и x2, причем x1 x2

1.

 

Решим игру алгебраически:

 

 

 

77500x1 8150x2

 

1387x1

777;

 

 

 

 

16500x1 85850x2

И

из равенства x1 x2 1 x2 1 x1;

 

x1 0,56;

Д

 

 

xопт (056;044)

;

x2 0,44;

46986 у.д.е.

Оптимальный план производства препаратов:

0,56(3050;1100) 0,44(1525;3690) (2379;2239,6).

Таким образом, фирме целесообразно производить в течение сентября и октября 2379усл. ед. препаратов первой группы, тогда при любой погоде она получит доход не менее 46986у. д. е. Рассмотрим

57

случай, когда фирма не может воспользоваться смешанными стратегиями (например, есть договоры с другими организациями), т.е. возникает неопределенность.

Используем критерии, которые мы рассмотрели: 1. Критерий Вальда.

maxminaij max(16500;8150) 16500

у.д.е.,

следовательно,

фирме следует использовать стратегию A1.

 

 

 

 

2. Кр тер й макс мума.

 

 

 

 

 

 

 

 

maxmaxaij max(77500;85850) 85850 у.д.е.

Целесообразно

использовать стратег ю A2 .

 

 

 

 

 

 

 

 

С

: для определенности возьмем

=0,4,

3. Кр тер й

тогда для стратег

ф рмы A1

 

 

 

 

 

 

 

 

minaij (1 )maxaij 0,4 16500 (1 0,4) 77500 53100 у.д.е.

Для стратег

А2:

 

 

 

 

 

 

 

 

Гурвица

 

 

 

 

 

 

 

 

minaij (1 )maxaij 0,4 8150 (1 0,4) 85850 54770 у.д.е.

Выбираем max(53100;54770) 54770 у.д. .

 

 

 

 

Следовательно, фирме

 

 

 

 

применить стратегиюA2.

4. КритерийцелесообразноСэвиджа: максимальный

элемент в 1-м столбце –

77500, во 2-м – 85850.

 

 

 

 

 

 

 

 

Элементы

матрицы

 

 

рисков

найдем

из

выраженияrij (maxaij) aij , откуда

 

 

 

 

 

 

А

 

 

r11 77500 77500 0; r12

85850 16500 69350;

 

r21 77500 8150 69350; r22 85850 85850 0.

 

Матрица рисков имеет вид

 

 

0

69350

.

 

 

 

 

 

 

 

69350

0

 

 

 

 

 

 

 

 

 

 

 

 

 

Д

В соответствии с критерием Сзвиджа

 

 

 

 

min max(maxaij aij) min 69350;69350 69350 у.д.е.

Фирме

целесообразно применить стратегию A1

или A2.

 

 

Замечание. Каждый из рассмотренныхИкритериев позволяет представить последствия принятия тех или иных управленческих решений, но не может быть рекомендован для окончательного выбора решения. Поэтому если известно распределение вероятности различных состояний природы, то можно воспользоваться критерием максимума математического ожидания выигрыша.

58

Пусть вероятности теплой и холодной погоды одинаковы, то есть равны 0,5, тогда

max(0,5 77500 0,5 16500;0,5 8150 0,5 85850) (47000,47000)

47000 у.д.е.,

 

 

 

 

С

 

 

 

 

т.е. фирма может применить любую стратегию: A1или A2.

Пр мер 2. Определить

наилучшую стратегию по критериям

Лапласа, Вальда, Сэв джа и Гурвица для игры, заданной платежной

матрицей

 

 

 

 

:

 

 

 

 

1

3

3

6

 

 

1

3

8

 

0

 

бА

P 10

6

0

4

.

 

6

1

5

 

12

 

 

4

2

2

 

6

 

Значение степени оптимизма принять 0,5.

 

 

 

Найдём нижнюю и верхнюю цены игры: 1;

3.

1. Применим критерий Лапласа, согласно которому все

состояния природы полагаются равновероятными.

 

 

 

 

 

 

 

 

 

 

Д

Пусть

 

вероятности

p

j

 

1

0,25

,

тогда

математические

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

ожидания величины прибыли для каждого из рассматриваемых

вариантов равны

 

a

 

 

 

 

 

 

И

 

 

 

 

a

p .

 

 

 

 

j

ij

 

 

j

ij

j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(aij)

1

3

3

6

 

0,25

0,75

 

0,75

1,5

 

 

2,75

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

1

3

8

 

 

0

 

 

0,25

0,75

2

 

2,5

 

6

0

 

 

2,5

 

 

1,5

 

0

1

 

5

10

4

 

 

 

 

 

12

6

1

5

 

 

3

 

 

 

1,5

 

0,25

1,25

5,5

 

4

2

 

 

1,5

 

 

1

 

0,5

0,5

 

2,5

6

2

 

 

 

 

 

Определяем максимальное значение (aij) 5,5; следовательно,

выбираем стратегию A4.

59

2. Проверим критерий Вальда.

Пусть в исходной матрице результат представляет выигрыш лица, принимающего решение. Найдём в каждой строке наименьший элемент, а затем выберем среди них наибольший.

С

1

3

3

6

 

 

1

 

 

 

 

1

3

8

 

 

1

0

 

 

 

10

6

0

4

 

min(a )

4.

 

 

 

 

 

 

ij

 

туации

1

5

 

 

1

 

12

6

 

 

6

4

2

2

 

 

2

 

 

 

Выб раем max( 1, 1, 4, 1, 2) 1. Значит, в условиях

рассматр ваемой с

можно выбрать любую из стратегий A1,

A2, A4.

 

3. Кр тер й Сев джа.

Для

оптимальной стратегии по этому критерию

составим матрицу рисков.

2. Расчет 2-го столбца:

Риск – мера

несоответствия между разными возможными

 

выбора

результатами принятия определенных стратегий. Максимальный

выигрыш в

j-м стол це bj max(aij ) характеризует благоприятность

состояния природы. Элементы матрицы рисков находим по формуле

rij maxaij

aij .

А

j

 

 

 

1. Расчет 1-го столбца:

 

r11 12 1 13;r21 12 0 12;r31 12 10 2;r41 12 12 0;

r51 12 6 6.

 

Д

 

 

 

 

 

 

И

r12 6 3 3;r22 6 1 7;r32 6 6 0;r42 6 6 0;r52 6 4 2.

3.Расчет 3-го столбца:

r13 3 3 0;r23 3 3 0;r33 3 0 3;r43 3 1 4;r53 3 2 1.

4. Расчет 4-го столбца:

r14 8 6 2;r24 8 8 0;r34 8 4 12;r44 8 5 3;r54 8 2 10.

60

 

 

13

3

0

2

 

 

 

 

 

 

 

7

0

0

 

 

 

 

 

 

12

 

 

 

 

оставим матрицу рисков R 2

0

3

12

.

 

 

 

С

 

 

0

4

3

 

 

 

 

 

0

 

 

 

 

 

 

2

1

10

 

 

 

 

 

 

6

 

 

 

 

 

 

 

 

 

 

 

 

 

13

 

 

 

 

 

 

 

 

Гурвица

 

 

 

 

 

 

 

12

 

 

 

 

 

 

 

12.

В каждой строке выбираем наибольший элемент: max(aij)

 

 

 

 

 

 

 

 

 

 

4

будет

 

 

 

 

 

 

10

 

 

 

 

 

 

 

Из эт х ч сел определяем наименьшее: min =4.

 

 

 

Вывод: на лучшая стратегия

A4.

 

применять

стратегию,

4. Кр тер й

 

рекомендует

 

определяемую формулой

max min aij

1 max aij ,

где –

А

 

 

 

степень оптимизма, 0;1 .

 

 

 

 

 

 

 

 

 

Критерий Гурвица учитывает возможность как наихудшего, так и наилучшего для человека состояния игры, т.е. является критерием оптимизма-пессимизма.

Для заданного значения 0,5 вычисляем

 

Д

max(0,5 ( 1) (1 0,5) 6;0,5 ( 1) (1 0,5) 8;0,5 ( 4)

+(1 0,5) 10;0,5 ( 1) (1 0,5) 12;0,5 ( 2) (1 0,5) 6)

max(2,5;3,5;3;5,5;2) 5,5.

 

 

И

Вывод: выбираем стратегию

A4 .

 

Анализ результатов, проведённых на основании различных критериев, показывает, что наиболее приемлемой является стратегия

A4.

Задачи для самостоятельного решения

Пример 1

Найти наилучшую стратегию игры с помощью критериев Лапласа, Вальда, Сэвиджа, Гурвица, приняв степень оптимизма0,5. Платёжная матрица игры имеет вид

61

1 3 3

6

 

 

0 1

3

9

 

 

 

P

9

6

0

3

.

 

 

6 1

5

 

10

 

 

6

4

2

2

 

 

 

Ответ. Игрок выбирает следующие стратегии: по критерию

Лапласа –

A4, по кр терию Вальда – A1, пр критерию Сэвиджа –

A4,

фирмы

 

по критер ю Гурв ца –

A4.

 

СПр мер 2

 

 

Ф рма про звод т пользующиеся спросом детские платья и

костюмы,

реал зац я которых зависит от состояния погоды. Затраты

 

бА

 

в течен е августа-сентя ря на единицу продукции составили:

платья – 7 ден. ед., костюмы – 28 ден. ед. Цена реализации составляет

15 и 50 ден. ед. соответственно. По данным наблюдений за несколько

предыдущ х лет, ф рма может реализовать в условиях тёплой погоды

1950 платьев и 610 костюмов, а при прохладной погоде – 630 платьев

и 1050 костюмов.

 

 

В связи с возможными изменениями погоды определить

стратегию

фирмы в

выпуске продукции, обеспечивающую

ей

 

 

 

Д

максимальный доход от реализации продукции. Задачу решить

графическим методом и с использованием критериев оптимизма,

приняв степень оптимизма 0,5.

 

 

 

 

Ответ. Оптимальная стратегия фирмы

X (0,53;0,47), а

максимальный доход 18266,4 ден. ед.

И

Пример 3

 

 

 

 

 

 

 

 

 

 

 

Пользуясь различными критериями оптимальности, определить,

какая стратегия в результате решения игры рекомендовалась чаще

всего. Платёжная матрица игры

 

 

 

 

 

5

3

6

8

7

4

 

 

 

5

5

4

8

1

 

7

 

 

1

3

1

10

0

2

.

 

 

 

9

9

7

1

3

6

 

 

 

Степень оптимизма 0,5.

62

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]