Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
теория игр.pdf
Скачиваний:
418
Добавлен:
20.06.2014
Размер:
759.16 Кб
Скачать

знанием. Было бы странно, если бы различные предположения приводили всегда к одному и тому же результату.

2. ПРИНЯТИЕ РЕШЕНИЯ В УСЛОВИЯХ РИСКА

Построение математической модели задачи принятия решения сводится к заданию функции выигрыша F. Формально функция выигрыша есть функция двух переменных х и у, но эти переменные входят в нее неравноправно, что является отражением неравноправия управляющей системы и среды. Дело в том, что управляющая система имеет цель, поэтому ее поведение носит целенаправленный характер; в то же время среда (которую можно рассматривать как обобщенный аналог природы), цели не имеет, и ее поведение носит недетерминированный характер. Если в этой недетерминированности имеются какие-то закономерности, они являются закономерностями стохастического типа. В общем случае это обстоятельство проявляется в том, что существует некоторая вероятностная мера, в соответствии с которой появляются те или иные состояния среды. В том простейшем случае, который мы рассматриваем, множество состояний среды Y является конечным, и в этом случае задание вероятностной меры на множестве Y сводится к заданию вероятностного вектора y0 =( y01 ,...,y0m ),

где y0 j 0,

m

 

 

y0 j =1; при этом y0 j есть вероятность появления состояния j.

 

 

 

j =1

 

 

Вектор

 

 

называется

априорным распределением

вероятностей на

y0

множестве состояний природы.

 

Предположим, что

управляющей подсистеме

(игроку) известен

вероятностный вектор y0 , то есть для каждого возможного состояния среды

известна вероятность его наступления. В этом случае говорят, что принятие решения происходит в условиях риска. Пусть функция выигрыша задана в виде матрицы A=(aij). При принятии решения в условиях риска игрок, выбирая стратегию i, получает выигрыш aij с вероятностью y0 j (j =1,…,m).

Таким образом, исходом, соответствующим выбору стратегии i, является случайная величина, распределение которой задано следующим рядом:

ξi

ai1

ai j

ai m

P

y01

 

y0 j

 

y0m

Взяв в качестве числовой оценки i-й стратегии математическое ожидание случайной величины ξi, получаем следующий

КРИТЕРИЙ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ М. В задаче принятия решения в условиях риска в качестве оценки стратегии i выступает математическое ожидание соответствующей ей случайной величины ξi. В явном виде.

m

M ( i ) = ∑ aij y0 j . j =1

В соответствии с этим правилом оптимальная стратегия игрока i0 находится из условия

 

m

 

 

 

m

M ( i0 ) = max M ( i )

или

ai

0

j y0 j =

max aij y0 j .

1 i n

j =1

 

1 i n j =1

Как известно из теории вероятностей, математическое ожидание М(i) представляет собой величину, к которой будет приближаться средний выигрыш игрока при выборе им стратегии i с ростом числа испытаний, то есть при многократном повторении игры (в предположении, что условия игры сохраняются, т.е. вероятность наступления состояний среды остается одной и той же). Стратегия i0, определяемая из данного условия, называется байесовской стратегией для априорного распределения y0 , а подход к

решению игр с природой, основанный на критерии М - байесовским подходом.

Очевидно, в основе каждого из рассмотренных в этой и предыдущей главах критериев лежит некоторое, и достаточно сильное, упрощение ситуации. Выбор же критерия лежит за рамками теории игр. Теория принятия решений дает рекомендации лишь для определенного критерия. Было бы неразумно принимать решение, не обосновав применение какого-то одного критерия. Потому в случае, когда нет весомых причин использовать определенный критерий (нет гипотез о поведении среды) желательно (хотя бы и в учебных целях) подсчитать значения нескольких критериев и проинтерпретировать полученные результаты. Достаточно важной является теория принятия решения в условиях риска с проведением эксперимента. Эксперимент, исходы которого стохастически связаны с состояниями природы, может положительно повлиять на правильность решения. Эта теория не рассматривается в данном пособии.

Пример 2.1. Режим проверок наличия вируса.

При работе ЭВМ необходимо периодически приостанавливать обработку информации и проверять ЭВМ на наличие в ней вирусов. Приостановка в обработке информации приводит к определённым экономическим издержкам. Если же вирус не будет вовремя обнаружен, возможна потеря и некоторой части информации, что приведёт к ещё большим убыткам.

Варианты решения таковы:

Е1 – полная проверка; Е2 – минимальная проверка; Е3 – отказ от проверки.

ЭВМ может находиться в следующих состояниях:

F1 – вирус отсутствует; F2 – вирус есть, но он не успел повредить информацию; F3 – есть файлы, нуждающиеся в восстановлении.

Затраты на поиск вируса и его ликвидацию, а также затраты, связанные с восстановлением информации ( A = (ai j ) , i =1,..,3, j =1,..,3 ) приведены в

первых трех столбцах таблицы 2.1. По этим значениям aij рассчитываются

значения критериев Вальда, Лапласа, Гурвица (максимальные значения критериев выделены полужирным шрифтом).

L(1) =

 

1 a

 

= 20

 

22 25 ≈ −22.33.

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

j=1 1 j

 

 

3

 

 

 

 

 

3

 

 

 

 

 

V (1) =

min

a

 

= min{20,22,25} = −25.

 

 

1j3

1 j

 

 

 

 

 

 

 

 

α = 0.2 G(1) =α

min

a

 

+ (1 α)

max a

=

 

 

 

 

1 j 3

1 j

 

1 j 3

1 j

 

= 0.2 (25) + 0.8 (20) = −21.

 

 

 

 

 

α = 0.8 G(1) =α

min

a

 

+ (1 α)

max

a

=

 

 

 

 

1 j 3 1 j

 

1 j 3

1 j

 

= 0.8 (25) + 0.2 (20) = −24.

Аналогичным образом рассчитываются значения критериев при i=2 или 3.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 2.1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Стратегия

F1

 

F2

F3

Критерий

Критерий

Критерий Гурвица

 

 

 

 

 

 

 

 

 

Вальда

Лапласа

α =0.2

α =0.8

 

 

 

 

E1

-20

 

-22

 

-25

 

-25

 

-22.33

 

-21

 

-24

 

 

E2

-14

 

-23

 

-31

 

-31

 

-22.66

 

-17.4

 

-27.6

 

 

E3

0

 

-24

 

-40

 

-40

 

-21.33

 

-8

 

-32

Согласно критерию Вальда следует проводить полную проверку. Критерий Лапласа, в предположении, что все состояния машины равновероятны, рекомендует отказаться от проверки. Рекомендации по критерию Гурвица зависят от значения параметраα.Таким образом, необходимо подумать о том, какая из гипотез о поведении среды более обоснована.

Пример 2.2. Выбор проекта отеля.

Предприниматель намерен взять в аренду отель сроком на 1 год. Имеются отели четырех типов: на 20, 30, 40 или 50 комнат. По условию аренды предприниматель должен оплатить все расходы, связанные с содержанием отеля. Эти расходы (в немецких марках) состоят из трех частей.

1)Расходы, не зависящие от выбора проекта отеля: а) благоустройство территории - 10 тыс. ДМ;

б) затраты на текущий ремонт и содержание - 1.5 тыс. ДМ; в) один ночной дежурный - 6 тыс. ДМ; г) один служащий для уборки территории - 8 тыс. ДМ. Всего –25.5 тыс. ДМ.

2)Расходы, пропорциональные числу комнат отеля:

а) меблировка одной комнаты - 4 тыс. ДМ; б) 1 горничная на 10 комнат - 6 тыс. ДМ; в) содержание одной комнаты - 150 ДМ;

г) страхование на случай пожара для одной комнаты - 25 ДМ. Всего на комнату – 4,775 тыс. ДМ.

3)Расходы, пропорциональные среднему числу занятых комнат: а) стирка, уборка - 5 ДМ в день; б) электричество, газ, вода - 5 ДМ в день.

Всего на занятую комнату – 10 ДМ в день.

Доход предпринимателя составляет 60 ДМ в день с каждой занятой комнаты. Выбор какого проекта отеля следует считать оптимальным?

Решение. Прибыль (точнее, средняя прибыль) предпринимателя определяется здесь двумя параметрами: х - общее число комнат отеля и у - среднее число заявок на комнату в год (т.е. среднегодовой спрос). При этом мы предполагаем, что х принимает значения 20, 30, 40, 50, а у - любое целое значение, не превосходящее 50. Общий расход за год составляет (4775 х +3650 у +25500) ДМ, а доход 21900 у ДМ. Прибыль за год F(x,y) = =18250 y- 4775 х -25500 (ДМ). Здесь y'= min {y,x}. Данная задача является задачей принятия решения в условиях неопределенности, в которой стратегии предпринимателя (игрока) x {20,30,40,50}, а состояния среды y {0,1,…,50}. Функция выигрыша, указывающая выигрыш (прибыль) предпринимателя в любой ситуации, есть F(x,y). Составим таблицу функции выигрыша, взяв для упрощения записи отдельные значения переменной y: 10, 15, 20, 25, 30, 40, 50; получаем таблицу 2.2. Таким образом, в таблице 2.2 записана матрица

A = (ai j ) , i =1,..,4 , j =1,..,7 Оценки стратегий по критериям Лапласа,

Вальда, Гурвица (при α =0.2; 0.5; 0.9) приведены в таблице 2.3 (выделены полужирным шрифтом клетки, соответствующие наилучшему исходу по каждому из критериев).

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 2.2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

х \ у

10

 

15

 

20

25

30

 

40

50

 

20

61500

 

152750

 

244000

244000

244000

244000

244000

 

30

13750

 

105000

 

196250

287250

378750

378750

378750

 

40

-34000

 

57250

 

148500

239750

331000

513500

513500

 

50

-81750

 

100750

 

100750

192000

283250

465750

648250

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 2.3

 

 

 

 

 

 

 

 

 

 

 

x

 

Критерий

 

Критерий

 

 

Критерий Гурвица

 

 

 

 

Лапласа

 

 

 

Вальда

 

α =0.2

 

α =0.5

α =0.9

 

20

 

204893

 

 

61500

 

207500

 

152750

79750

 

30

 

248357

 

 

13750

 

305750

 

196250

50250

 

40

 

252785

 

 

-34000

 

404000

 

239750

20750

 

50

 

231107

 

 

-81750

 

502250

 

283250

-8750

 

Из таблицы 2.3 видно, что разные критерии приводят к разным оптимальным решениям; решение об окончательном выборе проекта отеля может быть принято только при наличии новых содержательных соображений (например, выбор показателя пессимизма α для критерия Гурвица).

Далее, данная задача принятия решения в условиях неопределенности станет задачей принятия решения в условиях риска, если предприниматель будет обладать дополнительной информацией - знанием вероятностей наступления тех или иных состояний среды. В нашем случае оценки этих вероятностей могут быть определены статистическим методом, если имеется статистика спроса на проживание в отелях такого типа в сходных условиях.

Пример 2.3.

Предприниматель имеет возможность вложить свои деньги либо в государственные ценные бумаги(1-я стратегия), либо в акции высокодоходного предприятия (2-я стратегия). Для упрощения задачи мы полагаем, что деньги нельзя «класть в разные корзины». Природа (экономика) может находиться в трех состояниях: кризис, стабильное положение, подъем. Матрица выигрыша предпринимателя

A = (ai j ) , i =

1,2

,

j =

1,..,3

представлена в табл. 2.4.

 

 

 

 

 

 

 

 

 

 

 

Таблица 2.4

 

 

 

 

 

 

 

 

 

Объект вложения

 

 

 

 

Состояние природы

 

 

 

 

 

 

Кризис

 

Стабильность

Подъем

 

Гос. ценные бумаги

 

0

 

 

3

5

 

Акции

 

-5

 

 

5

13

 

Числа в таблице – некоторые денежные единицы. Мы исходим из естественного предположения, что государственные бумаги в благоприятной для экономики ситуации менее доходны, чем акции. Очевидно, по критерию

Вальда решением

задачи

будет покупка государственных бумаг,

по

критерию Лапласа

– акций.

Определим, как влияет здесь параметр α

на

выбор решения по критерию Гурвица. Для этого необходимо составить уравнение

0 α + 5 (1 α)= −5 α +13 (1 α).

Решением будет α = 138 . При α <138 критерий Гурвица рекомендует

акции, в других случаях – государственные бумаги. Естественно, числа в таблице выбраны в значительной мере произвольно. Выигрыши предпринимателя в каждой ситуации могут отличаться от тех, что приведены в таблице. Важен порядок, в котором идут элементы каждой строки этой таблицы (максимум - в 3-м столбце, минимум – в 1-м). Тогда общее уравнение для поиска α , граничного в смысле выбора решения, будет таким:

a11 α + a13 (1 α)= a21 α + a23 (1 α).