Добавил:

Vezen Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Коломенский институт филиал МГМУ

Предмет:

Теория игр

Файл:

теория игр.pdf

Скачиваний:

418

Добавлен:

20.06.2014

Размер:

759.16 Кб

Скачать

☆

<<< < Предыдущая 12 / 92 3 4 5 6 7 8 9 > Следующая >>>

знанием. Было бы странно, если бы различные предположения приводили всегда к одному и тому же результату.

2. ПРИНЯТИЕ РЕШЕНИЯ В УСЛОВИЯХ РИСКА

Построение математической модели задачи принятия решения сводится к заданию функции выигрыша F. Формально функция выигрыша есть функция двух переменных х и у, но эти переменные входят в нее неравноправно, что является отражением неравноправия управляющей системы и среды. Дело в том, что управляющая система имеет цель, поэтому ее поведение носит целенаправленный характер; в то же время среда (которую можно рассматривать как обобщенный аналог природы), цели не имеет, и ее поведение носит недетерминированный характер. Если в этой недетерминированности имеются какие-то закономерности, они являются закономерностями стохастического типа. В общем случае это обстоятельство проявляется в том, что существует некоторая вероятностная мера, в соответствии с которой появляются те или иные состояния среды. В том простейшем случае, который мы рассматриваем, множество состояний среды Y является конечным, и в этом случае задание вероятностной меры на множестве Y сводится к заданию вероятностного вектора y0 =( y01 ,...,y0m ),

где y0 j ≥ 0,		m
		∑ y0 j =1; при этом y0 j есть вероятность появления состояния j.
		j =1
Вектор		называется	априорным распределением	вероятностей на
	y0
множестве состояний природы.
Предположим, что			управляющей подсистеме	(игроку) известен

вероятностный вектор y0 , то есть для каждого возможного состояния среды

известна вероятность его наступления. В этом случае говорят, что принятие решения происходит в условиях риска. Пусть функция выигрыша задана в виде матрицы A=(aij). При принятии решения в условиях риска игрок, выбирая стратегию i, получает выигрыш aij с вероятностью y0 j (j =1,…,m).

Таким образом, исходом, соответствующим выбору стратегии i, является случайная величина, распределение которой задано следующим рядом:

ξi	ai1	…	ai j	…	ai m
P	y01		y0 j		y0m

Взяв в качестве числовой оценки i-й стратегии математическое ожидание случайной величины ξi, получаем следующий

КРИТЕРИЙ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ М. В задаче принятия решения в условиях риска в качестве оценки стратегии i выступает математическое ожидание соответствующей ей случайной величины ξi. В явном виде.

M ( i ) = ∑ aij y0 j . j =1

В соответствии с этим правилом оптимальная стратегия игрока i0 находится из условия

	m				m
M ( i0 ) = max M ( i )	или ∑	ai	0	j y0 j =	max ∑aij y0 j .
1 ≤ i ≤ n	j =1		0		1 ≤ i ≤ n j =1

Как известно из теории вероятностей, математическое ожидание М(i) представляет собой величину, к которой будет приближаться средний выигрыш игрока при выборе им стратегии i с ростом числа испытаний, то есть при многократном повторении игры (в предположении, что условия игры сохраняются, т.е. вероятность наступления состояний среды остается одной и той же). Стратегия i0, определяемая из данного условия, называется байесовской стратегией для априорного распределения y0 , а подход к

решению игр с природой, основанный на критерии М - байесовским подходом.

Очевидно, в основе каждого из рассмотренных в этой и предыдущей главах критериев лежит некоторое, и достаточно сильное, упрощение ситуации. Выбор же критерия лежит за рамками теории игр. Теория принятия решений дает рекомендации лишь для определенного критерия. Было бы неразумно принимать решение, не обосновав применение какого-то одного критерия. Потому в случае, когда нет весомых причин использовать определенный критерий (нет гипотез о поведении среды) желательно (хотя бы и в учебных целях) подсчитать значения нескольких критериев и проинтерпретировать полученные результаты. Достаточно важной является теория принятия решения в условиях риска с проведением эксперимента. Эксперимент, исходы которого стохастически связаны с состояниями природы, может положительно повлиять на правильность решения. Эта теория не рассматривается в данном пособии.

Пример 2.1. Режим проверок наличия вируса.

При работе ЭВМ необходимо периодически приостанавливать обработку информации и проверять ЭВМ на наличие в ней вирусов. Приостановка в обработке информации приводит к определённым экономическим издержкам. Если же вирус не будет вовремя обнаружен, возможна потеря и некоторой части информации, что приведёт к ещё большим убыткам.

Варианты решения таковы:

Е1 – полная проверка; Е2 – минимальная проверка; Е3 – отказ от проверки.

ЭВМ может находиться в следующих состояниях:

F1 – вирус отсутствует; F2 – вирус есть, но он не успел повредить информацию; F3 – есть файлы, нуждающиеся в восстановлении.

Затраты на поиск вируса и его ликвидацию, а также затраты, связанные с восстановлением информации ( A = (ai j ) , i =1,..,3, j =1,..,3 ) приведены в

первых трех столбцах таблицы 2.1. По этим значениям aij рассчитываются

значения критериев Вальда, Лапласа, Гурвица (максимальные значения критериев выделены полужирным шрифтом).

L(1) =

1 ∑ a

= − 20 −

22 − 25 ≈ −22.33.

j=1 1 j

V (1) =

min

= min{−20,−22,−25} = −25.

1≤ j≤3

1 j

α = 0.2 G(1) =α

min

+ (1 −α)

max a

1 ≤ j ≤ 3

1 j

1 ≤ j ≤ 3

1 j

= 0.2 (−25) + 0.8 (−20) = −21.

α = 0.8 G(1) =α

min

+ (1 −α)

max

1 ≤ j ≤ 3 1 j

1 ≤ j ≤ 3

1 j

= 0.8 (−25) + 0.2 (−20) = −24.

Аналогичным образом рассчитываются значения критериев при i=2 или 3.

								Таблица 2.1

Стратегия	F1		F2	F3	Критерий	Критерий	Критерий Гурвица
					Вальда	Лапласа	α =0.2	α =0.8
		E1	-20	-22	-25	-25	-22.33	-21	-24
	E2		-14	-23	-31	-31	-22.66	-17.4	-27.6
	E3		0	-24	-40	-40	-21.33	-8	-32

Согласно критерию Вальда следует проводить полную проверку. Критерий Лапласа, в предположении, что все состояния машины равновероятны, рекомендует отказаться от проверки. Рекомендации по критерию Гурвица зависят от значения параметраα.Таким образом, необходимо подумать о том, какая из гипотез о поведении среды более обоснована.

Пример 2.2. Выбор проекта отеля.

Предприниматель намерен взять в аренду отель сроком на 1 год. Имеются отели четырех типов: на 20, 30, 40 или 50 комнат. По условию аренды предприниматель должен оплатить все расходы, связанные с содержанием отеля. Эти расходы (в немецких марках) состоят из трех частей.

1)Расходы, не зависящие от выбора проекта отеля: а) благоустройство территории - 10 тыс. ДМ;

б) затраты на текущий ремонт и содержание - 1.5 тыс. ДМ; в) один ночной дежурный - 6 тыс. ДМ; г) один служащий для уборки территории - 8 тыс. ДМ. Всего –25.5 тыс. ДМ.

2)Расходы, пропорциональные числу комнат отеля:

а) меблировка одной комнаты - 4 тыс. ДМ; б) 1 горничная на 10 комнат - 6 тыс. ДМ; в) содержание одной комнаты - 150 ДМ;

г) страхование на случай пожара для одной комнаты - 25 ДМ. Всего на комнату – 4,775 тыс. ДМ.

3)Расходы, пропорциональные среднему числу занятых комнат: а) стирка, уборка - 5 ДМ в день; б) электричество, газ, вода - 5 ДМ в день.

Всего на занятую комнату – 10 ДМ в день.

Доход предпринимателя составляет 60 ДМ в день с каждой занятой комнаты. Выбор какого проекта отеля следует считать оптимальным?

Решение. Прибыль (точнее, средняя прибыль) предпринимателя определяется здесь двумя параметрами: х - общее число комнат отеля и у - среднее число заявок на комнату в год (т.е. среднегодовой спрос). При этом мы предполагаем, что х принимает значения 20, 30, 40, 50, а у - любое целое значение, не превосходящее 50. Общий расход за год составляет (4775 х +3650 у +25500) ДМ, а доход 21900 у ДМ. Прибыль за год F(x,y) = =18250 y’ - 4775 х -25500 (ДМ). Здесь y'= min {y,x}. Данная задача является задачей принятия решения в условиях неопределенности, в которой стратегии предпринимателя (игрока) x {20,30,40,50}, а состояния среды y {0,1,…,50}. Функция выигрыша, указывающая выигрыш (прибыль) предпринимателя в любой ситуации, есть F(x,y). Составим таблицу функции выигрыша, взяв для упрощения записи отдельные значения переменной y: 10, 15, 20, 25, 30, 40, 50; получаем таблицу 2.2. Таким образом, в таблице 2.2 записана матрица

A = (ai j ) , i =1,..,4 , j =1,..,7 Оценки стратегий по критериям Лапласа,

Вальда, Гурвица (при α =0.2; 0.5; 0.9) приведены в таблице 2.3 (выделены полужирным шрифтом клетки, соответствующие наилучшему исходу по каждому из критериев).

										Таблица 2.2

х \ у	10		15		20	25		30	40	50
20	61500		152750		244000	244000		244000	244000	244000
30	13750		105000		196250	287250		378750	378750	378750
40	-34000		57250		148500	239750		331000	513500	513500
50	-81750		100750		100750	192000		283250	465750	648250
										Таблица 2.3

x		Критерий		Критерий				Критерий Гурвица
		Лапласа			Вальда		α =0.2		α =0.5	α =0.9
20		204893		61500			207500		152750	79750
30		248357		13750			305750		196250	50250
40		252785		-34000			404000		239750	20750
50		231107		-81750			502250		283250	-8750

Из таблицы 2.3 видно, что разные критерии приводят к разным оптимальным решениям; решение об окончательном выборе проекта отеля может быть принято только при наличии новых содержательных соображений (например, выбор показателя пессимизма α для критерия Гурвица).

Далее, данная задача принятия решения в условиях неопределенности станет задачей принятия решения в условиях риска, если предприниматель будет обладать дополнительной информацией - знанием вероятностей наступления тех или иных состояний среды. В нашем случае оценки этих вероятностей могут быть определены статистическим методом, если имеется статистика спроса на проживание в отелях такого типа в сходных условиях.

Пример 2.3.

Предприниматель имеет возможность вложить свои деньги либо в государственные ценные бумаги(1-я стратегия), либо в акции высокодоходного предприятия (2-я стратегия). Для упрощения задачи мы полагаем, что деньги нельзя «класть в разные корзины». Природа (экономика) может находиться в трех состояниях: кризис, стабильное положение, подъем. Матрица выигрыша предпринимателя

A = (ai j ) , i =	1,2	,	j =		1,..,3	представлена в табл. 2.4.
									Таблица 2.4

Объект вложения							Состояние природы
				Кризис				Стабильность	Подъем
Гос. ценные бумаги				0				3	5
Акции				-5				5	13

Числа в таблице – некоторые денежные единицы. Мы исходим из естественного предположения, что государственные бумаги в благоприятной для экономики ситуации менее доходны, чем акции. Очевидно, по критерию

Вальда решением	задачи	будет покупка государственных бумаг,	по
критерию Лапласа	– акций.	Определим, как влияет здесь параметр α	на

выбор решения по критерию Гурвица. Для этого необходимо составить уравнение

0 α + 5 (1 −α)= −5 α +13 (1 −α).

Решением будет α = 138 . При α <138 критерий Гурвица рекомендует

акции, в других случаях – государственные бумаги. Естественно, числа в таблице выбраны в значительной мере произвольно. Выигрыши предпринимателя в каждой ситуации могут отличаться от тех, что приведены в таблице. Важен порядок, в котором идут элементы каждой строки этой таблицы (максимум - в 3-м столбце, минимум – в 1-м). Тогда общее уравнение для поиска α , граничного в смысле выбора решения, будет таким:

a11 α + a13 (1 −α)= a21 α + a23 (1 −α).

<<< < Предыдущая 12 / 92 3 4 5 6 7 8 9 > Следующая >>>

Соседние файлы в предмете Теория игр

#
20.06.20144.41 Mб276Теория игр - теоретический материал, все вопросы.docx
#
20.06.2014759.16 Кб418теория игр.pdf

2. ПРИНЯТИЕ РЕШЕНИЯ В УСЛОВИЯХ РИСКА

Критерий Гурвица