Добавил:

Mymnan Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Белорусский государственный университет информатики и радиоэлектроники

Предмет:

Теория принятия решений

Файл:

ТПР. Всё в 1 файле / Прикладные Инст сист.pdf

Скачиваний:

304

Добавлен:

15.09.2014

Размер:

1.43 Mб

Скачать

☆

<<< < Предыдущая 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 3435 / 3635 36 > Следующая >>>

Лекция 24. Критерии принятия решений в условиях риска и неопределенности

24.1. Основные понятия. Математическая модель

В задачах теории игр мы рассматривали операции, проводимые в условиях неопределенности. Эта неопределенность была связана с неизвестным нам поведением противной стороны. При этом делалось предположение о том, что противник является «разумным» и предпринимает действия, наименее выгодные для нас.

Однако при исследовании операций приходится встречаться и с иным видом неопределенности. Очень часто неопределенность связана не с характером поведения противника, а с отсутствием у нас информации об условиях проведения операций (погодные условия, конъюнктура на рынке, покупательский спрос и т.д.).

Внешняя среда (объективная действительность), в условиях которой проходит операция и от которой зависят результаты операции, называется «природой». «Природа» в теории статистических решений не выбирает стратегию и не оказывает сознательного противодействия.

Парная матричная игра, в которой разумный игрок А, заинтересованный в наиболее выгодном для него исходе игры, выступает против участника, безразличного к результату игры, называется игрой с природой.

Рассмотрим игру, в которой игрок А имеет т возможных стратегий: А1, А2,…, Ат; о состояниях природы можно сделать п предположений П1, П2,…, Пп. Запишем т х п-матрицу

выигрышей А = (аij). Требуется выбрать такую стратегию игрока А (чистую или смешанную), которая является более выгодной по сравнению с другими [5].

Анализируя игровую матрицу, можно отбросить дублируемые и заведомо невыгодные стратегии игрока А (строки матрицы). Исключать столбцы нельзя, так как для природы нет невыгодных состояний. Теперь на основании матрицы выигрышей можно искать наилучшие стратегии.

Если оказалось, что ни одна из стратегий не доминирует над другими, то не всегда матрица дает полную информацию о преимуществах тех или иных стратегий. Предположим,

что выигрыш при стратегии Аi и состоянии природы Пj больше, чем при стратегии Аk и состоянии природы Пl: аij > аkl. Это не обязательно означает, что стратегия Аi лучше стратегии Аk. Возможно, состояние Пj более благоприятно, чем состояние Пl.

Дополнительную информацию дает матрица рисков (матрица сожалений) R = (rij).

Выразим риск rij через элементы матрицы выигрышей (аij). Риском rij игрока А при использовании стратегии Аi в условиях Пj называется разность между максимальным выигрышем в столбце βj, который мы получили бы, если бы знали состояние природы Пj, и выигрышем аij, который мы получим, не зная его и выбирая стратегию Аi:

rij = βj – аij,

где βj = max аij.

Из этого определения следует, что риск не может быть отрицательным: rij ≥ 0. Матрица рисков (rij) зачастую дает более наглядную картину неопределенной

ситуации, чем матрица выигрышей (аij).

Пример 24.1 [5]. Относительно этих условий можно сделать различные предположения: П1, П2, П3, П4. Ожидаемая прибыль (Аi) для различных условий (Пj) задана матрицей выигрышей (аij) (табл. 24.1). Построить матрицу рисков (rij).

113

Таблица 24.1

Матрица выигрышей

	П1	П2	П3	П4
А1	1	4	5	9
А2	3	8	4	3
А3	4	6	6	2

Решение. Каждый элемент матрицы вычитаем из максимального в данном столбце значения. В первом столбце это β1 = 4, в остальных β2 = 8, β3 = 6, β4 = 9. Получаем матрицу рисков (табл. 24.2).

Таблица 24.2

Матрица рисков

		П1	П2	П3	П4
	А1	3	4	1	0
	А2	1	0	2	6
	А3	0	2	0	7
В матрице выигрышей (аij) (табл. 24.1)				а21 = а24 = 3. Однако эти выигрыши
неравноценны друг другу, что отражается элементами матрицы рисков r21 = 1, r24 = 6.
Выбор оптимальной стратегии		игрока А зависит от принципа оптимальности, на

котором этот выбор основан. Рассмотрим наиболее известные критерии принятия решений

[5, 26,27].

24.2.Критерий, основанный на известных вероятностях условий (критерий Байеса–Лапласа)

Пусть нам неизвестны состояния природы, но известны их вероятности:

q1 = Р (П1), q2 = Р (П2), …, qn = Р (Пп), ∑qi = 1.

i=1

Вкачестве оптимальной по критерию Байеса принимается та стратегия Аi, для которой

средний выигрыш аi , или математическое ожидание выигрыша, максимален:

		n
а = max аi =	max	∑aijq j ,
i	i	j=1
		j=1
n
где аi = ∑aijq j .

j=1

Спомощью такого приема задача о выборе решения в условиях неопределенности превращается в задачу выбора решения в условиях определенности, только принятое решение является оптимальным не в каждом отдельном случае, а в среднем.

При выборе оптимальной стратегии в неизвестных условиях с известными

вероятностями можно пользоваться не только средним выигрышем аi , но и средним риском

ri = ∑rijq j , j=1

114

					n
который нужно обратить не в максимум, а в минимум :	r	= min	ri	= min	∑rijq j .
		i		i	j=1
					j=1

Если у игрока А нет информации о вероятностях q j состояний природы (все гипотезы

равнозначны), то вероятности полагают равными друг другу:

q1 = q2 =…= qn = 1/п.

Это – принцип недостаточного основания Лапласа.

Если игрок может проранжировать гипотезы в порядке убывания их правдоподобности, то в этом случае можно назначить вероятности состояний пропорциональными членам убывающей арифметической прогрессии:

q1 : q2: … : qn = п : (п – 1) : … : 1, n

или, учитывая, что ∑qi = 1, i=1

qi = 2 (п – i +1) / (п (п +1)), i = 1, 2, … п.

Критерий Байеса–Лапласа рекомендуется применять, если:

• вероятности q1 , q2, …, qn известны;

•решение реализуется многократно;

•риск при небольшом числе реализаций решения допустим.

Пример 24.2. Условия игры заданы 4 х 3-матрицей	(табл. 24.3). Априорные
вероятности состояний природы равны: q1 = 0,3; q2 = 0,2; q3 =	0,5. Найти оптимальную

стратегию игрока А с помощью критерия Байеса и среднего риска. Средние выигрыши аi

помещены в соответствующем столбце табл. 24.3.

Таблица 24.3

Матрица выигрышей

	П1	П2	П3	аi
А1	15	15	30	15
А2	2,5	22,5	22,5	16,5
А3	–10	30	30	18
А4	–35	5	45	13
q j	0,3	0,2	0,5

Как следует из табл. 24.3, оптимальной по критерию Байеса является чистая стратегия

А3: max аi =18, А0 = А3.

Используем для решения задачи понятие риска. Составим матрицу рисков (табл. 24.4). Таблица 24.4

Матрица рисков

	П1	П2	П3	ri
А1	0	15	30	18
А2	12,5	7,5	22,5	16,5
А3	25	0	15	15
А4	50	25	0	20
q j	0,3	0,2	0,5

115

Табл. 24.4 показывает, что чистая стратегия А3	является оптимальной: min	ri	= 15,
А0 = А3.	i
А0 = А3.

24.3. Максиминный критерий Вальда

Согласно этому критерию в качестве оптимальной выбирается та стратегия игрока А, при которой минимальный выигрыш максимален, т.е. стратегия, гарантирующая при любых условиях выигрыш не меньший, чем при наихудшем состоянии природы:

W = max min аij.		(24.1)
i	j

Этот критерий называют критерием крайнего пессимизма – всегда надо рассчитывать на худшее. Применение критерия W оправдано, если ситуация, в которой принимается решение, характеризуется следующими обстоятельствами:

•о возможности появления состояний природы Пj ничего неизвестно;

•приходится считаться с появлением Пj;

•решение реализуется лишь один раз, поэтому необходимо исключить какой бы то ни было риск.

24.4. Критерий минимаксного риска Сэвиджа

Этот критерий рекомендует в условиях неопределенности выбирать ту стратегию, при которой величина риска принимает наименьшее значение в самой неблагоприятной ситуации (когда риск максимален):

S = min max rij.		(24.2)
i	j

Критерий Сэвиджа, так же как и критерий Вальда – это критерий крайнего пессимизма. Отличие состоит в том, что худшим объявляется не минимальный выигрыш, а максимальная потеря выигрыша по сравнению с тем, чего можно было бы достичь в данных условиях (максимальный риск).

При использовании критерия Сэвиджа к ситуации принятия решения предъявляются те же требования, что и в случае критерия Вальда.

24.5. Критерий пессимизма-оптимизма Гурвица

Критерий Гурвица рекомендует осуществлять выбор на основе комбинации максиминной и крайне оптимистичной стратегий. Оптимальной считается стратегия, выбираемая из условия:

Н = max (γmin аij + ((1 – γ) max аij),			(24.3)
i	j	j

где γ – коэффициент (весовой множитель), 0 ≤ γ ≤ 1. При γ = 1 критерий Гурвица превращается в пессимистический критерий Вальда, при γ = 0 получается критерий крайнего оптимизма, ориентированный на получение максимального выигрыша в наилучших условиях. При 0 < γ < 1 получается комбинированная мера пессимизма. Значения коэффициента γ выбираются субъективно: чем опаснее ситуация, чем больше мы хотим подстраховаться, тем ближе к 1 выбирается γ (тем больше наше доверие к критерию Вальда).

Обычно данный критерий рекомендуют применять, если

•о вероятности появления состояний природы Пj ничего неизвестно, поэтому в равной мере приходится считаться со всеми;

•решение реализуется один или несколько раз;

•риск допускается.

Пример 24.3. Найти оптимальное решение для матрицы выигрышей (24.3), пользуясь критериями Вальда, Сэвиджа и критерием Гурвица при γ = 0,4.

116

Решение.

1. Воспользуемся формулой (24.1). Для каждой строки матрицы выигрышей рассчи-

тываем наименьший выигрыш (табл. 24.5): wi = min аij. Затем находим W = max min аij = 15.
			j			i	j
Следовательно, оптимальной стратегией является А1.							Таблица 24.5
	Матрица выигрышей для расчета критерия Вальда						Таблица 24.5
	Матрица выигрышей для расчета критерия Вальда
		П1	П2	П3	wi
	А1	15	15	15	15
	А2	2,5	22,5	22,5	2,5
	А3	–10	30	30	–10
	А4	–35	5	45	–35

2. Для вычисления критерия Сэвиджа составим матрицу рисков (табл. 24.6), которую

дополним столбцом, содержащим значения si = max rij. Затем по формуле (24.2) находим

S = min si	= 22,5. Следовательно, оптимальной стратегией является А2.
i												Таблица 24.6
												Таблица 24.6
		Матрица рисков для расчета критерия Сэвиджа

				П1			П2		П3		si
		А1		0			15		30		30
		А2		12,5			7,5		22,5		22,5
		А3		25			0		15		25
		А4		50			25		0		50		vi = max аij,
3. Для отыскания значения критерия Гурвица (24.3) вычислим wi = min аij,													vi = max аij,
												j	j
hi = 0,4wi	+ (1 – 0,4) vi (табл.			24.7).			Тогда	критерий		Гурвица Н = max			hi = 15.
Следовательно, оптимальной стратегией является А1.												i
Следовательно, оптимальной стратегией является А1.												Таблица 24.7
												Таблица 24.7
				Расчет критерия Гурвица
						wi		vi		hi
			А1			15		15		15
			А2		2,5			22,5		14,5
			А3		–10			30		14
			А4		-–35			45		13

117

<<< < Предыдущая 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 3435 / 3635 36 > Следующая >>>

Соседние файлы в папке ТПР. Всё в 1 файле

#
15.09.2014150.53 Кб39Контрольная работа!!!!!!.doc
#
15.09.201428.24 Кб35Контрольная работа.docx
#
15.09.2014409.73 Кб94Математ_методы_диагностики_в_м.pdf
#
15.09.20142.15 Mб201Нейрокомпьютеры.pdf
#
15.09.20141.43 Mб304Прикладные Инст сист.pdf
#
15.09.2014125.44 Кб33Рабочая программа ТПР заочное 2010.doc