Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Московский государственный университет им. М.В. Ломоносова

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Лекции!.doc

Скачиваний:

Добавлен:

03.12.2018

Размер:

1.82 Mб

Скачать

☆

<<< < Предыдущая 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 3536 / 3736 37 > Следующая >>>

3. Принятие решений при проведении эксперимента.

Допустим, что вероятности р(Q₁), р(Q₂), … , р(Q_n) в принципе существуют, но вам неизвестны. Иногда в этом случае предполагают все состояния природы равновероятными (так называемый «принцип недостаточного основания» Лапласа), но вообще-то это делать не рекомендуется. Все-таки обычно более или менее ясно, какие состояния более, а какие - менее вероятны. Для того чтобы найти ориентировочные значения вероятностей р(Q₁), р(Q₂), … , р(Q_n), можно, например, воспользоваться методом экспертных оценок. Хоть какие-то ориентировочные значения вероятностей состояния природы все же лучше, чем полная неизвестность. Неточные значения вероятностей состояний природы в дальнейшем могут быть «скорректированы» с помощью специально поставленного эксперимента. Эксперимент может быть как «идеальным», полностью выясняющим состояние природы, так и неидеальным, где, вероятности состояний уточняются по косвенным данным

3.1. Принятие решений в условиях неопределенности.

Человек, прежде чем принять решение, пытается получить некоторую информацию о состоянии природы экспериментальным путем. Предполагается, что проведение эксперимента не требует никаких затрат,

Пусть проведен эксперимент, имеющий t исходов – возможных прогнозов состояния природы,

Z=(z₁, z₂,…, z_t), .

Известна условная вероятность Р(z_β/Q_j) -го результата эксперимента при состоянии природы Q_j,

P__j= Р(z_β/Q_j), =1,2,…,t, j=1,2,…,n. (7)

Множество значений P__jможно представить в виде матрицы размера t·n, данной в табл. 5.

Для использования информации, полученной в результате эксперимента, введем понятие стратегии.

Таблица 5

Q_j Z_	Q₁	Q₂	…	Q_n
z₁	P₁₁	P₁₂	…	P_1n
z₂	P₂₁	P₂₂	…	P_2n
…	…	…	…	…
z_t	P_t1	P_t2	…	P_tn

Стратегия - это соответствие последовательности t результатов эксперимента последовательности t операций,

(z₁, z₂,…, z_t)→ (a_i, a_j,…, a_k). (8)

Выражение (8) подразумевает, что

z₁→ a_i, ,

z₂→ a_j, ,

……………………

z_t→ a_k, .

Число возможных стратегий  определяется формулой

 = m^t,

m – число операций, t - число результатов эксперимента. При m=2, t=3 всевозможные стратегии представлены в табл.6.

Таблица 6

S_i z_	S₁	S₂	S₃	S₄	S₅	S₆	S₇	S₈
z₁	a₁	a₁	a₁	a₁	а₂	а₂	а₂	а₂
z₂	a₁	a₁	а₂	а₂	a₁	a₁	а₂	а₂
z₃	a₁	а₂	a₁	а₂	a₁	а₂	a₁	а₂

Задача ПР формулируется так: какую одну из операций a₁,a₂,…, a_m следует выбрать в зависимости от одного из результатов эксперимента z₁, z₂,…, z_t.

Для принятия решения находим усредненные полезности стратегий S_i, i= 1,2, …, , при состояниях природы Q_j, j=1, 2, …, n,

U(S_i,Q_j)=α_i_β_jP_β_j , i= 1,2, …, , j=1, 2, …, n, (9)

где α_iβj - полезность β-ой компоненты i-ой стратегии при состоянии природы Q_j, P_βj– условная вероятность β-го результата эксперимента при состоянии природы Q_j. Стратегия S_iопределена множеством операций, значения α_{i
β j}берутся из таблицы полезностей значения P_βj– из табл. 5. Полученные значения усредненных полезностей U(S_i,Q_j) можно записать в виде матрицы размера n·. Для принятия решения – выбора наилучшей стратегии можно воспользоваться уже рассмотренными критериями: максимина, минимакса сожалений и равновозможных состояний.

Рассмотрим конкретный пример. Предполагается лишь два состояния природы: Q₁- теплая погода, Q₂– холодная погода, и только две операции: a₁– одеться для теплой погоды, a₂– одеться для холодной погоды. Эта ситуация характерна для туристов. Матрица полезности дана в табл.7.

Таблица 7 Таблица 8

Q_j a_i	Q₁		Q₂		Q_j z_		Q₁		Q₂
a₁	10		0		z₁		0.6		0.3
					z₂		0.2		0.5
a₂	4	7		z₃		0.2		0.2

Критерий максимина гарантирует 4 ед. полезности и рекомендует выбирать операцию а₂. Критерий минимакса дает этот же ответ.

Но есть возможность воспользоваться данными прогноза погоды (в этом и состоит эксперимент), которые могут быть трех видов:

z₁– ожидается теплая погода,

z₂– ожидается холодная погода,

z₃– прогноз неизвестен.

Из прошлого опыта известны условные вероятности этих трех видов прогноза для каждого состояния природы , =1,2,3, j =1,2, представленные в табл. 8.

Для каждой из 8–ми стратегий и каждого из 2–х состояний природы определим взвешенные суммы полезностей по формуле (9), используя данные таблиц 6 – 8,

U(S₁,Q₁) =100.6 + 100.2 +100.2 =10,

U(S₂,Q₁) =100.6 + 100.2 +40.2 = 8.8,

U(S₃,Q₁) =100.6 + 40.2 + 100.2 = 8.8,

........................................................

U(S₈,Q₁) = 40.6 + 40.2 + 40.2 = 4,

U(S₁,Q₂) = 00.3 + 00.5 +00.2 = 0,

.........................................................

U(S₈,Q₂) = 70.3 + 70.5 + 70.2 = 7.

Все вычисленные значения U(S_i,Q_j), i = 1,2,…8, j = 1, 2, помещены в табл.9.

Таблица 9

S_i

Q_j

S₁

S₂

S₃

S₄

S₅

S₆

S₇

S₈

Q₁

8.8

7.6

6.4

5.2

Q₂

1.4

4.9

2.1

5.6

Из табл. 9 предварительно следует исключить плохие стратегии –– те стратегии, обе компоненты которых не больше () соответствующих компонент какой–либо другой стратегии. Ввиду того, что , , S₆≤ S₇, то стратегии исключаются из рассмотрения (в табл. 9 они помечены знаком "–").

К оставшимся, допустимым стратегиям можно применить известные нам критерии. Используя критерий максимина, имеем:

, ,

, , ,

Следовательно, наилучшей стратегией является стратегия S₇, гарантирующая 5.2 ед. полезности. Для сравнения максиминная операция гарантирует лишь 4 ед. полезности. Так как S₇ = (a₂, a₂, a₁), то в силу (8) имеем

Это значит, что при прогнозе z₁ выбирается операция а₂, при прогнозе z₂– a₂, при прогнозе z₃– a₁, т.е. максиминная стратегия S₇ рекомендует одеваться тепло, если прогноз – теплая или холодная погода, и одеваться легко, если прогноз неизвестен. Последнее утверждение весьма непрактично.

Максиминная стратегия S₇при неблагоприятном стечении обстоятельств может привести и к худшему результату, чем максиминная операция . Например, имеет место холодная погода . Тогда согласно максиминной операции турист получит 7 ед. полезности (табл. 7). С другой стороны, если результат прогноза будет (прогноз неизвестен) и согласно стратегии S₇ будет выбрана операция (одеться легко), то он получит 0 ед. полезности. Это явление –– типичное для теории игр и теории принятия решений. S₇ гарантирует лишь среднюю полезность в 5.2 ед.

<<< < Предыдущая 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 3536 / 3736 37 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
18.09.2019208.38 Кб2Лекции ФП.doc
#
23.11.2018290.3 Кб4лекции ФП.doc
#
13.09.20193.21 Mб4Лекции часть 1.doc
#
13.09.2019976.38 Кб9Лекции часть 2.doc
#
13.09.20198.79 Mб9Лекции часть 3.doc
#
03.12.20181.82 Mб43Лекции!.doc
#
20.09.2019334.34 Кб2ЛЕКЦИИ+НОВИЦКОЙ+2011.doc
#
29.04.2019303.62 Кб0Лекции- эк. география.doc
#
10.11.201846.55 Mб29Лекции-НГ.doc
#
27.10.2018168.45 Кб5лекции-О.Э..doc
#
21.09.201974.58 Кб2Лекции. Полянский.docx