Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Tip_rasch_ver.pdf
Скачиваний:
755
Добавлен:
31.03.2015
Размер:
3.46 Mб
Скачать

3.8. Статистические решающие функции

Пусть X –– случайная величина, тип закона распределения которой F (x, q) –– известен, но неизвестно значение параметра q этого закона. Есть основания полагать только, что qÎX –– некоторому множеству значений.

r

Пусть

X ={X1, X 2 ,K, X n}

–– результаты n наблюдений

случайной

величины X.

 

 

r

 

 

 

 

Удобно рассматривать

как

точку в

выборочном

выборкуX

пространстве W. Напомним, что W –– совокупность

всех

возможных

выборок данного объема из значений случайной величины.

 

 

По

результатам

наблюдений

необходимо

принять решение о

значении параметра q.

 

 

 

 

 

 

 

Если

D ––

множество

возможных

 

решений(в нашем

случаеD

совпадает

с X),

то с

формальной

точки

зрения

необходимо найти

 

r

выборочного пространства W на пространство решений

отображение d ( X )

D (см. рис. 3.8.1).

Рис. 3.8.1

Такое отображение называют статистическим решающим правилом или стратегией.

При каждом q мы можем принять любое решениеd Î D. Принятие решения d, когда истинное значение параметра равно q, приводит к потере L(q, d ). Величина L(q, d ) может быть и отрицательной–– тогда это выигрыш.

Для того чтобы выбрать оптимальное решающее правило, нужен критерий, по которому можно их сравнивать. Для этой цели вводится в

рассмотрение так называемаяфункция риска, которая определяется как среднее значение функции потерь при значении параметра q:

r

r

 

R(q, d ( X ))=

M{L[q, d ( X )]},

r

r

r

R(q, d ( X ))

åL=[q, d ( X )]P( X ,q) для дискретной случайной величины,

 

r

 

r

X

r

r

R(q, d ( X ))

rò L=q[ , d ( X )]dP( X ,q) для непрерывной случайной величины.

 

X ÎW

 

249

Функция риска дает возможность сравнивать стратегии между собой. В частности, стратегия d* предпочтительнее стратегии d, если

R(q, d*) £ R(q, d ) при всех qÎX

и

R(q, d*) < R(q, d ) хотя бы при одном qÎX .

Иногда можно говорить о равномерно лучшей решающей функции. Такой, например, является решающая функция d2 на рис. 3.8.2.

Рис. 3.8.2

Рис. 3.8.3

В случае если правила в названном смысле несравнимы(рис. 3.8.3), возможны разные подходы:

1)можно сравнивать площади под кривыми изображающими риски;

2)можно сравнивать наибольшие значения рисков и т.д.

Для каждой решающей функции существует наибольшее значение функции риска

max R(q, d ) .

q

Можно выбрать стратегию, при которой достигается

min max R(q, d ).

d q

Такую стратегию называютминимаксной. Идея такой стратегии проста: выбирается стратегия, при которой наибольший из возможных рисков минимален. Такая стратегия страхует от слишком больших потерь.

В других отношениях это решающее правило может оказаться плохим. Например, стратегия d1 (см. рис. 3.8.3) по этому принципу лучше стратегии d2, хотя при подавляющем большинстве значений q стратегия d1 приводит к большему ущербу, чем d2.

Для простоты рассмотрим случай, когда X состоит из k элементов:

X {q1=, q2 ,K, qk }.

Пусть на основе накопленного опыта значенияq , q ,K, q имеют

1 2 k

вероятности q1, q2 ,K, qk (априорное распределение). Тогда функцию риска

250

можно определить как математическое ожидание функции потерь по отношению к этому априорному распределению:

 

 

 

 

r

k

 

i

 

r

i

k

 

 

r

 

r

i

 

 

 

R(q, d ( X ))

å

 

 

 

åå

 

i

 

i

 

 

 

 

R[=q

, d (X )]q

=

r

L(q , d ( X ))P( X / q )q .

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1 X

 

 

 

 

 

 

 

Стратегия,

обращающая

в

минимум

такую

функцию ,

риска

называется

байесовской

стратегией,

отвечающей

данному

априорному

 

распределению.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Различают два типа стратегий.

 

 

 

 

 

 

 

 

 

1.

Чистая

или нерандомизованная

стратегия. При

такой

стратегии

 

каждому

 

 

результату

 

 

наблюдений

 

ставится

 

в

соответствие

четк

определенное решение.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Это означает, что выборочное пространствоW разбивается наk

 

взаимно

непересекающихся

областейW1,W2 ,K,Wk ,

и

если

результаты

 

 

 

r

 

то принимается решение q = qi .

 

 

 

 

 

наблюдений X ÎWi ,

 

 

 

 

 

2.

Рандомизованная

стратегия

(от

 

английского

словаrandom ––

 

случайный).

Для

 

 

 

 

r

устанавливается

набор

 

вероятностей

каждого X

 

r

r

 

 

 

r

 

 

 

 

 

 

r

 

 

 

 

 

 

l1 ( X ), l2 ( X ),K, lk ( X )

такой,

что

åli ( X ) =1. Тогда

при

 

получении

 

результатов

 

 

 

 

 

 

r

 

 

i

 

 

случайный эксперимент, в

 

 

наблюдений X

производится

 

котором

 

реализуется

 

 

случайная

 

величина, принимающая

 

значения

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

r

r

 

 

r

 

1, 2,3,K, k

с

вероятностями

соответственноl1 ( X ), l2 ( X ),K, lk ( X ) . Если

 

выпадает значение i, то принимается решение q = qi .

Выявим особенности минимаксной и байесовской стратегий. Ради наглядности изложения рассмотрим случай

X {q1,q2=}, D ={d1, d2 ,K, dn}.

Тогда роль функции риска будет играть вектор риска

rr

{R(q1, d ( X )), R(q2 , d ( X ))}.

Каждой чистой стратегииdi соответствует на плоскости точка с координатами

{R(q1, di ), R(q2 , di )}.

Если

рассмотреть

рандомизованную

стратегию

с

набором

вероятностей

r

r

r

 

 

 

 

 

 

 

 

l1 ( X ), l2 ( X ),K, lk ( X ) ,

 

 

 

то каждой такой стратегии соответствует вектор риска с координатами

 

 

и

l1R(q1, d1 ) + l2 R(q1, d2 ) +¼+ ln R(q1, dn )

 

 

l1R(q2 , d1 ) + l2 R(q2 , d2 ) +¼+ ln R(q2 , dn ) .

 

 

 

 

 

Геометрически это координаты центра тяжести массl1, l2 ,K,ln , в

 

сумме равных

единице и

расположенных в

точках, соответствующих

 

251

чистым решениям. Каждой чистой стратегии соответствует масса равная

 

единице,

расположенная

в

соответствующей

этой

стратегии

точке

(остальные массы равны

нулю). Если перебрать

все

возможные наборы

 

l1, l2 ,K,ln , то получим выпуклую оболочку точек, соответствующих

 

чистым

стратегиям. На

плоскости

такая

оболочка

выглядит

как

многоугольник (см. рис.

3.8.4),

в

общем

случае––

как многомерный

 

многогранник.

 

 

 

 

 

 

 

 

Рассмотрим минимаксную стратегию. Нам необходимо для каждого

 

вектора риска выбрать максимальную координату,

затем

среди них

 

выбрать наименьшую, т. е.

 

 

 

 

 

 

 

 

 

min max[R(q1, d ), R(q2 , d )]

 

 

 

 

 

d

 

123 14243

 

 

 

 

 

 

 

 

x

y

 

 

 

 

Заметим,

что функция max(x, y) = c

имеет график,

изображенный на рис.

 

3.8.4 пунктирной линией.

 

 

 

 

 

 

 

 

 

 

 

Рис. 3.8.4

 

 

 

Необходимо выбрать наименьшееc, при котором

график этой

 

функции имеет общую точку с линейной оболочкой(см. рис. 3.8.4). Из

 

этого рисунка видно, что минимаксная стратегия почти наверное будет

 

рандомизованной.

 

 

 

 

 

Из

тех

же

геометрических

соображений

выявим

характе

байесовской стратегии. Опять обратимся к случаю двух значенийq1 и q2.

 

Пусть P(q1 ) = q1 ,

P(q2 ) = q2 ,

(q1 + q2 =1). Тогда функция риска имеет вид

 

 

 

q1 R(q1

, d ) + q2

R(q2 , d )

=R(d ) =c.

(3.8.1)

 

 

 

123

14243

 

 

 

 

 

x

 

y

 

 

 

По структуре это уравнение q1x + q2 y = c –– уравнение прямой линии, а коэффициенты q1 и q2 определяют ее наклон. В многомерном случае это будет уравнение плоскости (гиперплоскости). Нам необходима стратегия, при которой левая часть выражения (3.8.1) минимальна. Будем увеличивать c, пока прямая не коснется линейной оболочки (см. рис. 3.8.5).

252

Рис. 3.8.5

В любом случае (и при касании в вершине, и при касании по стороне многоугольника) среди точек касания будет хотя бы одна вершина выпуклой оболочки, а вершина соответствует чистой стратегии. Тем самым мы проиллюстрировали утверждение о ,томчто при конечном числе исходных стратегий всегда существует чистая байесовская стратегия.

Минимаксная и байесовская стратегии связаны между : собой минимаксная стратегия является байесовской по отношению к наименее благоприятному априорному распределению. Наименее благоприятным оказывается распределение, при котором максимально возможный коэффициент q =1 в выражении q1x + q2 y = c соответствует наибольшей координате (другой коэффициент тогда равен нулю). В этом случае получаются линии x = c или y = c (см. рис. 3.8.6).

 

 

 

Рис. 3.8.6

 

 

Замечание. Введенные понятия можно связать с теорией.

игр

Окружающий нас мир(природу) можно считать одним из игроков, а

 

исследователя другим игроком (только в этом случае природа, в качестве

 

участника

игры, не

злонамеренна по

отношению к исследователю).

Природа

использует

один

из

возможных {qходов1, q2 ,K,qn}, а

 

253

исследователь вr ответ на ход

природы принимает решениеd Î D.

Величина L(q, d ( X ))

 

указывает

потерю

исследователя, выбравшего

по

результатам

 

 

 

r

 

 

 

 

 

r

природа

выбралаq.

наблюдений X

стратегию d ( X ) , когда

 

 

r

 

 

 

 

 

 

средние

потерисследователя,

Величина R(q, d ( X )) характеризует

использующего стратегию d.

 

 

 

 

 

 

 

 

 

 

 

 

Пример 3.27. Наблюдается работа некоторого устройства в течение

времени T.

Положим

 

X = 0 ,

если

устройство не вышло

из

строя

за это

время, и X =1 в противном случае. Пусть

 

 

 

 

 

 

 

 

 

 

 

 

P( X = i / q) qi=(1 – q)1-i ,

 

 

 

 

 

т.е. P( X = 0)= q, P( X =1) =1 – q.

 

 

 

 

 

 

 

 

 

 

В отношении q есть два предположения: q =q1 =1 / 4

и q

=q2 =1 / 2 .

Иначе говоря, возможны два решения a1 = q1

и a2 = q2 .

 

 

 

 

 

Функция потерь определяется таблицей.

 

 

 

 

 

 

 

 

 

 

 

a1

 

a2

 

 

 

 

 

 

 

 

 

 

q1

 

 

1

 

4

 

 

 

 

 

 

Требуется найти

q2

 

 

3

 

2

 

 

 

 

 

 

минимаксную стратегию и байесовскую стратегию

по отношению к априорному распределению P(q1 ) =P(q2 ) =1 / 2.

 

 

Решение.

В этой ситуации возможны следующие чистые решающие

правила:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

d1 : d1 (0) = a1,

d1 (1) = a1;

 

 

d2 : d2 (0) = a1,

d2 (1) = a2 ;

 

d3 : d3 (0) = a2 ,

d3 (1) = a1;

 

 

d4 : d4 (0) = a2 ,

d4 (1) = a2 .

 

Решающие правила d1 и d4 соответствуют «предвзятому мнению».

 

Определим вектор риска для каждого решающего правила.

 

Для d1

 

 

 

 

 

 

 

 

ìR (q1, d1 ) = 1×3 / 4 +1×1 / 4 =1,

 

имеем вектор с координатами í

 

 

 

×1 / 2 + 3

×1 /=2 3.

 

 

 

 

 

 

 

 

 

îR (q2 , d=1 ) 3

Для d2

 

 

 

ìR (q1, d3 )= 1×3 / 4 + 4 ×1 / 4 =1,75,

 

 

 

имеем вектор í

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

îR (q2 , d3 )= 2 ×1 / 2 + 3 ×1 / 2 = 2,5.

 

 

 

Для d3 ––

ìR (q1, d2 ) = 1×1 / 4 + 4 ×3 / 4 = 3,25,

 

 

 

 

 

í

, d2 )= 3 ×1 / 2 + 2 ×1 / 2

= 2,5.

 

 

 

 

 

 

 

 

îR (q2

 

 

 

 

 

 

Для d4 ––

ìR (q1, d4 )= 4 ×3 / 4 + 4 ×1 / 4 = 4,

 

 

 

 

 

í

, d=4 ) 2 ×1 / 2 + 2 ×1 /=2 2.

 

 

 

 

 

 

 

îR (q2

 

 

 

 

 

На рис. 3.8.7 жирными точками отмечены концы векторов риска, выделена закраской линейная оболочка векторов. Из этого рисунка видно,

что оптимальной байесовской стратегией является стратегияd . Для

1

минимаксной стратегии точка касания линейной оболочки примерно в три

254

раза ближе к точкеd2, чем к точкеd4. Поэтому следует l взять обратно пропорциональным расстояниям до названных точек, т.е. равным l2 = 3 / 4, l2 = 3 / 4, l4 =1/ 4, а l1 = l3 = 0.

Рис. 3.8.7

Ответ. Оптимальной байесовской стратегией является стратегия d1. Оптимальная минимаксная стратегия реализуется при наборе вероятностей l1 =l2 = 0, l3 = 3 / 4, l4 =1/ 4.

Задача 3.27.1.

Пусть q –– вероятность

выхода

из

строя устройства

при одном

цикле

испытаний. Обозначим

через X

––

число циклов

испытаний до

выхода из строя устройства. Величина X может принимать

значения 1, 2, 3, ... с вероятностями

P( X = =k) (1 - q)k -1 q.

Вотношении q есть два предположения: q1 и q2 (пространство

решений состоит из двух

элементовa1 = q1

и a2 = q2 ). Функция потерь

задана таблицей.

 

 

 

 

 

 

 

 

 

 

a1

 

a2

 

 

 

q1

 

L11

 

L12

 

 

 

q2

 

L21

 

L22

 

Предлагаются четыре возможных чистых стратегии:

d1 : d1 = a1,

если X =1, и d1 = a1, если X = 2,3, 4,5,¼;

d2 : d2 = a1,

если X =1, 2, и d2 = a2 , если X = 3, 4,5,¼;

d3 : d3 = a1,

если X =1, 2,3, и d3 = a1, если X = 4,5, 6,¼;

d4 : d4 = a1,

если X =1, 2,3, 4, и d4 = a2 , если X = 5,6,¼ .

255

Найдите минимаксную стратегию и байесовскую стратегию по отношению к априорному распределению P(q1 ) = P(q2 ) =1 / 2. (См. пример

3.27 и исходные данные.)

Исходные данные к задачам 3.27.1.

 

q1

q2

L11

L12

L21

L22

q1

q2

L11

L12

L21

L22

 

1

1/8

1/4

0

1

2

0

16

1/8

1/4

0

1

2

0

 

2

1/10

1/5

0

3

2

1

17

1/10

1/5

0

3

2

1

3

1/10

1/6

1

3

2

0

18

1/10

1/4

1

3

2

0

4

1/8

1/2

1

2

3

0

19

1/8

1/6

1

2

3

0

5

1/10

1/4

0

2

3

1

20

1/2

2/5

0

2

3

1

6

1/5

2/5

0

1

2

0

21

1/8

1/2

0

1

2

0

7

1/10

1/6

0

3

2

1

22

1/4

1/2

0

3

2

1

8

1/4

1/2

1

3

2

0

23

1/8

1/4

1

3

2

0

9

1/5

1/10

1

2

3

0

24

1/10

1/5

1

2

3

0

10

1/2

1/4

0

2

3

1

25

1/10

1/6

0

2

3

1

11

1/2

1/3

0

1

2

0

26

1/8

1/2

0

1

2

0

12

1/3

1/4

0

3

2

1

27

1/10

1/4

0

3

2

1

13

1/4

1/5

1

3

2

0

28

1/5

2/5

1

3

2

0

14

1/10

1/3

1

2

3

0

29

2/5

1/4

1

2

3

0

15

1/4

1/3

0

2

3

1

30

1/3

1/4

0

2

3

1

Задача 3.27.2. Подвергаются испытанию три образца изделий и

 

регистрируется число прошедших испытание образцовX. В отношении

 

 

вероятности

выхода

из

строя

образца

при

испытании

есть

д

предположения: q1 и q2. Так как проводятся

независимые испытания, то

 

 

P ( X = i / q)

=Ci (1 - q)i q3-i .

Множество

решений

состоит

из

двух

 

 

3

 

 

 

 

 

 

 

 

 

элементов а1 = q1 и а2 = q2 . Есть три решающих правила:

 

 

 

 

 

d1 ={a1 при Х

0=и а2 при Х

1,2,3};=

 

 

 

 

 

d2 ={a1 при Х

0,1=и а2 при Х

2,3};

 

 

 

 

 

d3 ={a1 при Х

0,1,2=и а2 при Х

3}.

 

 

 

 

Для заданной функции потерь найти:

1)минимаксную стратегию;

2)байесовскую стратегию, если оба значенияq представляются равновероятными. (См. пример 3.27 и исходные данные к задаче 3.27.1.)

Пример 3.28. В двух внешне одинаковых урнах находятся шары. В первой урне пять белых и пять черных шаров, во второй три белых и шесть черных. Урну выбирают наугад, и из нее производится повторная выборка четырех шаров. По результатам выбора необходимо принять

256

решение относительно содержания урны, из которой производился выбор шаров, т.е. пространство решений состоит из двух решений:

––решение a1 –– шары выбирались из первой урны(вероятность выбора белого шара равна q1 =1 / 2 );

––решение a2 –– шары выбирались из второй урны(вероятность

выбора белого шара равна q2 3 /=9

1 /=3).

 

 

Необходимо найти минимаксную и байесовскую стратегии принятия

решений, если функция потерь определяется таблицей:

 

 

 

 

 

 

 

 

 

 

a1

 

a2

 

q1

 

0

 

5

 

 

q2

 

4

 

–1

 

Решение. В условиях задачи возможны следующие чистые стратегии: –– d1 –– принимается решение a1, если все четыре раза выбирались

белые шары, и принимается решение a2, если белых шаров было выбрано три, два, один или ноль;

–– d2 –– принимается решение a1, если из урны было выбрано три или четыре белых шара, и принимается решениеa2, если белых шаров было два, один или ноль;

–– d3 –– принимается решение a1, если из урны было выбрано два, три или четыре белых шара, и принимается решение a2, если белых шаров было один или ноль;

–– d4 –– принимается решение a1, если в выборке один, два, три или четыре белых шара, и принимается решениеa2, если белых шаров в выборке нет.

Случаи «предвзятого мнения», когда при любой выборке принимается всегда одно из решений a1 или a2, исключим из рассмотрения.

Вероятности выбора того или иного числа белых шаров можно

вычислить

по формуле

Бернулли(2.6.1).

При q1 =1 / 2

они

равны

P4 (0) =1 / 16,

P4 (1) = 4 / 16,

P4 (2) = 6

/ 16, P4 (3)

= 4 / 6, P4 (4) =1 / 16.

При

q2 =1 / 3 эти вероятности равны P4 (0)

=16 / 81,

P4

(1) = 32 / 81,

P4 (2) = 24 / 81,

P4 (3) = 8 / 81,

P4 (4) =1 / 81.

 

 

 

 

 

 

Учитывая эти вероятности, определим векторы риска для каждой стратегии:

ì

ïR (q1, d1=)

ï

–– для d1 имеем вектор с координатами í

ïR (q2=, d1 ) ïî

0 ×

1

+ 5

×

 

15

 

» 4,69,

 

 

 

16

 

 

16

 

 

4 ×

1

-1

×

80

 

» -0,94;

 

 

 

81

81

 

257

 

 

ìR (q , d

=)

0 ×

 

5

 

 

 

+ 5 ×

 

 

 

11

» 3, 44,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ï

1

2

 

16

 

 

16

 

 

 

–– для d2

 

ï

 

 

 

 

 

 

 

 

 

имеем вектор с координатами í

 

 

 

 

 

 

 

 

9

 

 

 

 

 

 

72

 

 

 

ïR (q =, d

 

)

4 ×

 

 

 

 

-1×

 

 

» -0, 44;

 

 

 

 

 

 

 

 

 

 

 

 

 

ï

2

 

2

 

81

81

 

 

î

 

 

 

 

 

 

ìR (q , d

=)

0 ×

11

+ 5 ×

5

»1,56,

 

 

 

 

 

 

 

 

 

ï

1

3

 

16

 

 

 

16

 

 

 

 

–– для d3

имеем вектор с координатами

ï

 

 

 

 

 

 

 

 

 

 

 

í

 

 

 

 

 

 

33

 

 

 

48

 

 

 

 

 

ïR (q

, d

=)

4 ×

 

-1×

»1,044

 

 

 

 

 

 

 

 

ï

2

3

 

81

81

 

 

 

 

 

î

 

 

 

 

 

 

 

 

 

ìR (q , d

=)

0 ×

11

 

 

+ 5 ×

1

» 0,31,

 

 

 

 

 

 

 

 

 

ï

1

4

 

16

 

 

16

 

 

 

–– для d4

 

ï

 

 

 

 

 

 

 

 

 

имеем вектор с координатами í

 

 

 

 

 

 

 

65

 

 

 

 

 

16

 

 

 

ïR (q

, d

=)

4 ×

-1×

» 3, 01.

 

 

 

 

 

 

ï

2

 

4

 

81

81

 

 

î

 

 

 

 

На

рис. 3.8.8 жирными точками

отмечены концы векторов риска, а

закраской выделена линейная оболочка векторов.

Так как с равными шансами могла быть выбрана любая ,урнато имеем априорное распределение: P(q1 ) = P(q2 ) =1 / 2. Байесовский риск в соответствии с соотношением (3.8.1) принимает вид

0,5R(q1, d ) + 0,5R(q2 , d ) = c.

Из рис. 3.8.8 видно, что оптимальной байесовской стратегией является стратегия d3

Максимальные координаты векторов риска равны соответственно 4,69, 3,44, 1,56 и 3,01. Минимальная из них координата 1,56 у решающего правила d3. Поэтому из названныхчистых стратегий минимальный наибольший риск обеспечивает стратегияd3. Найдем координаты точки A, которая соответствует минимаксной стратегии. Координаты этой точки x и

y равны (она

лежит на

прямойy = x ).

Как известно, уравнение прямой,

проходящей через две точки (x1, y2 ) и (x2 , y2 ), имеет вид:

 

 

 

 

 

 

y - y1

=

y2 - y1

.

 

 

 

 

 

 

x - x

 

 

 

 

 

 

 

 

x

- x

 

 

 

 

 

1

 

2

1

 

Поэтому прямая, проходящая через точки d3 и d4, имеет уравнение

 

 

y -1,04

=

3,01

-1,04

 

или 1,97x +1, 25y = 4,37.

 

 

 

 

-1,56

 

 

 

x -1,56 0,31

 

 

 

равенствомy = x дает возможность

Полученное

уравнение

вместе

с

определить координаты точки A : y = x =1,36. Расстояние от точки d3 до точки A равно

(1,36 -1,56)2 + (1,36 -1,04)2 » 0,38,

а расстояние от точки до точки A равно

(0,31 -1,36)2 + (3,01 -1,36)2 »1,96.

258

 

 

Рис. 3.8.8

 

Первое

расстояние

примерно

в пять раз меньше .вторЭтого

означает, что

решению d3

следует

приписать вероятностьl3 = 5 / 6,

решение d4 использовать с вероятностью l4 =1/ 6, а l1 и l2 взять равными нулю. Далее следует поступать следующим образом. Подбрасываем игральный кубик. Если на нем выпадает заданная грань(например, цифра один), то используем стратегию d4. Если же заданная грань не выпадает, то принимаем решение в соответствии с правилом d3.

Ответ. Оптимальной байесовской стратегией является стратегияd3. Оптимальная минимаксная стратегия реализуется при наборе вероятностей l1 =l2 = 0, l3 = 5 / 6, l4 =1/ 6.

Задача 3.28. В трех внешне одинаковых урнах находятся шары. В первой и второй урнах по k1 белых и по k2 черных шара, а в третьей урне k3 белых шаров иk4 черных. Урну выбирают наугад и из нее производится повторная выборка четырех шаров. По результатам выбора необходимо принять решение относительно содержания урны, из которой производился выбор шаров, т. е. пространство решений состоит из двух решений:

––решение a1 –– шары выбирались из первой или второй урны (вероятность выбора белого шара равна q1);

––решение a2 –– шары выбирались из третьей урны(вероятность

выбора белого шара равна q2).

Функция потерь имеет следующий вид.

 

a1

a2

q1

L11

L12

q2

L21

L22

259

Перечислите возможные чистые стратегии. Найдите байесовскую и минимаксную стратегии. (См. пример 3.28 и исходные данные.)

Исходные данные к задаче 3.28.

L11

L12

L21

L22

k1

k2

k3

k4

1

0

2

4

–1

4

2

3

3

2

1

3

4

–1

4

2

2

4

3

–1

4

3

1

2

6

5

5

4

1

5

4

–1

2

4

6

2

5

0

3

4

1

4

6

3

2

6

–1

5

4

1

3

3

4

2

7

0

2

5

1

2

4

4

2

8

0

2

4

–1

5

5

2

6

9

1

3

4

–1

2

6

2

4

10

–1

4

3

1

3

2

2

6

11

1

5

4

–1

4

2

3

3

12

0

3

4

1

4

2

2

4

13

–1

5

4

1

2

6

5

5

14

0

2

5

1

2

4

6

2

15

0

2

4

–1

4

6

3

2

L11

L12

L21

L22

k1

k2

k3

k4

16

1

3

4

–1

3

3

4

2

17

–1

4

3

1

2

4

4

2

18

1

5

4

–1

5

5

2

6

19

0

3

4

1

2

6

2

4

20

–1

5

4

1

3

2

2

6

21

0

2

5

1

4

2

3

3

22

0

2

4

–1

4

2

2

4

23

0

2

4

–1

2

6

5

5

24

1

3

4

–1

2

4

6

2

25

–1

4

3

1

4

6

3

2

26

1

5

4

–1

4

2

3

3

27

0

3

4

1

4

2

2

4

28

–1

5

4

1

2

6

5

5

29

0

2

5

1

2

4

6

2

30

0

2

4

–1

4

6

3

2

260

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]