Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
СМОД – Статистические методы обработки данных / СМОД_Часть2 Муха ВС, БГУИР 2007 (Мет пособие).pdf
Скачиваний:
95
Добавлен:
15.06.2014
Размер:
797 Кб
Скачать

Министерство образования Республики Беларусь

Учреждение образования БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

ИНФОРМАТИКИ И РАДИОЭЛЕКТРОНИКИ

_______________________________________________________________

Кафедра информационных технологий

автоматизированных систем

В. С. Муха

Статистические методы обработки данных

Часть 2

Учебно-методическое пособия для студентов специальности "Автоматизированные системы обработки информации"

Минск 2007

6 ТЕОРИЯ СТАТИСТИЧЕСКИХ РЕШЕНИЙ

6.1 Постановка задачи оптимальных статистических решений

Предположим, что исследуемая система может находиться в состоянии s , s S , S – пространство состояний [11]. Состояние s считается случайной непрерывной величиной с известным распределением F( s ). Статистик должен принять решение о состоянии системы (указать значение s ), производя или не производя наблюдений (эксперимента) над системой. Решение статистика обозначим d D , D – пространство решений, такое же, как и пространство состояний S . Решение может быть правильным или неправильным. В случае правильного решения статистик не должен нести потерь, а в случае неправильного решения несет потери. Для характеристики потерь вводится функция потерь w( s,d ), зависящая от s и d . Обычно функция потерь зависит от расстояния ρ между s и d . Функция потерь w( ρ ) должна удовлетворять следующим свой-

ствам:

1.w( ρ ) 0 (неотрицательность);

2.w( 0 ) = 0 (при ρ = 0 потеть нет);

3.если ρ1 ρ2 , то w( ρ1 ) w( ρ2 ) (неубывание).

Часто для действительных пространств S , D применяется так называемая квадратичная функция потерь

w( s,d ) =( s d )2 .

Поскольку состояние s системы считается случайным, то функция потерь w( s,d ) является случайной величиной.

Теория статистических решений рассматривает так называемые рандомизированные решения, когда решение выносится по жребию, т.е. в соответствии с некоторым законом распределения. В случае рандомизированного решения предполагается, что в пространстве D задано распределение F( d ) и решение

2

выносится как случайное число, выбранное из этого распределения. Функция F (d ) называется решающей функцией. В качестве критерия оптимальности решения выбирается средний риск, который представляет собой математическое ожидание функции потерь:

r( F( d )) = E( w( s,d )).

Задача состоит в определении решающей функции F (d ) , минимизирующей средний риск r(F (d )) . Данная оптимизационная задача записывается в виде

r( F( d )) min .

F( d )

Поскольку в этой задаче имеется полная априорная информация в виде функций распределения F(s) , F(d ) , то она относится к классу байесовских задач.

6.2 Статистические решения без наблюдений. Случай непрерывных состояний и решений

Рассмотрим задачу статистических решений, сформулированную в предыдущем разделе, со следующими уточняющими условиями. Предположим, что исследуемая система может находиться в состоянии s , s S , S – пространство состояний. Состояние s считается случайной непрерывной величиной с известной плотностью вероятности f (s) . Статистик должен принять решение d D , D – пространство решений, не производя наблюдений над системой.

Будем рассматривать рандомизированные решения, определенные в виде плотности вероятности f (d ) . Качество решения будем определять средним риском

r( f ( d )) = E( w( s,d )),

(6.1)

и решать оптимизационную задачу

r( f ( d )) min .

f ( d )

Раскроем выражение среднего риска

3

r( f ( d )) = E( w( s,d )) = ∫ ∫w( s,d ) f ( s ) f ( d )dsdd .

S D

Введем понятие условного риска

r( d ) = w( s,d ) f ( s )ds .

(6.2)

D

 

Тогда средний риск (6.1) запишется в виде

 

r( f ( d )) = r( d ) f ( d )dd .

(6.3)

D

 

В силу неотрицательности функции потерь получаем, что r(d ) 0 . Применяя к

(6.3) теорему о среднем значении интегрального исчисления, получим

r( f ( d )) = r( d ) f ( d )dd = r( d )ср f ( d )dd = r( d )ср r( d )min ,

D D

где r(d )ср – среднее значение условного риска (6.2), r(d )min – минимальное

значение условного риска (6.2). Последнее равенство в этом выражении записано на основании свойства нормировки для плотности вероятности

f (d )dd =1. Это выражение означает, что средний риск ограничен тем же ми-

D

нимальным значением, что и условный риск. Это значение r(d )min средний риск будет иметь, если решающую функции выбрать в виде дельта-функции

f ( d ) =δ( d d*) ,

(6.4)

где d * – решение, минимизирующее условный риск (6.2)

r(d ) . Действительно,

подставив (6.4) в (6.3), мы получим

 

r( f ( d )) = r( d )δ( d d*)dd = r( d*) = r( d )min .

D

Этот результат мы записали на основе фильтрующего свойства δ-функции: для любой функции ϕ(x) выполняется равенство

ϕ( x )δ( x x*)dx =ϕ( x*) .

Решающее правило с решающей функцией (6.4) называется нерандомизированным. Итак, мы показали, что оптимальное решающее правило является нерандомизированным и определяется из условия минимума условного риска (6.2):

4

r( d ) = w( s,d ) f ( s )ds min .

S

d D

 

Пример 6.1. Состояние системы s имеет нормальную плотность вероятности

f ( s ) = 1

e

( sas )2

2σs2

 

= N( as ,σs2 ),

2πσs2

 

 

 

 

где as – среднее значение состояния,

σs2

– дисперсия состояния. Это значит,

что в среднем система находится в состоянии as , но может отклоняться от со-

стояния as в соответствии с разбросом, который определяется дисперсией σs2 .

Требуется, не производя наблюдений над системой, указать, в каком состоянии она находится.

Для решения задачи выберем квадратичную функцию потерь w( s,d ) =( s d )2

и найдем условный риск

 

 

r( d ) = w( s,d )f ( s )ds = E( s d )2 = E( s 2 ) 2dE( s ) + E( d

2 ) =

−∞

 

 

= E( s 2 ) 2dE( s ) + d 2 =( as2 +σs2 ) 2das

+ d 2 min .

 

 

 

 

d

 

Необходимое условие экстремума функции r( d ) есть уравнение

 

 

d

r( d ) = 2d 2as = 0 ,

 

 

 

 

 

 

 

dd

 

 

из которого получаем d * = as . Следовательно, оптимальным будет решение о том, что система находится в состояние as . При этом минимальное значение условного риска равно

r( d )min = r( d*) = as2 +σs2 2as2 + as2 =σs2 ,

т.е. равно дисперсии состояния системы. Приняв решение d as , мы получим больший риск.

5