Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
СМОД – Статистические методы обработки данных / СМОД_Часть3 Муха ВС, БГУИР 2007 (Мет пособие).pdf
Скачиваний:
114
Добавлен:
15.06.2014
Размер:
475.68 Кб
Скачать

Объединяя эти два случая, получим окончательное выражение для функции

влияния

 

1

 

, x me

 

 

 

2 f ( me )

 

 

IF(x;T, F) =

1

 

 

, x < me

 

 

 

2 f ( me )

 

 

 

где

= sign( x me ) , 2 f ( me )

sign( x ) = 1, x >0,1,x <0.

Полученная функция влияния приведена на рис. 11.2, функция 2.

11.10 Анализ робастности выборочной медианы

Поскольку функция влияния медианы (рис. 11.2, функция 2) ограничена, то

чувствительность к большей ошибке γ =

1

 

. Это значит, что выборочная

2 f ( me )

 

 

медиана является Β -робастной оценкой математического ожидания. Для

нормального

закона чувствительность к большой ошибке имеет значение

γ =

1

. Чувствительность к локальному сдвигу для данного функционала

2σ

2π

 

λ = ∞,

поскольку функция влияния претерпевает скачок в точке x = me . Это

свидетельствует о том, что медиана чувствительна к эффекту "ерзанья", то есть к малым ошибкам в данных. Однако этот недостаток не очень важный. Точка удаления функционала ρ = +∞. Это значит, что медиана не удаляет резко

выделяющиеся наблюдения. Если в выборку добавить одно резко выделяющееся наблюдение, то медиана все-таки потянется в сторону этого наблюдения. Асимптотическая дисперсия выборочной медианы определяется выражением

)

1

 

2

 

1

 

sign2 ( y m

e

)

 

1

 

 

V ( me ) =

 

 

[IF(y;T ,F )]

dF (y)=

 

 

 

 

 

dF( y ) =

 

 

 

.

n

n

4 f 2 ( me )

 

 

 

4nf 2

( me )

 

 

 

 

 

 

 

 

24

Например, для нормального распределения f ( me ) = σ 12π и

V ( m)e ) = π2 σn2 ,

что больше в π / 2 раз, чем для выборочного среднего.

11.11 М-оценки

Одним из методов получения робастных оценок является метод получения так называемых М-оценок. М-оценки являются обобщением максимально правдоподобных оценок, то есть МП-оценок.

Как известно, МП-оценка

параметра T максимизирует функцию

n

 

правдоподобия f ( xi ,T ), где

f ( x,T ) – плотность вероятности генеральной

i=1

 

совокупности. Обычно задачу на максимум функции правдоподобия сводят к следующей задаче на минимум:

n

 

 

ln f ( xi ,T ) min .

(11.5)

i=1

T

 

 

 

Обобщением задачи (11.5) является задача

 

n

ρ( xi ,T ) min .

 

(11.6)

i=1

T

 

 

 

Если функция ρ в (11.6) имеет производную ψ( x,T ) = T ρ( x,T ) , то задача

(11.6) сведется к решению уравнения

n

 

ψ( xi ,T ) = 0 .

(11.7)

i=1

Оценки, получаемые как решение задачи (11.6) (или (11.7)), называются М- оценками.

Понятно, что МП-оценки являются частным случаем М-оценок при

ρ( x,T ) = ln f ( x,T ).

25

Для М-оценок можно получить выражение функции влияния следующим образом. Аналогом уравнения (11.7) является следующее интегральное

уравнение относительного функционала T

 

ψ(x, T (F ))dF (x) = 0 .

(11.8)

Уравнение (11.8) позволяет получить функцию влияния. Для этого нужно в (11.8) заменить F( x ) на

Ft ( y ) =(1 t )F( y ) + th( y x )

(11.9)

и взять от нее производную по t при t = 0 . Поскольку функционал T (F ) не задан в явном виде, то воспользуемся правилами неявного дифференцирования.

Подставим (11.9) в (11.8),

ψ( y,T( Ft ( y )))dFt ( y ) = 0 ,

ивыполним дифференцирование под интегралом:

d

Tψ( y,T ) dt T( Ft )dFt ( y ) + ψ( y,T( Ft ))dFt ( y ) = 0.

При t = 0 получим

Tψ( y,T ) ddt T( F )dF( y ) +ψ( x,T( F )) = 0 .

откуда находим функцию влияния

IF( x;T , F ) =

 

 

 

 

ψ( x,T )

 

,

(11.10)

 

 

ψ( y,T )dF( y )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

T

 

 

и дисперсию оценки

 

 

 

 

 

 

 

 

 

 

V ( T , F ) =

ψ 2 ( x,T( F ))dF( x )

.

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

n

 

 

ψ( y,T )dF( y )

 

 

 

θ

 

 

 

 

 

 

 

 

 

 

 

 

Мы видим, что функция влияния пропорциональна функции ψ , которую мы можем выбирать. Выбрав ψ такой, чтобы она была ограниченной, мы получим

B -робастную оценку.

26

ψ( x,T )

11.12 М-оценки параметра сдвига

Если функция распределения генеральной совокупности F (x,θ) может быть представлена в виде F (x θ) , то параметр θ называется параметром сдвига.

Например, математическое определение нормального распределения является параметром сдвига.

При получении М-оценки параметра сдвига рекомендуется функцию ψ выбирать в виде ψ(x,θ) =ψ(x θ) , причем для симметричного распределения ее следует выбирать несимметричной: ψ( x ) = −ψ( x ) .

Для параметра сдвига функция влияния приобретает следующий вид:

IF( x;T , F ) = ψ ( x,T )dF( x )

где ψ( x ) – производная по x . Дисперсия оценки определяется выражением

 

 

 

 

 

 

 

ψ2( x )dF( x )

 

 

 

 

 

V(T , F ) =

 

 

.

 

 

 

 

 

n[ψ' ( x )dF( x )]2

 

 

Посмотрим, какой вид имеет функция ψ

для МП-оценок. В этом случае

ρ = ln f ( x,T ),

ψ =

ρ( T ) = −

f ' ( x )

.

В

 

частности,

для нормального

T

 

 

 

 

 

 

 

f ( x )

 

 

 

 

 

 

 

f ( x ) =

1

e

x2

 

 

1

 

x2

 

распределения

2

, f ( x )

= −x

 

e 2

, и ψ = x . При такой

2πσ

2πσ

 

 

 

 

 

 

 

 

 

 

 

 

функции ψ функция влияния параметра сдвига неограниченна, в связи с чем МП-оценка параметра сдвига не В-робастна.

Хьюбер предложил для получения робастной оценки параметра сдвига

выбирать функцию ψ вида ψ = x min(1,

b

 

) , b > 0 . Вид этой функции

| x |

 

 

приведен на рис. 11.5.

 

 

 

27