Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Мания, Г. М. Статистическое оценивание распределения вероятностей

.pdf
Скачиваний:
21
Добавлен:
20.10.2023
Размер:
7.77 Mб
Скачать

Теперь доказательство теоремы следует

из непрерывности f(z)

и следующего простого неравенства.

 

 

 

Для любых случайных величин

р,-,

v,-,

х,-, i=\,r,

(Е {max |р,—V,-) 2})1'/2 < (Е {max |р, -

х,-] 2})г^ +

i

i

 

 

 

 

 

(3.1.8)

+ (Е {max|v(, - x ;.|2})W2.

 

Действительно, для доказательства

нужно

перейти

к р*,.

V * ,

X * , где

 

 

 

 

 

 

 

 

 

 

 

|р*—у* |= max |р,— V,-1

и

х* - ж-

 

 

 

 

 

 

i

 

 

 

 

при р* = р;

и использовать

неравенство

треугольника. Примене­

ние

(3.1.8)

к оценкам

(3.1.3), (3.1.4),. (3.1.7) завершает доказа­

тельство теоремы.

 

 

 

 

 

 

 

Для усредненного

критерия

 

 

 

 

 

 

 

EQ ^пт\Тпт iz)— f (z) Р>

 

(3-1.9)

где

Е^ означает усреднение (по z) по мере Q, верна

 

 

Т е о р е м а

3.2.

Если мера Q абсолютно

непрерывна по

лебеговой мере,

f(z)<^H, то в условиях теоремы 3.1 на п,

т, /,

оценка fnm(z) состоятельна в смысле критерия

(3.1.9).

 

,

Д о к а з а т е л ь с т в о ,

как и прежде,

проведем в два

эта­

па. При доказательстве первой части теоремы 3.1 мы пользова­

лись лишь ограниченностью

плотности

/(г), так

что в рассмат­

риваемом случае непосредственно имеем

 

 

 

 

 

р (St)

■0.

 

Е«Е£ fr.m (%)

 

 

 

 

Q (S{)

 

 

Для доказательства второй части теоремы разложим

 

Е*Е&

Р (St) 2

 

 

 

т -

 

 

 

 

 

Q (Si)

 

 

на два слагаемых,

соответствующих условиям

max Q(S-)<<5 w

max Q(S') > 5 . Для

второго

слагаемого

 

 

i

имеем оценку:

ПО

 

EQE«

p )

P(St) 2

 

 

 

Q(st)

/ {maxQ(Si) > 5 } ^

 

 

 

 

 

 

 

 

i

 

 

 

^

c(m )— 4 Я 2с3 max

-Л -.

(3J . 10)

 

 

 

 

i

mo?

 

В первом

слагаемом разобьем

область интегрирование по Q на.

множества G и Gc, где

 

 

 

 

G=

z :z £ S

и из

Q (5) <

3 следует P(S)

 

 

 

 

 

 

Q(S)

 

Для области

G имеем оценку

 

 

 

Е«ЕЧ

f(*Y

P(St)

1 п<г2

(3.1.11)

 

 

 

 

<HSt)

 

 

Очевидно,

что

Q(Gc)—>-0

при

5->0

 

 

 

(3.1.12)

вследствие непрерывности /(z ) и абсолютной непрерывности ме­ ры Q по отношению к лебеговой мере.

Учитывая (3.1.10), (3.1.11), (3.1.12), получаем

Е« Е£

/(*)-

Р (St) ^ 4 Я 2 с3 max

-+ е 2+ 4

Я 2 Q(GC).

 

 

 

Q (S,)

mo2

 

Для

завершения доказательства теоремы 3.2 нужно восполь­

зоваться

(3.1.8).

 

 

 

При доказательстве теорем 3.1

и 3.2 была использована

связь меры

Q с

мерой Лебега. Однако в задачах,

подобных рас­

сматриваемой, естественно формулировать условия в одних лишь терминах мер Р и Q . В самом деле, даже тривиальный пример,

когда P=Q

и Q сингулярна

относительно лебеговой

меры,

убеждает, что достаточно потребовать равномерную

го г

сходи­

мость

 

 

 

 

 

 

^ | U / ( 2)

при

Q(S)-+ о

(3.1.13)

(S —интервал,

содержащий точку z)

без привлечения лебеговой

меры.

 

 

 

 

 

Формально это— прямое обобщение обычного требования рав­ номерной непрерывности плотности по отношению к лебеговой мере, которое вводится при' ее оценке.

ILL

Т е о р е м а

3.3.

Если выполнено условие (3.1.13)

и / (г) ин­

тегрируема с

квадратом,

то оценка (3.1.1)

состоятельна в

смысле критерия (3.1.2).

 

 

 

 

 

 

Д о к а з а т е л ь с т в о .

Как

и при доказательстве

теоремы

3.2, оценка (3.1.3) проверки не требует.

 

 

 

 

Докажем,

что

 

 

 

 

 

 

 

EQ Eg

P(St)m

P(St)

 

 

 

(3.1.14)

и

 

k

 

Q (St)

 

 

 

 

E« EQ P($t)

 

 

 

 

 

 

- m

 

 

 

(3.1.15)

 

 

Q (Sd

 

 

т

 

 

Разобьем область интегрирования по

 

 

 

мере №

на события

 

 

 

 

 

| 2

1

 

 

 

 

 

Q (Sj) т

Q(S^ т

,

 

 

Ym) : max

 

 

h

 

 

 

 

 

}

h

 

 

 

t — I, г, для (3.1.14)

и на события

 

 

 

 

Ai

i = 1, г, для

(Къ Г 2,..., Y J : max

sup

PJSj)_-jm '

 

 

/ г £S,

Q(Sf)

:

SUp

P(St)

-/(2)

 

z£Si

< 2 ( S ,)

 

 

(3.1.15).

На

множестве

у Л ( В^, где B{ опреде-

 

 

 

 

i

ляются из (3.1.6), будем иметь оценки

 

 

 

P(St)

PA S1 - m

< 4

+ / (2).

(3.1.16)

Q (Sd " s

Q (Si)

0

 

 

 

а на множестве (JAtBLимеем

 

 

 

 

i

 

P(St) •/(2) < e .

 

 

 

sup

 

(3.1.17)

 

z£Si

Q(St)

 

 

 

 

Доказательство теоремы 3.3 завершается,

если

учесть

(3.1.16)

и (3.1.17) в оценках (3.1.4) и (3.1.7),

а также

интегрируемость

/(г ) с квадратом.

 

 

 

 

 

 

При рассмотрении случая k "> 1

возникают

специфические

трудности: одна лишь

малость Q(5),

где

5 —/fe-мерный

парал-

112

лелепипед, может не

повлечь за собой близости

р /£)

к f(z).

——-

 

 

 

 

 

Q(S)

 

Sh

Поэтому для обеспечения суживания случайных

областей

при п, т -> с о

приходится разбивать пространство

Rh по

всем

k

направлениям координатных осей.

 

 

 

 

Пусть X имеет распределение Р, a Y—Q и

 

 

 

 

Xi (Х-ц,

X^f,...,

Хм),

 

 

 

 

Yi = (Yy,

 

Yhf), /= i7 m ,

 

 

 

—независимые

выборки

из X и Y соответственно.

 

 

 

Предположим, что первые координаты F -ов упорядочены в

порядке возрастания УП< У 12

 

 

 

 

Образуем

теперь

^-мерные

цилиндры Sk{ ,

разбивая Rk

гиперплоскостями, перпендикулярными первой координатной оси

и проходящими через точки, первые

координаты которых име­

ют номера

 

»i=i

 

Таким образом, вместе с точками на граничных гиперплос-

костях цилиндры Sih содержат ровно

точек, тг—количество та­

ких цилиндров. Упорядочим вторые координаты У-ов в порядке

их

возрастания: У21 <

У22< ... < У2т. В каждом цилиндре

S*

образуем цилиндры

проводя гиперплоскости, перпен­

дикулярные второй координатной оси через точки, вторые коор­ динаты которых имеют соответственно номера

 

in — 1, г,2'

Гг

 

 

h1г2’

2

^*1 ^*2

^*1

 

 

^2 —1

 

Продолжая последовательно процесс

разбиения, получим ци-

k

содержащие

i%ik

точек,

причем

линдры Si i ik,

 

= 1,

i

 

 

 

11 12 ■ ’ lk—1

 

8. Г. М. Мания

113

Опять воспользуемся тем, что случайные величины (условные вероятности)

 

Q

( s

 

, Н У , , . - . П/)е

 

 

 

h = H K

 

имеют бета-распределение с параметрами

 

 

 

 

 

 

hxг'а .... ih »

^'l к ■■■ —1~~^'1к

<A

^

 

 

 

При сделанном

выборе

случайных

областей

S'j

,•

,-й , если,

например,

Q имеет непрерывную

положительную

плотность по

лебеговой

мере

в

Rk, то

Р

(Si

,

и )

будет

равномерно близ-

--------1

2'' ~.

-

 

 

 

 

 

^ . .

ik

)

 

 

 

 

 

 

 

 

 

/ ( 2г,...,

 

i\i%

 

 

 

 

 

 

 

ко

к плотности

zft)

в ограниченном цилиндре

|ггК Л ,

£ =

1,/г. Имеет место следующая

 

 

 

 

 

 

 

 

 

Т е о р е м а

3.4. Утверждения теорем 3.1 и 3.2 остаются

в силе, если дополнительно потребовать,

чтобы при

п, т->

с о ,

 

 

шах

т

 

■О,

max

 

ml: :

 

 

0 ,

 

 

 

 

 

h is... ih

 

 

 

 

к.....-4i /. .

 

 

h. h ...... ik

li1 i3 ...ih -i

 

 

 

 

 

,

 

кi2 .•-th

 

 

 

 

 

 

 

 

 

 

 

 

 

 

max l;

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i\ 12•■•ih

 

 

 

 

 

 

 

 

 

 

 

 

*!> •••,ih

 

< c (/i),

h= 1, k .

 

 

 

 

 

 

 

min

 

 

 

 

 

 

 

 

»i>

 

 

 

 

 

 

 

 

 

 

 

 

 

 

к..... Чь

 

 

 

 

 

 

 

 

 

 

 

 

Д о к а з а т е л ь с т в о .

Разобьем

область интегрирования

на

множества

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D

- h =

{(У,,, Г 2/,..., YhI):Q(SiJ<*lf

Q ( s j i2)

 

 

 

ni\

 

< S 2,...

 

 

 

 

 

 

 

 

 

 

 

 

 

Q ( < )

 

 

 

 

 

 

 

« д а м , . . . / » )

< 3 ft

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5* .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ti ta ..• ik

 

 

 

 

 

 

 

 

Доказательство теоремы 3.4 следует из оценок

 

 

 

Р 1ВС, . .

 

< р { 0 ( 4 ) > б 1} + р \ ^ ъ ^ >

ьг } + . . . +

 

* *1

*2 •••Lk

 

 

 

 

 

 

 

 

 

1

Q(5ft)

 

 

 

114

+

р

Q(S,h h ■■■ik

 

 

 

 

 

 

 

Q(Si±

<

SM

<

 

 

+

 

 

... « ^ Г

"*

1

 

 

 

I

г2 ^*'i ig~^~

+

‘ t'l г’а ... tfe

(^'i

ta ... ik +

0

(//'i+ 1 ) ( / ‘i + 2 ) s *

i ^h

... ik +

m

l i 2 . . . ; k

+ 2 ) 5 i

§2. АСИМПТОТИЧЕСКОЕ ПОВЕДЕНИЕ РАСПРЕДЕЛЕНИЙ

 

Исследуем теперь

 

асимптотическое

поведение распределе­

ния

оценки fnm(z). Ограничимся сначала

случаем k— l

 

П о определению

 

 

 

 

 

 

?

( * ) = / ( 5 ) -

 

 

 

/ nm \со)

—-— »

 

здесь

l(S) ~ количество

точек из

выборки

попавших

в случайную область S= S(YU..., Ym), лредставлякшую интер­

вал (20

20+fl), где

а —расстояние от г0 до

/-Й

ближайшей к

г0 точки из

выборки

у

 

 

 

Следо вательно, случайная

величина I (S)

распределена би­

номиально

со случайным параметром-вероятностью успеха"

т. е.

в принятых

нами

обозначениях для

усреднения а

вероэтнсстейбЫЧН° ИСПСЛЬ3^емсм ^означении для биномиальна

имеем

*<'• л* Р ) ~ Ы ( ' - Р Т - 1

 

 

Р { l(S) = i} = Egb(l, п, P(S)).

(3.2.1)

Чтобы всследсЕать случайную величину

P (S ) = J f(z)dQ(z),

допустим, что f(z) имеет производные до третьего порядка вклю­ чительно. Тогда

z<rf ~и1п

Р(S) == j /

г0—а

V T a ] т>

+ Т ГМ j

го~«

го+я

(z) dQ(z)=f(z0)Q(S) + / ' (z0) Г(г-г0) dQ(z) +

.

 

^ _

 

 

гп—а

 

2о+

 

 

у

(1ЧЛ-а

 

 

( z - z 0)2 dQ(2)H-0 j Г |г~

z0\3dQ(z)

(3 .2 .2)

\ sгJ0—L а

 

 

)

115

Предположим далее, что Q имеет непрерывную положи­ тельную в точке г0 плотность g-(z) (по лебеговой мере), облада­ ющую производными до второго порядка. Аналогично предыду­ щему получим

го"Ьа г0+я

Q(S)= J*

g(z) dz=2g(z0)a + g'(zQ) j ( z - z 0)dz-|-O(a3).

Zq d

Zq~—(Z

Применяяя это приближение повторно, будем иметь

2 a = Q(S) J — +0(a3)= Q(S) _ i_ + 0 ( Q 3 (S)). g(zо) ё(*о)

Производяпростые

преобразования в (3.2.2)

и подстав­

ляя выражение для 2 а,

получим:

 

 

 

а

 

 

P(S)=/(z0)Q(S)+/'(z0)g(zo) J* zdz4-f'(z0)g'(z0)

z2dz+

 

•a

 

I

 

 

—а

а

+

+

или

где

+ Y Г (zo) g (z0) Гг2 dz + 0 (a 4) =

f (z0) Q(S) +

 

f'(z0)g' (z0) +

Y f"(z0)g(z°)

l-a*+0(a*)=f(z0)Q(S) +

f' (z0)g' (z0) + l - f " ( z 0)g(z0)'

1

Q3(S)+0(Q *(S )),

 

. 12g^(z0)

 

 

P(S)=f(z0)Q(S)i-c(z0) Q*(S)fO(Q*(S)),

(3.2.3)

c (zo) =

1

 

 

 

f'(z0)g' (zo ) + y f" (zo) g (zo)

 

i

w

 

 

 

Если теперь формально в (3.2.1) подставить главный член

разложения Р (S)

из (3.2.3),

получим взвешенное биномиальное

распределение со

случайным

параметром f(z0)Q(S),

где Q (S),

как отмечалось выше, имеет

бета-распределение с параметрами

/, т—1+ l . Фактически это есть распределение

количества

116

/(S J , Х -ов,

попавших в случайную

область

Sl5

имеющую ве­

роятность

f(z0)Q(S):

 

 

 

 

 

 

 

P {/(S 1) = i} = EQb(j,

/, f(z0)Q(S)).

 

 

Здесь

означает уже усреднение по распределению

 

 

 

 

 

Q

 

 

 

Р { Q ( S ) < Q } = B '1(/, m - l + 1) j

 

 

 

 

 

 

 

О

 

 

 

Производя

интегрирование, окончательно п о л уч и м

 

 

 

 

1

P{/(S1)=i} = C‘ B-1(/,

Ш - 1+ 1)х

 

 

 

 

 

 

 

 

 

 

х

j

[tf (г0)У [ l - t f (z0)]n~l t™ (1

=

 

 

 

О

 

 

 

 

 

- [ /( г ,) ] '

pm+1 pi

m + i+ l,

/ W

) ,

(3.2.4)

 

^n+m

 

 

 

 

 

 

 

где В (a, p)—бета-функция, а

 

 

 

 

 

 

 

I

 

 

 

 

F(oc,p,

r ,

=

 

 

 

 

 

 

 

0

 

 

 

 

— гипергеометрическая функция.

 

 

 

 

Далее,

f(z0)Q(S) имеет среднее f(z0) —L-. и дисперсию

 

 

 

 

т+ 1

 

 

\ Цт,—1-f 1)

° > + 1 ) 2(т ф 2)‘

Подставляя опять-таки формально в (3.2.4) вместо f(z0)Q(S)

выражение / (z0) ^, получим биномиальное распределение

P {/(S 2) = i} = &

( i,

п, f(z0) —L—)

(3.2.5)

 

 

V

т-1-1/

 

для^ количества

/(S 2), Х -ов,

попавших в область

S2 (неслучай­

ный интервал с

центром в z0) с

вероятностью

 

P(S2) —f(z0) — .

/пф 1

117

Покажем, что нормированные статистики, соответствующие (3.2.1), (3.2.4), (3.2.5), распределены асимптотически нормально в смысле сильной сходимости соответствующих функций расп­ ределения и найдем оценку нормальных приближений.

Как и ранее, будем предполагать, что 0<j cx<j — < с 2; од-

 

 

т

нако для упрощения записи положим просто п= т.

Распределение сумм

 

т

т

т

/ = 1

/=1

/= i

где llmj,

l*mj, I3nj, / = l,m ,—последовательности независимых оди­

наково распределенных величин,

причем Zj^, Z^, Z^t представ­

ляют собой индикаторы событий

S, Slt S2 соответственно, зада­

ется посредством (3.2.1), (3.2.4),(3.2.5). Соответствующие функ­

ции распределения обозначим F}„(x),

Ffn(x), F3m(x)

и пусть

Щ) —

распределение

случайной величины

£,

а яд=]Х Dig.

 

В силу независимости испытаний

Х 1,..., Х п от

Ym

(т. е. в силу

того, что 11т и Z зависят от К ^ ...,

Ym лишь

пос­

редством S), условные распределения примут вид

 

 

 

F'mixW^ Y2......

y

j = F M *lS ),

 

 

 

F2m(x\Yv Y2,...,

Ym)= F*m(x\S).

 

 

Т е о р е м а 3.5. При — - > 0

и Z ->oo распределения

 

 

m

 

 

 

 

 

сильно сходятся к N (0, 1), причем для метрики сильной схо­ димости имеют место оценки

sup \Flm(xa Z^+E/jj,)—Ф (х)|^ сг( т ,

Z)-~

cF) Z-1/,

i = 1 3.

(3.2.6)

Д о к а з а т е л ь с т в о .

Докажем сначала утверждение, со ­

ответствующее Z = 3.

118

Применяя теорему нормального приближения для сумм не­ зависимых слагаемых [15], будем иметь

 

 

 

 

 

 

 

 

т

 

 

 

 

sup

|/*

( х < + Е /» ,) - Ф ( х ) | <

_ А _ V

 

Е ] / ^ - Е Рт,\*.

(3.2.7)

x~Rl

 

 

 

 

 

z%i

 

 

 

 

 

 

 

 

 

 

 

 

/= 1

 

 

 

 

Для Е |l^j—El3mj |3 получим

 

 

 

 

 

 

 

 

 

 

 

 

 

 

/

 

3

 

 

 

 

E\l3ml-EPmir = [ l ^ f ( z 0)

 

/ Ы

 

 

 

 

 

 

 

 

m-f- 1

 

 

m-f- 1

 

+ /С о)

1 —/( г 0)

l

 

 

 

 

/

/ /2

 

m -f

1

/(г« ) - 4 т + 0 Л

 

 

 

m + 1;

 

 

 

 

m-f- 1

Vm2

Непосредственно имеем также

 

 

 

 

 

 

 

Eft,

,m

lf(z0)= f(z0)l + O (-L

 

 

 

 

, ,

 

 

 

 

m-f- 1

 

 

 

 

 

\m

 

 

 

 

o2l3m= tnf(z0)

l

 

 

 

/

 

 

 

 

 

m-f- 1

l - / ( z e) m-f- 1 /

 

 

 

 

 

 

 

 

 

 

 

— f ( zo) ^ 1 + 0

( “

] ]

 

 

(3-2.8)

Остается подставить эти приближения в (3.2.7).

 

Для

доказательства

 

(3.2.6)

при

i — 2

применим оценку

нормального приближения для

подынтегрального выражения в

правой

части неравенства

 

 

 

 

 

 

 

 

 

 

 

sup

[ Р ^ ( х а /^ + Е 4 ) - Ф ( х ) К

 

 

 

 

 

x^R1

 

 

 

 

 

 

 

 

 

 

 

< Е &

sup

]F|,(xa/^4-E/|t1 5 )-0 (x )| .

 

 

 

x^R1

 

 

 

 

 

 

 

 

 

(Мы иногда опускаем индексы при операторе

усреднения,

нап­

ример,

Е l*m= Е%Е& {12т15) ).

 

 

 

 

 

 

 

В силу условной независимости l2mj при условии S

 

 

 

sup

\Ргт(ха1гт+ El*,)—Ф (х)|<

 

 

 

 

jc^R1

 

 

 

 

 

 

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

 

 

< E S i 3 ( F T s ) 2 j E||!" ' _E<" ,|,|S|'

 

 

<3’2'9)

119

Соседние файлы в папке книги из ГПНТБ