
книги из ГПНТБ / Мания, Г. М. Статистическое оценивание распределения вероятностей
.pdfТеперь доказательство теоремы следует |
из непрерывности f(z) |
||
и следующего простого неравенства. |
|
|
|
Для любых случайных величин |
р,-, |
v,-, |
х,-, i=\,r, |
(Е {max |р,—V,-) 2})1'/2 < (Е {max |р, - |
х,-] 2})г^ + |
||
i |
i |
|
|
|
|
|
(3.1.8) |
+ (Е {max|v(, - x ;.|2})W2.
|
Действительно, для доказательства |
нужно |
перейти |
к р*,. |
|||||
V * , |
X * , где |
|
|
|
|
|
|
|
|
|
|
|
|р*—у* |= max |р,— V,-1 |
и |
х* - ж- |
|
|||
|
|
|
|
|
i |
|
|
|
|
при р* = р; |
и использовать |
неравенство |
треугольника. Примене |
||||||
ние |
(3.1.8) |
к оценкам |
(3.1.3), (3.1.4),. (3.1.7) завершает доказа |
||||||
тельство теоремы. |
|
|
|
|
|
|
|||
|
Для усредненного |
критерия |
|
|
|
|
|||
|
|
|
EQ ^пт\Тпт iz)— f (z) Р> |
|
(3-1.9) |
||||
где |
Е^ означает усреднение (по z) по мере Q, верна |
|
|||||||
|
Т е о р е м а |
3.2. |
Если мера Q абсолютно |
непрерывна по |
|||||
лебеговой мере, |
f(z)<^H, то в условиях теоремы 3.1 на п, |
т, /, |
|||||||
оценка fnm(z) состоятельна в смысле критерия |
(3.1.9). |
|
|||||||
, |
Д о к а з а т е л ь с т в о , |
как и прежде, |
проведем в два |
эта |
па. При доказательстве первой части теоремы 3.1 мы пользова
лись лишь ограниченностью |
плотности |
/(г), так |
что в рассмат |
||
риваемом случае непосредственно имеем |
|
|
|
||
|
|
р (St) |
■0. |
|
|
Е«Е£ fr.m (%) |
|
|
|||
|
|
Q (S{) |
|
|
|
Для доказательства второй части теоремы разложим |
|||||
|
Е*Е& |
Р (St) 2 |
|
|
|
|
т - |
|
|
|
|
|
|
Q (Si) |
|
|
|
на два слагаемых, |
соответствующих условиям |
max Q(S-)<<5 w |
|||
max Q(S') > 5 . Для |
второго |
слагаемого |
|
|
i |
имеем оценку: |
ПО
|
EQE« |
p ) |
P(St) 2 |
|
|
|
|
Q(st) |
/ {maxQ(Si) > 5 } ^ |
|
|||
|
|
|
|
|||
|
|
|
i |
|
|
|
|
^ |
c(m )— 4 Я 2с3 max |
-Л -. |
(3J . 10) |
||
|
|
|
|
i |
mo? |
|
В первом |
слагаемом разобьем |
область интегрирование по Q на. |
||||
множества G и Gc, где |
|
|
|
|
||
G= |
z :z £ S |
и из |
Q (5) < |
3 следует P(S) |
|
|
|
|
|
|
|
Q(S) |
|
Для области |
G имеем оценку |
|
|
|||
|
Е«ЕЧ |
f(*Y |
P(St) |
1 п<г2 |
(3.1.11) |
|
|
|
|
|
<HSt) |
|
|
Очевидно, |
что |
Q(Gc)—>-0 |
при |
5->0 |
|
|
|
|
(3.1.12) |
вследствие непрерывности /(z ) и абсолютной непрерывности ме ры Q по отношению к лебеговой мере.
Учитывая (3.1.10), (3.1.11), (3.1.12), получаем
Е« Е£ |
/(*)- |
Р (St) ^ 4 Я 2 с3 max |
-+ е 2+ 4 |
Я 2 Q(GC). |
|
|
|
|
Q (S,) |
mo2 |
|
Для |
завершения доказательства теоремы 3.2 нужно восполь |
||||
зоваться |
(3.1.8). |
|
|
|
|
При доказательстве теорем 3.1 |
и 3.2 была использована |
||||
связь меры |
Q с |
мерой Лебега. Однако в задачах, |
подобных рас |
сматриваемой, естественно формулировать условия в одних лишь терминах мер Р и Q . В самом деле, даже тривиальный пример,
когда P=Q |
и Q сингулярна |
относительно лебеговой |
меры, |
||
убеждает, что достаточно потребовать равномерную |
го г |
сходи |
|||
мость |
|
|
|
|
|
|
^ | U / ( 2) |
при |
Q(S)-+ о |
(3.1.13) |
|
(S —интервал, |
содержащий точку z) |
без привлечения лебеговой |
|||
меры. |
|
|
|
|
|
Формально это— прямое обобщение обычного требования рав номерной непрерывности плотности по отношению к лебеговой мере, которое вводится при' ее оценке.
ILL
Т е о р е м а |
3.3. |
Если выполнено условие (3.1.13) |
и / (г) ин |
|||||
тегрируема с |
квадратом, |
то оценка (3.1.1) |
состоятельна в |
|||||
смысле критерия (3.1.2). |
|
|
|
|
|
|
||
Д о к а з а т е л ь с т в о . |
Как |
и при доказательстве |
теоремы |
|||||
3.2, оценка (3.1.3) проверки не требует. |
|
|
|
|
||||
Докажем, |
что |
|
|
|
|
|
|
|
EQ Eg |
P(St)m |
P(St) |
|
|
|
(3.1.14) |
||
и |
|
k |
|
Q (St) |
|
|
|
|
E« EQ P($t) |
|
|
|
|
|
|||
|
- m |
|
|
|
(3.1.15) |
|||
|
|
Q (Sd |
|
|
т |
|
|
|
Разобьем область интегрирования по |
|
|
|
|||||
мере № |
на события |
|||||||
|
|
|
|
|
| 2 |
1 |
|
|
|
|
|
Q (Sj) т |
Q(S^ т |
, |
|||
|
|
Ym) : max |
|
|
h |
|
|
|
|
|
|
} |
h |
|
|
|
|
t — I, г, для (3.1.14) |
и на события |
|
|
|
|
Ai
i = 1, г, для
(Къ Г 2,..., Y J : max |
sup |
PJSj)_-jm ' |
||
|
|
/ г £S, |
Q(Sf) |
|
: |
SUp |
P(St) |
-/(2) |
|
|
z£Si |
< 2 ( S ,) |
|
|
(3.1.15). |
На |
множестве |
у Л ( В^, где B{ опреде- |
|
|
|
|
|
i |
ляются из (3.1.6), будем иметь оценки |
|
|
|
|||
P(St) |
PA S1 - m |
< 4 |
+ / (2). |
(3.1.16) |
||
Q (Sd " s |
Q (Si) |
0 |
|
|
|
|
а на множестве (JAtBLимеем |
|
|
|
|
||
i |
|
P(St) •/(2) < e . |
|
|
||
|
sup |
|
(3.1.17) |
|||
|
z£Si |
Q(St) |
|
|
|
|
Доказательство теоремы 3.3 завершается, |
если |
учесть |
(3.1.16) |
|||
и (3.1.17) в оценках (3.1.4) и (3.1.7), |
а также |
интегрируемость |
||||
/(г ) с квадратом. |
|
|
|
|
|
|
При рассмотрении случая k "> 1 |
возникают |
специфические |
||||
трудности: одна лишь |
малость Q(5), |
где |
5 —/fe-мерный |
парал- |
112
лелепипед, может не |
повлечь за собой близости |
р /£) |
к f(z). |
||||
——- |
|||||||
|
|
|
|
|
Q(S) |
|
Sh |
Поэтому для обеспечения суживания случайных |
областей |
||||||
при п, т -> с о |
приходится разбивать пространство |
Rh по |
всем |
k |
|||
направлениям координатных осей. |
|
|
|
|
|||
Пусть X имеет распределение Р, a Y—Q и |
|
|
|
||||
|
Xi (Х-ц, |
X^f,..., |
Хм), |
|
|
|
|
|
Yi = (Yy, |
|
Yhf), /= i7 m , |
|
|
|
|
—независимые |
выборки |
из X и Y соответственно. |
|
|
|
||
Предположим, что первые координаты F -ов упорядочены в |
|||||||
порядке возрастания УП< У 12 |
|
|
|
|
|||
Образуем |
теперь |
^-мерные |
цилиндры Sk{ , |
разбивая Rk |
гиперплоскостями, перпендикулярными первой координатной оси
и проходящими через точки, первые |
координаты которых име |
ют номера |
|
»i=i |
|
Таким образом, вместе с точками на граничных гиперплос- |
|
костях цилиндры Sih содержат ровно |
точек, тг—количество та |
ких цилиндров. Упорядочим вторые координаты У-ов в порядке
их |
возрастания: У21 < |
У22< ... < У2т. В каждом цилиндре |
S* |
образуем цилиндры |
проводя гиперплоскости, перпен |
дикулярные второй координатной оси через точки, вторые коор динаты которых имеют соответственно номера
|
in — 1, г,2' |
Гг |
|
|
h1г2’ |
2 |
^*1 ^*2 |
^*1 |
|
|
|
^2 —1 |
|
|
Продолжая последовательно процесс |
разбиения, получим ци- |
|||
k |
содержащие |
i%ik |
точек, |
причем |
линдры Si i ik, |
||||
|
= 1, |
i |
|
|
|
11 12 ■ ’ lk—1 |
|
8. Г. М. Мания |
113 |
Опять воспользуемся тем, что случайные величины (условные вероятности)
|
Q |
( s |
|
, Н У , , . - . П/)е |
|
|
|
h = H K |
|
||||||
имеют бета-распределение с параметрами |
|
|
|
|
|||||||||||
|
|
hxг'а .... ih » |
^'l к ■■■ —1~~^'1к |
<A |
^‘ |
|
|
|
|||||||
При сделанном |
выборе |
случайных |
областей |
S'j |
,• |
,-й , если, |
|||||||||
например, |
Q имеет непрерывную |
положительную |
плотность по |
||||||||||||
лебеговой |
мере |
в |
Rk, то |
Р |
(Si |
, |
и ) |
будет |
равномерно близ- |
||||||
--------1 |
2'' ~. |
- |
|||||||||||||
|
|
|
|
|
^ . . |
ik |
) |
|
|
|
|
|
|
||
|
|
|
/ ( 2г,..., |
|
i\i% |
|
|
|
|
|
|
|
|||
ко |
к плотности |
zft) |
в ограниченном цилиндре |
|ггК Л , |
|||||||||||
£ = |
1,/г. Имеет место следующая |
|
|
|
|
|
|
|
|
||||||
|
Т е о р е м а |
3.4. Утверждения теорем 3.1 и 3.2 остаются |
|||||||||||||
в силе, если дополнительно потребовать, |
чтобы при |
п, т-> |
с о , |
||||||||||||
|
|
шах |
т |
|
■О, |
max |
|
ml: : |
|
|
■ 0 , |
|
|||
|
|
|
|
h is... ih |
|
|
|||||||||
|
|
к.....-4i /. . |
|
|
h. h ...... ik |
li1 i3 ...ih -i |
|
|
|
||||||
|
|
, |
|
кi2 .•-th |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
max l; |
; |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i\ 12•■•ih |
|
|
|
|
|
|
|
|
|
||
|
|
|
*!> •••,ih |
|
< c (/i), |
h= 1, k . |
|
|
|
||||||
|
|
|
|
min |
|
|
|
|
|
||||||
|
|
|
»i> |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
к..... Чь |
|
|
|
|
|
|
|
|
|
|
|
|
|
Д о к а з а т е л ь с т в о . |
Разобьем |
область интегрирования |
на |
|||||||||||
множества |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
D |
- h = |
{(У,,, Г 2/,..., YhI):Q(SiJ<*lf |
Q ( s j i2) |
|
|
|||||||||
|
ni\ |
|
< S 2,... |
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
Q ( < ) |
|
|
|
|
|
|
|
|
« д а м , . . . / » ) |
< 3 ft |
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
5* . |
|
• |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ti ta ..• ik |
|
|
|
|
|
|
|
||
|
Доказательство теоремы 3.4 следует из оценок |
|
|
||||||||||||
|
Р 1ВС, . . |
|
< р { 0 ( 4 ) > б 1} + р \ ^ ъ ^ > |
ьг } + . . . + |
|||||||||||
|
* *1 |
*2 •••Lk |
|||||||||||||
|
|
|
|
|
|
|
|
|
• |
1 |
Q(5ft) |
|
|
|
114
+ |
р |
Q(S,h h ■■■ik |
|
|
|
|
|
|
|
|
Q(Si± |
< |
SM |
< |
|
|
+ |
|
|
... « ^ Г |
"* |
1 |
|
|
|
|
I |
г2 ^*'i ig~^~ |
+ |
‘ t'l г’а ... tfe |
(^'i |
ta ... ik + |
0 |
||
(//'i+ 1 ) ( / ‘i + 2 ) s * |
i ^h |
... ik + |
m |
l i 2 . . . ; k |
+ 2 ) 5 i |
§2. АСИМПТОТИЧЕСКОЕ ПОВЕДЕНИЕ РАСПРЕДЕЛЕНИЙ
|
Исследуем теперь |
|
асимптотическое |
поведение распределе |
|
ния |
оценки fnm(z). Ограничимся сначала |
случаем k— l |
|||
|
П о определению |
|
|
|
|
|
|
? |
( * ) = / ( 5 ) - |
|
|
|
|
/ nm \со) |
—-— » |
|
|
здесь |
l(S) ~ количество |
точек из |
выборки |
попавших |
в случайную область S= S(YU..., Ym), лредставлякшую интер
вал (20 |
20+fl), где |
а —расстояние от г0 до |
/-Й |
ближайшей к |
|
г0 точки из |
выборки |
у |
|
|
|
Следо вательно, случайная |
величина I (S) |
распределена би |
|||
номиально |
со случайным параметром-вероятностью успеха" |
||||
т. е. |
в принятых |
нами |
обозначениях для |
усреднения а |
вероэтнсстейбЫЧН° ИСПСЛЬ3^емсм ^означении для биномиальна
имеем |
*<'• л* Р ) ~ Ы ( ' - Р Т - 1 |
|
|
Р { l(S) = i} = Egb(l, п, P(S)). |
(3.2.1) |
Чтобы всследсЕать случайную величину
P (S ) = J f(z)dQ(z),
допустим, что f(z) имеет производные до третьего порядка вклю чительно. Тогда
z<rf-а ~и1п
Р(S) == j /
г„0—а
V T a ] т>
+ Т ГМ j
го~«
го+я
(z) dQ(z)=f(z0)Q(S) + / ' (z0) Г(г-г0) dQ(z) +
. |
|
^ _ |
|
|
гп—а |
|
|
2о+ |
|
|
у |
(1ЧЛ-а |
|
|
|
( z - z 0)2 dQ(2)H-0 j Г |г~ |
z0\3dQ(z) |
(3 .2 .2) |
|
\ sгJ0—L а |
|
|
) |
115
Предположим далее, что Q имеет непрерывную положи тельную в точке г0 плотность g-(z) (по лебеговой мере), облада ющую производными до второго порядка. Аналогично предыду щему получим
го"Ьа г0+я
Q(S)= J* |
g(z) dz=2g(z0)a + g'(zQ) j ( z - z 0)dz-|-O(a3). |
Zq d |
Zq~—(Z |
Применяяя это приближение повторно, будем иметь
2 a = Q(S) J — +0(a3)= Q(S) _ i_ + 0 ( Q 3 (S)). g(zо) ё(*о)
Производяпростые |
преобразования в (3.2.2) |
и подстав |
|
ляя выражение для 2 а, |
получим: |
|
|
|
а |
|
|
P(S)=/(z0)Q(S)+/'(z0)g(zo) J* zdz4-f'(z0)g'(z0) |
z2dz+ |
||
|
•a |
|
I |
|
|
—а |
а
+
+
или
где
+ Y Г (zo) g (z0) Гг2 dz + 0 (a 4) = |
f (z0) Q(S) + |
|
||
f'(z0)g' (z0) + |
Y f"(z0)g(z°) |
l-a*+0(a*)=f(z0)Q(S) + |
||
f' (z0)g' (z0) + l - f " ( z 0)g(z0)' |
1 |
Q3(S)+0(Q *(S )), |
||
|
. 12g^(z0) |
|
|
|
P(S)=f(z0)Q(S)i-c(z0) Q*(S)fO(Q*(S)), |
(3.2.3) |
|||
c (zo) = |
1 |
|
|
|
f'(z0)g' (zo ) + y f" (zo) g (zo) |
|
|||
i |
w |
|
|
|
Если теперь формально в (3.2.1) подставить главный член
разложения Р (S) |
из (3.2.3), |
получим взвешенное биномиальное |
|
распределение со |
случайным |
параметром f(z0)Q(S), |
где Q (S), |
как отмечалось выше, имеет |
бета-распределение с параметрами |
||
/, т—1+ l . Фактически это есть распределение |
количества |
116
/(S J , Х -ов, |
попавших в случайную |
область |
Sl5 |
имеющую ве |
|||
роятность |
f(z0)Q(S): |
|
|
|
|
||
|
|
|
P {/(S 1) = i} = EQb(j, |
/, f(z0)Q(S)). |
|
|
|
Здесь |
означает уже усреднение по распределению |
|
|||||
|
|
|
|
Q |
|
|
|
Р { Q ( S ) < Q } = B '1(/, m - l + 1) j |
|
|
|
||||
|
|
|
|
О |
|
|
|
Производя |
интегрирование, окончательно п о л уч и м |
|
|
||||
|
|
1 |
P{/(S1)=i} = C‘ B-1(/, |
Ш - 1+ 1)х |
|
|
|
|
|
|
|
|
|
|
|
|
х |
j |
[tf (г0)У [ l - t f (z0)]n~l t™ (1 |
= |
|
||
|
|
О |
|
|
|
|
|
- [ /( г ,) ] ' |
pm+1 pi |
m + i+ l, |
/ W |
) , |
(3.2.4) |
||
|
^n+m |
||||||
|
|
|
|
|
|
|
|
где В (a, p)—бета-функция, а |
|
|
|
|
|||
|
|
|
I |
|
|
|
|
F(oc,p, |
r , |
= |
|
|
|
|
|
|
|
|
0 |
|
|
|
|
— гипергеометрическая функция. |
|
|
|
|
|||
Далее, |
f(z0)Q(S) имеет среднее f(z0) —L-. и дисперсию |
||||||
|
|
|
|
т+ 1 |
|
|
\ Цт,—1-f 1)
° > + 1 ) 2(т ф 2)‘
Подставляя опять-таки формально в (3.2.4) вместо f(z0)Q(S)
выражение / (z0) ^, получим биномиальное распределение
P {/(S 2) = i} = & |
( i, |
п, f(z0) —L—) |
(3.2.5) |
|
|
|
V |
т-1-1/ |
|
для^ количества |
/(S 2), Х -ов, |
попавших в область |
S2 (неслучай |
|
ный интервал с |
центром в z0) с |
вероятностью |
|
P(S2) —f(z0) — .
/пф 1
117
Покажем, что нормированные статистики, соответствующие (3.2.1), (3.2.4), (3.2.5), распределены асимптотически нормально в смысле сильной сходимости соответствующих функций расп ределения и найдем оценку нормальных приближений.
Как и ранее, будем предполагать, что 0<j cx<j — < с 2; од-
|
|
т |
нако для упрощения записи положим просто п= т. |
||
Распределение сумм |
|
|
т |
т |
т |
/ = 1 |
/=1 |
/= i |
где llmj, |
l*mj, I3nj, / = l,m ,—последовательности независимых оди |
|
наково распределенных величин, |
причем Zj^, Z^, Z^t представ |
|
ляют собой индикаторы событий |
S, Slt S2 соответственно, зада |
ется посредством (3.2.1), (3.2.4),(3.2.5). Соответствующие функ
ции распределения обозначим F}„(x), |
Ffn(x), F3m(x) |
и пусть |
Щ) — |
|||
распределение |
случайной величины |
£, |
а яд=]Х Dig. |
|
||
В силу независимости испытаний |
Х 1,..., Х п от |
Ym |
||||
(т. е. в силу |
того, что 11т и Z зависят от К ^ ..., |
Ym лишь |
пос |
|||
редством S), условные распределения примут вид |
|
|
||||
|
F'mixW^ Y2...... |
y |
j = F M *lS ), |
|
|
|
|
F2m(x\Yv Y2,..., |
Ym)= F*m(x\S). |
|
|
||
Т е о р е м а 3.5. При — - > 0 |
и Z ->oo распределения |
|
||||
|
m |
|
|
|
|
|
сильно сходятся к N (0, 1), причем для метрики сильной схо димости имеют место оценки
sup \Flm(xa Z^+E/jj,)—Ф (х)|^ сг( т , |
Z)-~ |
|
cF) Z-1/, |
i = 1 3. |
(3.2.6) |
Д о к а з а т е л ь с т в о . |
Докажем сначала утверждение, со |
ответствующее Z = 3.
118
Применяя теорему нормального приближения для сумм не зависимых слагаемых [15], будем иметь
|
|
|
|
|
|
|
|
т |
|
|
|
|
sup |
|/* |
( х < + Е /» ,) - Ф ( х ) | < |
_ А _ V |
|
Е ] / ^ - Е Рт,\*. |
(3.2.7) |
||||||
x~Rl |
|
|
|
|
|
z%i |
|
|
|
|
|
|
|
|
|
|
|
|
|
/= 1 |
|
|
|
|
|
Для Е |l^j—El3mj |3 получим |
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
/ |
|
3 |
|
— |
|
|
|
E\l3ml-EPmir = [ l ^ f ( z 0) |
|
/ Ы |
|
|||||||
|
|
|
|
|
|
|
m-f- 1 |
|
|
m-f- 1 |
|
|
+ /С о) |
1 —/( г 0) |
l |
|
|
|
|
/ |
/ /2 |
|
|||
m -f |
1 |
/(г« ) - 4 т + 0 Л |
|
|||||||||
|
|
m + 1; |
|
|
|
|
m-f- 1 |
Vm2 |
||||
Непосредственно имеем также |
|
|
|
|
|
|||||||
|
|
Eft, |
,m |
lf(z0)= f(z0)l + O (-L |
|
|
||||||
|
|
, , |
|
|
||||||||
|
|
m-f- 1 |
|
|
|
|
|
\m |
|
|
||
|
|
o2l3m= tnf(z0) |
l |
|
|
|
/ |
|
|
|
||
|
|
m-f- 1 |
l - / ( z e) m-f- 1 / |
|
|
|||||||
|
|
|
|
|
|
|
||||||
|
|
— f ( zo) ^ 1 + 0 |
( “ |
] ] |
• |
|
|
(3-2.8) |
||||
Остается подставить эти приближения в (3.2.7). |
|
|||||||||||
Для |
доказательства |
|
(3.2.6) |
при |
i — 2 |
применим оценку |
||||||
нормального приближения для |
подынтегрального выражения в |
|||||||||||
правой |
части неравенства |
|
|
|
|
|
|
|
|
|
||
|
|
sup |
[ Р ^ ( х а /^ + Е 4 ) - Ф ( х ) К |
|
|
|
||||||
|
|
x^R1 |
|
|
|
|
|
|
|
|
|
|
|
|
< Е & |
sup |
]F|,(xa/^4-E/|t1 5 )-0 (x )| . |
|
|||||||
|
|
x^R1 |
|
|
|
|
|
|
|
|
|
|
(Мы иногда опускаем индексы при операторе |
усреднения, |
нап |
||||||||||
ример, |
Е l*m= Е%Е& {12т15) ). |
|
|
|
|
|
|
|
||||
В силу условной независимости l2mj при условии S |
|
|||||||||||
|
|
sup |
\Ргт(ха1гт+ El*,)—Ф (х)|< |
|
|
|||||||
|
|
jc^R1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
m |
|
|
|
|
|
|
|
|
|
|
< E S i 3 ( F T s ) 2 j E||!" ' _E<" ,|,|S|' |
|
|
<3’2'9) |
119