Учебник Теория вероятности - Самойленко, Кузнецов
.pdfТеория вероятностей
7.1.2.4. Сжатие распределения с ростом числа слагаемых
Закон больших чисел в форме Чебышева означает, что распределение случайной величины
ξn = 1 ∑n ξi n i=1
сжимается с ростом n. Если математические ожидания одинаковы, т.е. Mξi=a, то сжатие происходит в окрестности точки a.
Убедиться в сжатии можно, наблюдая гистограммы при различных значениях n (например, для n =10, 40, 160, 640). Сгенерируем k раз
(например, хотя бы k =20) случайную величину ξn ≡ ξ : x1,.., xk и
построим для каждой такой выборки средних гистограмму. Сравнивая гистограммы для различных n, можно легко заметить сжатие (табл. 7.1 и
рис. 7.2).
Таблица 7.1. Разброс средних вокруг точки а = 0,5
n |
x min |
x max |
W |
10 |
0.371 |
0.687 |
0.32 |
40 |
0.418 |
0.606 |
0.19 |
160 |
0.472 |
0.550 |
0.08 |
320 |
0.523 |
0.469 |
0.05 |
|
|
|
|
|
|
|
|
|
N10 |
|
|
|
|
|
N40 |
|
|
|
|
|
N160 |
0,3 |
0,4 |
0,5 |
0,6 |
0,7 |
N640 |
Рис. 7.2. Гистограммы разброса средних вокруг точки а = 0,5 при разных n |
150
Предельные теоремы
7.2. Усиленный закон больших чисел
7.2.1. Теорема Бореля
|
|
|
|
|
|
|
|
Теорема 7.3 (теорема Бореля). |
|
|
|
||||
|
|
|
|
|
|
|
|
Относительная частота fn ≡ |
µn |
появления |
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
случайного события А с ростом числа n |
|
|
|
||||
|
|
|
|
|
|
|
|
независимых испытаний стремится к истинной |
|
|
|
||||
|
|
|
|
|
|
|
|
вероятности p события А |
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
µn |
→ p |
|
|
|
|
(7.7) |
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
с вероятностью 1. |
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Другими словами, при любом эксперименте с бесконечным числом испытаний имеет место сходимость последовательности fn к p.
В справедливости сказанного можно убедиться с помощью эксперимента по бросанию монеты или игральной кости. В последнем случае для упрощения и убыстрения эксперимента следует рассматривать событие А1 (появление нечетного числа очков) или А2 (появление четного числа очков).
На рис. 7.3 приведены три графика относительных частот fn выпадения герба при бросании монеты, полученных в результате натурных испытаний при n=50; на рис. 7.4 – при n=500.
1,00 |
|
|
|
|
|
0,75 |
|
|
|
|
|
0,50 |
|
|
|
|
|
0,25 |
|
|
|
|
|
0,000 |
10 |
20 |
30 |
40 |
50 |
VAR4
VAR5
VAR6
Рис. 7.3. Относительная частота выпадения герба при изменении n от 1 до 50
151
Теория вероятностей |
|
|
|
|
|
|
1,00 |
|
|
|
|
|
|
0,75 |
|
|
|
|
|
|
0,50 |
|
|
|
|
|
|
0,25 |
|
|
|
|
|
|
|
|
|
|
|
|
VAR4 |
0,000 |
|
|
|
|
|
VAR5 |
100 |
200 |
300 |
400 |
500 |
VAR6 |
|
Рис. 7.4. Относительная частота выпадения герба при изменении n от 1 до 500 |
Графики убедительно показывают стремление относительных частот к истинной вероятности 0,5. Причем, чем больше число испытаний, тем
очевиднее приближение fn к p. |
|
|
|
|
||||||
Будем говорить, |
|
что последовательность случайных |
величин |
|||||||
ξ1,ξ 2,..,ξ n подчиняется усиленному закону больших чисел, если |
|
|||||||||
|
1 n |
|
− |
1 n |
|
] → 0 |
при n→ ∞ |
|
||
|
|
∑ξ |
i |
|
∑M[ξ |
i |
(7.8) |
|||
|
|
|
||||||||
|
n i=1 |
|
n i=1 |
|
|
|
свероятностью 1.
Вчастном случае, при равных математических ожиданиях, M[ξi]=a, это означает
1 |
n |
|
|
∑ξi → a при n→ ∞ |
(7.9) |
||
|
|||
n i =1 |
|
с вероятностью 1.
На рис. 7.5 приведены графики результатов трех экспериментов по отслеживанию последовательностей средних арифметических случайных величин ξi, равномерно распределенных в интервале (0;1), когда i
изменяется от 1 до 50; на рис. 7.6 – от 1 до 500. Графики убедительно демонстрируют стремление средних арифметических к математическому ожиданию 0.5 с ростом n.
152
|
|
|
|
|
Предельные теоремы |
|
0,9 |
|
|
|
|
|
|
0,7 |
|
|
|
|
|
|
0,5 |
|
|
|
|
|
|
0,3 |
|
|
|
|
|
|
0,1 0 |
|
|
|
|
|
VAR4 |
10 |
20 |
30 |
40 |
50 |
VAR5 |
|
VAR6 |
||||||
Рис. 7.5. Графики средних арифметических для равномерно распределенных случайных |
||||||
величин на интервале (0; 1) в зависимости от их количества i =1,50 |
||||||
0,9 |
|
|
|
|
|
|
0,7 |
|
|
|
|
|
|
0,5 |
|
|
|
|
|
|
0,3 |
|
|
|
|
|
|
0,10 |
|
|
|
|
|
VAR4 |
100 |
200 |
300 |
400 |
500 |
VAR5 |
|
VAR6 |
||||||
Рис. 7.6. Графики средних арифметических для равномерно распределенных случайных |
||||||
величин на интервале (0; 1) в зависимости от их количества ( i =1,500 ) |
||||||
Достаточное условие выполнения (7.8) дает теорема Колмогорова. |
7.2.2. Теорема Колмогорова
Теорема 7.4 (теорема Колмогорова). Если последовательность взаимно независимых случайных величин ξ1,..,ξn ,.. удовлетворяет
условию
12 ∞ D[ n]< ∞ ,
∑ ξ
n n=0
то она подчиняется усиленному закону больших чисел.
153
Теория вероятностей
Для независимых и одинаково распределенных случайных величин теорема Колмогорова трансформируется в более простую теорему.
Теорема 7.5 (теорема Колмогорова в упрощенной трактовке). Необходимым и достаточным условием для применимости усиленного закона больших чисел к последовательности независимых случайных величин является существование математического ожидания.
|
7.2.3. Основная теорема статистики |
|
Пусть |
x1, x2,...,xn |
– выборка из n независимых наблюдений над |
случайной |
величиной |
X с теоретической (истинной) функцией |
распределения F(x). Расположим наблюдения в порядке возрастания; получим вариационный ряд x(1) ≤ x(2) ≤...≤ x(n).
Определим функцию эмпирического распределения
Fn (x) ≡ Fn (x : x1 , x2 ,..., xn ) = µnn(x) ,
где µn ( x ) – число тех наблюдений, для которых x>xi. Ясно, что Fn ( x ) –
ступенчатая функция; это функция распределения, которое получается, если значениям x1,...,xn присвоить вероятности, равные 1/n. К тому же,
Fn ( x ) – функция случайная, так как зависит от наблюдений x1,...,xn.
Теорема 7.6 (теорема Гливенко). С ростом n
максимальное абсолютное отклонение эмпирической функции распределения от теоретической стремится к нулю с вероятностью 1:
|
* |
(x) − F(x) | → |
0 |
|
=1. |
P sup | Fn |
|
||||
|
x |
n→∞ |
|
|
|
154
Предельные теоремы
Проиллюстрируем эту теорему на примерах наблюдений случайной величины Х, распределенной по равномерному закону на интервале (0; 1),
при числе испытаний n=10 (рис. 7.7), n=40 (рис. 7.8) и n=160 (рис. 7.9) .
1,0
0,8
0,6
0,4
0,2
0,0 |
|
|
|
|
|
|
|
|
FE |
|
|
|
|
|
|
|
|
||
|
0,2 |
0,4 |
0,6 |
0,8 |
1,0 |
|
|
||
0,0 |
|
FT |
Рис. 7.7. Функции эмпирического FE и теоретического FT распределений равномерно распределенной случайной величины Х при числе наблюдений n=10
1,0
0,8
0,6
0,4
0,2
0,0 |
|
|
|
|
|
|
|
|
|
FE |
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
||
|
|
0,2 |
0,4 |
0,6 |
0,8 |
1,0 |
|
|
||
0,0 |
|
FT |
Рис. 7.8. Функции эмпирического FE и теоретического FT распределений равномерно распределенной случайной величины Х при числе наблюдений n = 40
155
Теория вероятностей
1,0
0,8 |
0,6 0,4 0,2
0,0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
FE |
|
|
|
|
0,2 |
0,4 |
0,6 |
0,8 |
1,0 |
|
||||||||
|
|
|
|
|
|
||||||||||||
0,0 |
|
FT |
Рис. 7.9. Функции эмпирического FE и теоретического FT распределений равномерно распределенной случайной величины Х при числе наблюдений n = 160
7.3.Центральная предельная теорема
7.3.1. Содержание центральной предельной теоремы
Закон больших чисел утверждает, что при n → ∞ среднее арифметическое случайных величин ξi с равными математическими ожиданиями стремится к их математическому ожиданию
1 ∑n ξi → a , n i=1
где а = M[ξi] .
Центральная предельная теорема утверждает нечто большее, а, именно, что при n→∞ распределение среднего арифметического случайных величин (при многократном суммировании среднее арифметическое есть случайная величина) приближается к нормальному распределению с параметрами а (математическое ожидание) и σ2/n (дисперсия) :
1 |
n |
σ 2 |
|
(7.10) |
|
∑ξi ~ N (a, |
n |
) , |
|
|
||||
n i=1 |
|
|
где σ2=D[ξi].
156
Предельные теоремы
При нормировании суммы предельная теорема записывается следующим образом:
n |
|
|
|
∑ξi − na |
~ N(0,1) . |
||
i=1 |
n |
||
σ |
|||
|
Приведем формулировку центральной предельной теоремы в форме Линдеберга.
7.3.2. Теорема Линдеберга
Теорема 7.7 (теорема Линдеберга).
Если последовательность взаимно независимых случайных величин ξ1, ξ2,..., ξn,... при любом постоянном τ>0 удовлетворяет условию Линдеберга
|
|
1 |
|
|
n |
|
|
|
|
|
|
|
2 |
|
|
|
|
|
(7.11) |
|
lim |
|
|
|
∑ |
|
|
|
|
∫(x − ak ) |
|
dFk (x) |
= 0 , |
|
|||||||
B2 |
|
|
|
|
|
|
|
|||||||||||||
n→∞ |
|
k =1 |
|
x−a |
k |
|
|
>τ B |
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
n |
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
||
где ak = M [ξk ], |
|
Bn2 |
|
|
|
n |
|
|
|
|
|
|
|
|||||||
|
|
|
= D ∑ξk |
, |
то при n → ∞ |
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
k =1 |
|
|
|
|
|
|
|
|
n |
(ξ |
|
|
− a |
|
) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
∑ |
k |
k |
|
|
|
|
|
1 |
x |
|
− |
z2 |
|
||||||
|
|
|
|
|
|
|
|
|
|
→ |
|
2 dz , |
|
|||||||
P k =1 |
|
|
|
n |
|
|
|
< x |
2π |
∫e |
|
(7.12) |
||||||||
|
D |
|
|
|
|
|
|
|
|
−∞ |
|
|
||||||||
∑ξ |
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
k |
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
k =1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
т.е. нормированная сумма случайных величин ξ1, ξ2,..., ξn распределена по нормальному закону с параметрами 0 (математическое ожидание) и 1 (дисперсия) .
7.3.3. Теорема Ляпунова
Условие Линдеберга (7.11) довольно универсально, но неудобно при практической проверке. Вместо него целесообразно использовать условие Ляпунова: при некотором δ > 0
157
Предельные теоремы
конечную отличную от нуля дисперсию, то выполняются условия (7.12) и (7.13). При этом распределение суммы sn = ξ1 + ξ2 + … + ξn с ростом n приближается к нормальному с параметрами An = M[sn ], Bn2 = D[sn ].
Убедимся статистически в том, что сумма нескольких случайных величин распределена приближенно по нормальному закону. Сделаем это на примере суммы
m
S = ∑xk (7.15)
k=1
шести (m = 6) независимых случайных величин, имеющих beta- распределение с параметрами a=b=0.5, т.е. с плотностью распределения
|
p(x | a,b) = xa−1 (1 − x)b−1 |
= |
1 |
1 |
, |
(7.16) |
||
|
|
|
B(a,b) |
|
π x(1 − x) |
|
|
|
где |
1 |
|
– beta-функция. |
|
|
|
||
B(a,b) = ∫ za−1(1 |
− z)b−1dz |
|
|
|
||||
|
0 |
|
|
|
|
|
|
|
Плотность распределения слагаемых при выбранных значениях параметров имеет U-образный вид, весьма далекий от нормального. Убедимся в этом, построив гистограмму плотности (рис. 7.10).
Чтобы статистически оценить закон распределения для суммы S, следует многократно (N раз, например, N=500) промоделировать суммирование: получим S1, S2,...,SN – выборку для суммы; для этой выборки построим гистограмму и сравним ее визуально с нормальной плотностью.
80 |
|
|
|
|
|
60 |
|
|
|
|
|
40 |
|
|
|
|
|
20 |
|
|
|
|
|
0 |
0,2 |
0,4 |
0,6 |
0,8 |
1,0 |
0,0 |
|||||
|
Рис. 7.10. Гистограмма одного слагаемого |
|
159