Теория вероятностей и математическая статистика
.pdf
48 |
|
Глава 3. Случайные величины |
|
|
|
В таких терминах заключение теоремы 3.16 можно переформулировать так: |
|
1 |
|
n |
сходится по вероятности к математическому ожиданию a. |
n |
Pk=1 Xk |
||
8.6. Статистическое определение вероятности
На теореме Чебышева основан широко применяемый в математической статистике выборочный метод, о котором пойдет речь ниже. Из закона больших чисел вытекает так называемое ”статистическое определение вероятности”, которое состоит в следующем.
Пусть проводится последовательность независимых одинаковых случайных экспериментов, в каждом из которых происходит или нет некоторое случайное событие A. Если обозначить через mn число появлений события A в n экспериментах, то по закону больших чисел
lim mn = P(A) по вероятности
n!1 n
(это и есть ”статистическое определение вероятности”).
Для доказательства достаточно рассмотреть последовательность случайных величин
Xn = |
1; |
если A произошло в n-м эксперименте, |
0; |
если A не произошло в n-м эксперименте: |
Легко видеть, что эти случайные величины независимы и
M(Xn) = P(A) ; D(Xn) = P(A) P(A)2 = P(A) P A :
Кроме того,
n
mnn = n1 XXk;
k=1
инаше утверждение вытекает из закона больших чисел.
§9. Центральная предельная теорема
9.1.Почему важно изучать нормальные случайные величины
Нормально распределенные случайные величины очень широко распространены на практике. Как дать этому объяснение? Оказывается, справедлив следующий основополагающий принцип: если случайная величина является суммой большого числа независимых случайных величин, влияние каждой из которых на всю сумму мало, то ее распределение близко к нормальному.
§ 9. Центральная предельная теорема |
49 |
9.2. Подготовка к центральной предельной теореме
Пусть Xk последовательность попарно независимых случайных величин с конечными математическими ожиданиями и дисперсиями. Определим последовательность случайных величин
n
X
Sn = Xk; n 2 N;
k=1
математические ожидания и дисперсии которых в силу теоремы 3.12 соответственно равны
n |
|
n |
X |
|
Xk |
M(Sn) = An = M(Xk) ; D(Sn) = 2 |
= |
D(Xk) : |
n |
|
|
k=1 |
|
=1 |
Образуем теперь новую последовательность случайных величин, нормируя последовательность Sn так, чтобы математические ожидания и дисперсии были одинаковы. Именно для случайных величин
Sn An
n
(3.9)
математические ожидания и дисперсии равны соответственно 0 и 1. Подчеркнем, однако, что мы не делаем никаких предположение относительно вида распределения исходных случайных величин и величин (3.9).
Центральная предельная теорема утверждает, что при некотором дополнительном условии функция распределения случайной величины (3.9) близка в определенном смысле к функции распределения стандартного нормального распределения N(0; 1).
9.3. Формулировка основной теоремы
Теорема 3.17 (центральная предельная теорема) Пусть fXkg последовательность независимых случайных величин с конечными математическими ожиданиями
M(Xk) = ak (k 2 N)
и дисперсиями
D(Xk) = k2 > 0 (k 2 N):
Предположим еще, что для некоторого > 0 выполнено условие
1 |
n |
|
|
|
XM jXk |
M(Xk)j2+ ! 0 (n ! 1): |
(3.10) |
||
2+ |
nk=1
Тогда для любого x 2 R |
|
|
|
|
|
|
|
|
|
|
||
|
|
Sn |
An |
|
|
1 |
Z |
x |
|
t2 |
|
|
n!1 |
|
|
|
p2 |
|
|
||||||
|
n |
|
|
2 |
||||||||
lim P |
|
|
|
< x |
= |
|
|
|
|
exp |
|
dt: |
50 |
Глава 3. Случайные величины |
В левой части последнего равенства находится функция распределения стандартного нормального распределения N(0; 1). Поэтому это равенство означает, что случайная величина Sn асимптотически имеет нормальное распределение с математическим ожиданием An и дисперсией Dn.
Важно уяснить себе, в чем неформальный смысл условия (3.10) он состоит в том, что большинство Xk мало рассеяны.
9.4. Случай одинаково распределенных величин
Приведем следствие из центральной предельной теоремы для одинаково распределенных случайных величин этот случай имеет большое значение для математической статистики.
Теорема 3.18 Пусть fXkg последовательность независимых одинаково распределенных случайных величин с конечными математическими ожиданиями
и дисперсиями |
|
|
|
|
|
M(Xk) = a; |
k 2 N |
|
|
|
|
|
|||
|
|
|
D(Xk) = 2; k 2 N: |
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|||||||
Тогда для любого x 2 R |
|
|
|
|
|
|
|
|
|
|
|||||
|
|
P |
kn=1 Xk |
na |
1 |
|
x |
|
t2 |
|
|||||
n!1 |
|
pn |
|
= |
p2 |
Z |
exp |
|
|
|
|
||||
|
2 |
||||||||||||||
lim P |
|
|
|
|
|
|
< x |
|
|
|
|
|
|
|
dt: |
Утверждение этой теоремы непосредственно следует из центральной предельной теоремы. Надо только заметить, что в рассматриваемом случае (все случайные величины Xk одинаково распределены и независимы) математическое ожидание и дисперсия случайной величины
n
X
Sn = Xk
k=1
соответственно равны
M(Sn) = M |
|
n |
Xk! = |
n |
a = na |
|
|
|
=1 |
|
k=1 |
|
|
и |
Xk |
|
X |
|
||
n |
Xk! = |
n |
|
|
||
D(Sn) = D |
2 = n 2: |
|||||
|
=1 |
|
k=1 |
|
||
Xk |
|
X |
|
|||
Глава 4
Основные понятия математической статистики
§ 1. Выборочный метод
Пусть проведены n независимых экспериментов, в каждом из которых наблюдается значение этой некоторой случайной величины X. Обозначим через Xk значение, полученное в k-м эксперименте. Основным предположением математической статистики, позволяющим использовать в качестве метода исследования теорию вероятностей, является следующее.
Естественно априори считать, что Xk случайная величина, имеющая то же распределение, что и X, и что эти случайные величины независимы.
1.1. Выборка
Итак, пусть проведены n независимых экспериментов, в каждом из которых наблюдается значение этой некоторой случайной величины X. Обозначим через Xk значение, полученное в k-м эксперименте.
Определение 4.1 Набор fX1; : : : ; Xng будем называть случайной выборкой, а n называется объемом выборки.
Среди чисел X1; : : : ; Xn могут быть повторяющиеся. Расположим различные значения X1; : : : ; Xn в возрастающем порядке
x1 < x2 < : : : < xm;
и пусть значение xk наблюдалось nk раз, тогда объем выборки равен
m
X
n = nk:
k=1
Число nk называется частотой появления значения xk в выборке.
1.2. Вариационный ряд в дискретном случае
Определим вариационный ряд заданной случайной выборки таблицей
X |
x1 |
x2 |
: : : |
xm |
n |
n1 |
n2 |
: : : |
nm |
Ясно, что вариационный ряд является статистическим аналогом закона распределения случайной величины. Его можно изобразить графически с помощью полигона распределения графика непрерывной функции, линейной
51
52 |
Глава 4. Основные понятия математической статистики |
на каждом из интервалов (xk1 ; xk) и принимающей значение nk в точке xk
(k = 1; : : : ; m).
Числа wk = nnk называются относительными частотами выборки. Таблица
X |
x1 |
x2 |
: : : |
xm |
w |
w1 |
w2 |
: : : |
wm |
называется статистическим распределением выборки.
Приведенный способ представления статистических данных применяют в случае дискретных случайных величин.
1.3. Вариационный ряд в непрерывном случае
Для непрерывных случайных величин (или для дискретных случайных величин с большим числом значений) удобнее разбить отрезок [a; b] возможных значений случайной величины на частичные полуинтервалы k = [ak1 ; ak), (k = 1; : : : ; m) ( m замкнут также и справа) с помощью некоторой системы точек a = a0 < a1 < : : : < am = b. Часто разбиение [a; b] производят на равные части, тогда
k = [a + (k 1)h; a + kh); k = 1; : : : ; m
(здесь h = bam ).
Следует учитывать то, что если длина интервала группировки мала, то влияние случайных колебаний начинает преобладать, так как каждый интервал содержит при этом лишь небольшое число наблюдений; если же длина интервала велика, то скрадываются основные характерные черты распределения.
В качестве частот nk теперь надо брать количество наблюдаемых ее значений, попавших на каждый из частичных интервалов k. Вариационный ряд имеет в таком случае вид
|
X |
1 |
2 |
: : : |
m |
|
n |
n1 |
n2 |
: : : |
nm |
а статистическое распределение |
|
|
|
||
|
|
|
|
|
|
|
X |
1 |
2 |
: : : |
m |
|
w |
w1 |
w2 |
: : : |
wm |
В таком случае для графического представления вариационного ряда используют гистограмму распределения графика функции, постоянной на каждом полуинтервале k, k = 1; : : : ; m и принимающей значение nk на нем.
§ 2. Эмпирические характеристики случайной величины |
53 |
§ 2. Эмпирические характеристики случайной величины
Основные характеристики вариационного ряда (функция распределения, математическое ожидание, дисперсия) определяются подобно тому, как это делалось для случайных величин в теории вероятностей, но с заменой термина ”вероятность” на ”относительная частота”.
2.1. Выборочные математическое ожидание и дисперсия
В качестве оценки математического ожидания используется величина
|
|
1 |
|
n |
1 |
m |
||
|
X |
Xk |
||||||
|
|
|
|
|
|
|
||
Xn = |
n |
|
k=1 |
Xk = |
n |
nkxk; |
||
|
|
|
|
|
|
|
=1 |
|
которая называется выборочным средним, а для дисперсии оценка
|
|
1 |
|
n |
|
1 |
|
m |
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
X |
|
Xk |
|
|
||||||
|
|
|
|
|
|
|
|
|
|
||||
Sn2 = |
|
|
(Xk Xn)2 |
= |
n 1 |
nk(xk |
Xn)2; |
||||||
|
n |
|
1 |
|
|
|
=1 |
|
|
||||
|
|
|
|
k=1 |
|
|
|
|
|
|
|||
которая называется выборочной дисперсией.1
Объяснение тому, что в определении выборочной дисперсии вместо множителя n1 взят n11 , будет дано ниже.
2.2. Эмпирическая функция распределения
Определение 4.2 Функция |
|
|
|
|
|
|||
1 |
|
Xk |
1 |
|
k:Xk |
|||
|
|
|
|
|
|
|||
Fn(x) = n |
1 = n |
|||||||
k:X <x |
nk |
|||||||
|
|
|
|
|
|
x <x |
||
называется эмпирической функцией распределения случайной выборки fX1; : : : ; Xng.
Ее свойства аналогичны свойствам FX : она является возрастающей (в нестрогом смысле),
0 6 Fn(x) 6 1; x 2 R;
lim Fn(x) = 0:
x!
Далее, пусть
A(t) =
lim Fn(x) = 1:
x!+1
1; t 2 A
0; t 2= A
1Характеристики, используемые для описания вариационного ряда, обычно называются выборочными. Часто используется также синоним эмпирический.
54 |
Глава 4. Основные понятия математической статистики |
|||
характеристическая функция множества A. Тогда |
||||
|
1 |
n |
|
|
|
|
|
Xk |
|
|
Fn(x) = |
n |
(;x) |
(Xk) |
|
|
|
=1 |
|
и Fn(x) является случайной величиной. Эмпирическая функция распределения служит для оценки функции распределения FX .
2.3. Эмпирический коэффициент корреляции
Случайной выборкой объема n, соответствующей паре случайных величин (X; Y ), называется набор из n независимых одинаково распределенных пар случайных величин, (Xk; Yk) (k = 1; : : : ; n), каждая из которых имеет такое же совместное распределение, как и пара (X; Y ).
Оценкой для ковариации cov(X; Y ), построенной по этой выборке служит
выборочная ковариация
|
|
n |
|
|
|
|
1 |
Xk |
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
Cn = |
n 1 |
(Xk |
Xn)(Yk Y n): |
|||
|
|
=1 |
|
|
|
|
В качестве оценки для коэффициента корреляции используется выборочный коэффициент корреляции
|
|
|
|
|
|
|
nP |
kn=1(Xk |
|
|
|
|
|
|
|
|
|
|
|
|
Cn |
|
|
|
|
|
Xn)(Yk Y n) |
|
|
|
|||||
|
|
Sn2 |
(X)Sn2 |
(Y ) |
|
|
(Xk |
Xn)2 n (Yk |
Y n)2 |
||||||||
Rn = |
|
|
|
|
= |
|
|
|
|
|
|
|
|
|
|
|
: |
p |
|
|
qPk=1 |
|
|
|
|
Pk=1 |
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|||||||
Выражения для них легко преобразовать соответственно к виду
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
Xk |
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|||||
Cn = |
XkYk |
|
|
|
XnY n |
|
|
|||||||||||||||||
n 1 |
=1 |
|
n 1 |
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
1 |
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
X ) |
|
|
|
( |
|
|
|
|
|
|
Y ) |
|
|||||||
|
|
|
|
|
(P |
|
|
|
|
|
|
|
|
|
|
|
||||||||
Rn = |
|
|
|
n |
|
k=1 XkYk |
|
XnY n |
|
|
|
|
|
|
||||||||||
q |
|
k=1 |
|
k |
|
|
n |
|
k=1 k |
|
|
|
|
n |
|
|||||||||
|
|
|
n |
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
P |
|
|
|
|
|
|
|
P |
|
|
|
|
|
|
|
|
|
|
2 |
|||
|
|
|
|
|
|
X |
|
|
|
|
2 |
|
|
|
Y |
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
2.4. Эмпирическая плотность распределения
Зафиксируем число h > 0 и положим2
hxi xh = h h :
Эмпирической (выборочной) плотностью распределения, построенной по случайной выборке fX1; : : : ; Xng называется случайная функция
|
|
1 |
|
n |
|
|
|
|
|
|
|
|
Xk |
|
|
f |
n;h |
(x) = |
|
|
|
(xh;xh+h) |
(X ) |
|
|
|
nh |
=1 |
|
|
|
|
|
|
|
|
|
|
|
2[a] означает целую часть числа a.
§ 3. Предельные свойства эмпирической функции распределения |
55 |
||||
Другими словами, |
|
|
|
|
|
fn;h(x) = |
l |
; при |
x 2 [lh; (l + 1)h); l 2 Z; |
|
|
|
|
|
|||
nh |
|
||||
где l число тех значений Xk, которые попадают на интервал [lh; (l + 1)h). Эмпирическая плотность распределения fn;h используется в качестве стати-
стической оценки для плотности распределения f случайной величины X.
§ 3. Предельные свойства эмпирической функции распределения
3.1. Теорема Гливенко
Теорема 4.1 (Гливенко) Для любого " > 0
|
|
n!1 |
x2Rj |
|
n |
(x) F |
X |
(x) |
j |
< " |
|
|
|
|
|
|
|||||||
|
|
lim P sup |
F |
|
|
|
|
= 1: |
|
|
|
||||||||||||
Доказательство. Мы ограничимся случаем, когда F = FX непрерывна. |
|||||||||||||||||||||||
Тогда для любого " > 0 можно найти набор точек |
|
|
|
|
|
|
|||||||||||||||||
|
|
|
|
= x0 < x1 < : : : < xm = +1 |
|
|
|
|
|
||||||||||||||
таким образом, чтобы F (xk) |
F (xk1 |
) < " при k = 1; : : : ; m. |
|
|
|||||||||||||||||||
Покажем, что |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
sup |
F |
(x) |
F (x) |
j |
< max |
|
F |
(x |
|
) |
F (x ) |
j |
+ ": |
|
(4.1) |
||||||||
x2R |
j |
n |
|
|
|
|
|
|
06k6mj |
|
n |
|
k |
|
|
k |
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В самом деле, если x 2 [xk1 |
; xk), то в силу монотонности функции распре- |
||||||||||||||||||||||
деления |
F (x) > Fn(xk) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
Fn(x) |
|
|
F (xk+1) > Fn(xk) |
F (xk) |
": |
|
|||||||||||||||||
Fn(x) F (x) 6 Fn(xk+1) F (xk) < Fn(xk+1) F (xk+1) + "; |
|
||||||||||||||||||||||
поэтому |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Fn(x) |
F (x) > Fn(xk) |
|
|
F (xk+1) > Fn(xk) |
F (xk) |
": |
(4.2) |
||||||||||||||||
Рассмотрим теперь при фиксированном x 2 R случайные величины Yk = (Xk). Так как Xk независимы и одинаково распределены, то и Yk также
независимы и одинаково распределены, кроме того
M(Yk) = P(Xk < x) = FXk (x) = F (x);
и |
|
D(Yk) = M Yk2 |
M(Yk)2 = F (x) F 2(x) 6 1: |
56 |
Глава 4. Основные понятия математической статистики |
Отсюда и из закона больших чисел следует, что при любом " > 0
nlim P |
|
1 |
m |
n |
Yk |
||
!1 |
|
|
k=1 |
|
|
|
X |
!
F (x) > " = 0;
следовательно, используя (4.1) и (4.2), получаем
P supjFn(x)
F (x)j > 2" 6
|
|
x2R |
|
|
|
|
|
|
6 |
P |
06k6mj |
n k |
) |
k |
j > |
6 |
|
|
max |
F (x |
F (x ) |
|
" |
|
m
X
6P(jFn(xk) F (xk)j > ") ! 0:
k=1
Осталось перейти к вероятности противоположного события.
3.2. Теорема Колмогорова
Сформулируем еще один результат, который не только снова показывает, что эмпирическая функция распределения Fn является достаточно хорошей оценкой для функции распределения FX , но и дает количественную характеристику этого.
Теорема 4.2 Если функция распределения FX непрерывна, то для любого
x 2 R |
lim P p |
|
F |
x |
|
F |
x |
|
< " |
K " |
; |
|
||
n |
|
|
|
|||||||||||
где3 |
n!1 |
|
|
j |
n( |
) |
|
X ( |
)j |
= |
( ) |
|
|
|
|
K(") = |
8 Pk2Z(1) |
k exp(2k |
2"2); |
" > |
0 |
: |
|||||||
|
|
< 0; |
|
|
|
|
|
|
|
" 6 |
0 |
|
||
|
|
: |
|
|
|
|
|
|
|
|
|
|
|
|
3.3. Сходимость эмпирической плотности
Теорема 4.3 Пусть последовательность fnng такова, что hn ! +0 и nhn ! +1.
Тогда для любого " > 0
lim P(jfn;h(x) f(x)j < ") = 1
n!1
в каждой точке непрерывности x 2 R плотности f.
3K называется функцией распределения Колмогорова
Глава 5
Теория оценивания
§ 1. Точечное оценивание
Пусть некоторый параметр, характеризующий распределение случайной величины X (например, = M(X) математическое ожидание или = D(X)дисперсия). Пусть по случайной выборке fX1; : : : ; Xng построена некоторая случайная величина n, которая будет служить оценкой (приближенным значением) параметра .
1.1. Состоятельность и несмещенность оценок
В математической статистике на оценки накладываются обычно некоторые требования. Сейчас некоторые из таких требований будут перечислены.
Определение 5.1 Оценка n называется состоятельной оценкой параметра , если для любого " > 0
lim P(j nj > ") = 0
n!1
Определение 5.2 Оценка n называется несмещенной оценкой для , ес-
ли
M( n) = :
Определение 5.3 Если несмещенная оценка n имеет наименьшую дисперсию по сравнению с другими оценками, то она называется эффективной.
1.2.Состоятельность и несмещенность выборочных характеристик
Теорема 5.1 Выборочные среднее Xn и дисперсия Sn2 являются несмещенными состоятельными оценками математического ожидания M(X) и дисперсии D(X) соответственно.
Доказательство. Из равенств
|
|
|
1 |
n |
1 |
|
n |
|
|
|
|
|
Xk |
|
|
|
X |
M Xn = |
|
|
M(Xk) = |
|
|
M(X) = M(X) |
||
n |
=1 |
n |
||||||
|
|
|
|
|
|
|
k=1 |
|
следует несмещенность выборочного среднего. Здесь были использованы линейность математического ожидания и то, что M(Xk) = M(X) при всех k = 1; : : : ; n.
57
