
Лекции Мат.стат. (2007-2008) / stat1
.pdfЛекция 1.
Математическая (или теоретическая) статистика, так же как и теория вероятностей изучает случайные эксперименты. Математическая статистика, опираясь на методы и понятия теории вероятностей, решает задачи, в каком-то смысле, обратные задачам теории вероятностей. Теория вероятностей изучает свойства случайного эксперимента, которые позволяют по известным вероятностям одних событий вычислять вероятности других событий. В математической статистике, наблюдая за результатами случайного эксперимента, мы отвечаем на различные вопросы о том, как же этот случайный эксперимент устроен.
Рассмотрим следующий пример. Предположим бросаются три игральные кости. В результате эксперимента будет наблюдаться тройка чисел ! = (i1; i2; i3); ãäå ij - число очков,выпавших на j-ой кости (j = 1; 2; 3): Эта тройка чисел является элементарным исходом эксперимента. Пространство элементарных исходов = f!g состоит из 63 элементар-
ных исходов и если кости правильные, то все элементарные исходы -
равновозможны. Вероятность выпадения при этом трех шестерок равна соответственно (1=6)3 = 0:00463:
Предположим теперь, что наблюдая за бросанием трех игральных костей, мы видим что выпало три шестерки, то есть мы наблюдаем событие, которое происходит очень редко, если игральные кости правильные (примерно в 5 случаях из 1000). Опять бросаются эти же три кости и при этом опять выпадает три шестерки. Пять раз подряд бросаются три игральные кости и каждый раз при этом выпадают три шестерки.
Так как выпадение трех шестерок при одном бросание трех правиль- ных костей равна (1=6)3, то при 5 независимых бросаниях этих же ко-
стей, как известно из теории вероятностей, выпадение пять раз подряд трех шестерок равна (1=6)15: Это событие настолько редкое для правиль-
ных костей, что его появление вызывает подозрение, что кости какие-то неправильные. То есть по результату случайного эксперимента мы делаем вывод, что, скорее всего, элементарные исходы в этом эксперменте не равновозможны (по результатам эксперимента делается вывод о том, как этот эксперимент устроен).
Прежде, чем переходить к описанию основных понятий математиче- ской статистики, напомним некоторые сведения из теории вероятностей. Любой случайный эксперимент описывается с помощью вероятностного пространства ( ; A; P): Здесь пространство элементарных исходов
эксперимента, A - -алгебра случайных событий, P - вероятности этих событий. Функция от элементарных исходов X(!) называется случай-
1
ной величиной, а F (x) = P (X(!) < x) - функцией распределения этой
случайной величины. Если задана функция распределения случайной величины, то говорят, что задан закон распределения этой случайной величины. По функции распределения можно вычислить вероятности
P (a X < b) = F (b) F (a)
для любых a; b; a < b:
Случайные величины бывают дискретными и непрерывными. Дискретные случайные величины с положительной вероятностью принимают не более, чем счетное число значений. Функция распределения дискретной случайной величины - кусочно-постоянна. Скачки функции распределения дискретной случайной величины находятся в тех значениях, которые случайная величина принимает с положительной вероятностью.
Непрерывными случайными величинами мы называем такие случайные величины X(!); для которых существует плотность распределения
f(x): Плотность распределения f(x) это неотрицательная функция такая, что для любых a b
Z b
P (a < X(!) < b) = f(x)dx:
a
Для непрерывных случайных величин P (X = a) = 0 для любых a: Для
распределений, чаще всего встречающихся на практике, плотность является непрерывной (кроме конечного числа точек) функцией и f(x) =
F 0(x):
Числовые характеристики случайных величин.
I. Характеристики срединных значений случайной величи- ны (характеристики центра группирования)
1. Математическое ожидание случайной величины EX.
(
P
k xkpk; если X - дискретна
EX = 1 xf(x)dx; если X - непрерывна
R
1
Математическое ожидание по своему смыслу - среднее значение случайной величины.
2. Ìîäà m0:
Мода случайной величины - это наиболее вероятное значение слу- чайной величины (наиболее часто встречающееся).
2

P (X = m0) = max P (X = xk)
k
для дискретных случайных величин и
f(m0) = max f(x)
x
для непрерывных случайных величин. Мода не обязательно единственна.
3. Медиана me
Медиана - это такое значение случайной величины, для которого
P (X me) |
1 |
; P (X me) |
1 |
: |
2 |
2 |
Если случайная величина непрерывнна, то
1
P (X me) = P (X me) = 2:
Медианой удобно пользоваться, когда среди значений случайной вели- чины с малой вероятностью появляются значения сильно удаленные от основной массы возможных значений.
Характеристики разброса.
4. Дисперсия DX.
Дисперсия - мера разброса случайной величины, относительно ее математического ожидания.
DX = |
( 1 |
|
(x |
EX)2f(x)dx |
|
k |
(xk |
EX)2P (X = xk); |
|
|
P |
|
|
|
|
R1 |
|
|
5. Среднеквадратическое отклонение случайной величины
X p
X = DX
6. Коэффициент вариации
VX = EXX 100%
3

Числовые характеристики вида распределения.
Следующие две характеристики используются чаще всего, когда мы хотим сравнить распределение изучаемой совокупности с нормальным распределением
7. Асимметрия.
A =
E(X EX)3
(DX)3=2
Если случайная величина имеет распределение симметричное относительно математического ожидания, то коэффициент ассиметрии равен нулю
8. Эксцесс.
Эксцесс - характеристика островершинности в окрестности моды.
E = E(X EX)4 3
(DX)2
Для случайных величин, имеющих нормальное распределение, эксцесс равен нулю. Как правило, если в районе моды вершина острая, то E > 0;
а если вершина плоская, то E < 0:
9. Квантили распределения.
Пусть случайная величина X имеет непрерывную монотонную функцию распределения F (x): Число u называется квантилью уровня распределения F (x); если
P (X < u ) = :
То есть квантиль уровня - это корень уравнения F (u ) = :
Из определения квантили следует, что медиана распределения - это квантиль уровня 0.5 (me = u0:5).
Законы распределения вероятностей, наиболее распространенные
в практике статистических исследований.
Мы перечислим сейчас наиболее часто встречающиеся на практике законы распределения, значения соответствующих математических ожиданий, дисперсий. В некоторых случаях (когда формулы не очень сложные) приведем значения и других числовых характеристик.
1. Биномиальное распределение B(n; p):
Случайная величина X имеет биномиальное распределение, если
P (X = k) = Cnkpk(1 p)n k; k = 0; 1; :::; n
4

Биномиальное распределение возникает при повторении n раз одного и
того же эксперимента, в котором либо появляется, либо нет некоторое событие ; называемое успехом эксперимента. Число успехов в n незави-
симых испытаниях имеет биномиальное распределение. Для биномиального распределения
EX = np; DX = np(1 p):
Ìîäà mo целое число, находящееся в интервале единичной длины
p(n + 1) 1 mo p(n + 1):
Если p(n + 1) - не целое число, то единственное целое число в этом интервале равно целой части числа p(n + 1): Если же p(n + 1) - целое, то наиболее вероятными значениями случайной величины X являются два значения p(n + 1) и p(n + 1) 1:
Ассиметрия и эксцесс для биномиального распределения вычисляются по формулам
A = |
|
1 2p |
; E = |
1 6p(1 p) |
: |
|
pnp(1 p) |
np(1 p) |
|||||
|
|
|
2. Гипергеометрическое распределение.
Предположим имеется N объектов, среди которых ровно M обладают заданным свойством (N > M): Из этих N объектов вынимается n: Обозначим через X число объектов, обладающих заданным свойством среди n вытащенных. Например, среди N людей M больны некоторой болезнью. Выбирается случайным образом n человек среди этих N: Тогда X - это число больных среди n выбранных.
Случайная величина X; имеющая гипергеометрическое распределение принимает целые значения и
Cn Cn m
P (X = m) = M N M :
CNn
Ïðè ýòîì
max(0; n (N M)) m min(n; M):
Например, если N=7, M=5, n=3, то 1 m 3: Для гипергеометрического распределения
EX = n N |
; DX = nN 1 1 |
N |
1 N |
: |
|||
|
M |
|
M |
M |
|
n |
|
5

Если общее число объектов велико (N ! 1); число объектов, обладающих заданным свойством также велико (M ! 1); и при этом доля
объектов, обладащих заданным свойством стремится к некоторой кон- станте MN ! p; то гипергеометрическое распределение сходится к бино-
миальному распределению с параметрами n; p (B(n; p)); P (X = m) ! Cnmpm(1 p)n m:
Cоответственно, при этом
EX ! np; DX ! np(1 p)
3. Распределение Пуассона ( ):
Случайная величина X имеет распределение Пуассона, если
P (X = k) = e k ; k = 0; 1; 2; :::
k!
Пуассоновское распределение часто используется для изучения числа редких событий при большом числе испытаний. Например, число редких заболеваний, число несчастных случаев, число требований, поступивших на обслуживание и т.д.
Для распределения Пуассона
1 |
|
1 |
|
||||
EX = ; DX = ; A = |
p |
|
; E = |
|
|
: |
|
|
|||||||
|
4. Равномерное распределение на отрезке R[a,b].
Случайная величина X распределена равномерно на отрезке [a,b], если ее распределение задается плотностью
(
1 ; x 2 [a; b] f(x) = b a
0; x 2= [a; b]
Равномерное распределение используется тогда, когда известно лишь только то, что случайная величина принимает значения из интервала [a,b].
Для случайной величины, имеющей равномерное распределение на отрезке [a,b],
EX = b + a; DX = (b a)2 :
2 12
6

Остальные числовые характеристики равномерного распределения также легко вычисляются.
5. Гамма распределение ( ; ).
Случайная величина имеет гамма распределение с параметрами ; ; если плотность распределения этой случайной величины f(x) равна
(x) = |
( x 1e x |
; x 0 |
|
0; x < 0 |
|
|
( ) |
|
В этой формуле ( ) - гамма функция, определенная при всех значениях> 0 следующим образом
Z 1
( ) = y 1e ydy
0
Из определения следует, что
(1) = 1; 12 = p :
Если целое число, то ( ) = ( 1) ( 1) = ( 1)!
Если = 1; то плотность гамма распределения выглядит следующим
образом
(
0; x < 0
f(x) =
e x; x 0
Частный случай гамма распределения при = 1 называется экспонен-
циальным распределением. Для гамма распределения
EX = |
|
; |
DX = |
|
: |
|
|
2 |
|||||
|
|
|
|
Если - целое число, то гамма распределение часто называют распре-
делением Эрланга.
Гамма распределение обладает замечательным свойством. Если две незвисимые случайные величины X1 è X2 имеют гамма распределение( ; 1) è ( ; 2) соответственно, то сумма X1 + X2 имеет гамма рас- пределение ( ; 1 + 2):
6. Бета распределение. Случайная величина X имеет бета распределение, если P (0 < X < c) = 1 (c > 0) и плотность распределения этой случайной величины на отрезке [0,c] равна
f(u) = B( ; ) |
c |
|
|
|
1 |
c |
|
|
|
c : |
|||
|
|
u |
|
|
1 |
|
|
u |
|
|
1 |
1 |
|
7

Функция
B( ; ) = ( + ) :( ) ( )
Математическое ожидание и дисперсия случайной величины, имеющей бета распределение, равны
|
c |
c2 |
|
|
EX = |
|
; DX = |
|
: |
|
( + + 1)( + )2 |
|||
|
+ |
|
Некоторые результаты теории вероятностей
1.Неравенство Чебышева
Для любой случайной величины, у которой существуют математиче- ское ожидание и дисперсия справедливо следующее неравенство
P (jX EXj ) |
DX |
, P (jX EXj < ) 1 |
DX |
: |
|
|
|||
2 |
2 |
Это неравентсво справедливо при любом > 0:
2.Сходимость по вероятности последовательности случайных величин.
Определение. Говорят, что последовательность случайных величин
p
Xn сходится по вероятности к случайной величине X; (Xn ! X); åñëè
для любого > 0
P (jXn Xj ) ! 0:
Свойства сходимости по вероятности. |
|
p |
p |
Пусть Xn ! a; |
Yn ! b; a; b const: Тогда |
p
Xn Yn ! a b;
p
XnYn ! ab;
p
Xn=Yn ! a=b; b =6 0:
Теорема Слуцкого. Слуцкий Евгений Евгеньевич(1980-1948)
Пусть имеется k последовательностей случайных величин и при n ! 1 каждая из этих последовательностей сходится по вероятности к кон-
станте: Xn1 |
p |
; Xn2 |
p |
p |
! a1 |
! a2; :::; Xnk ! ak: Пусть функция от k переменных |
|||
g(x1; :::; xk) непрерывна в точке a1; :::; ak: Тогда |
||||
|
|
|
g(Xn1 |
p |
|
|
|
; :::; Xnk) ! g(a1; :::; ak): |
8

Закон больших чисел.(А.Я. Хинчин)
Хинчин Александр Яковлевич Родился 19 июля 1894 г. Умер 18 ноября 1959 г., Москва.
Пусть X1; X2; ::: - последовательность независимых одинаково распределенных случайных величин, у которых существует математическое ожидание EXj = a < 1: Тогда
n
1 X p
n
Xj ! a:
j=1
3.Слабая сходимость функций распределения или сходимость последовательности случайных величин по распределению.
Последовательность функций распределения Fn(u) сходится слабо к функции распределения F (u)(Fn(u) ) F (u)); åñëè
lim Fn(u) = F (u)
n!1
во всех точках непрерывности функции F (u):
Последовательность случайных величин Xn сходится по распределе-
d
нию (слабо сходится) к случайной величине X (Xn ! X); если соответствующая последовательность функций распределения сходится слабо к функции распределения случайной величины X:
Это определение эквивалентно следующему. Последовательность слу- чайных величин Xn сходится слабо к случайной величине X; если для любых 1 < a < b < 1 (в которых распределение случайной величины
X непрерывно)
lim P (a Xn < b) = P (a X < b):
n!1
Свойства слабой сходимости
d p
Пусть Xn ! X; a Yn ! b (b = const): Тогда при n ! 1
d
Xn Yn ! X a;
d
XnYn ! aX;
d
Xn=Yn ! X=a; a =6 0:
9

Для слабой сходимости справедлив аналог теоремы Слуцкого.
d
Теорема. Если последовательность Xn ! X и функция g(u) непре-
d
рывна, то g(Xn) ! g(X):
4. Центральная предельная теорема Линдеберга - Леви(18861971).Национальность Дж.У Линдеберга - финн. Жил тоже с конца 19-го века.
Пусть X1; X2; :: - последовательность независимых одинаково распределенных случайных величин с EX = a; DX = 2: Тогда при n ! 1
P |
pn |
! |
1n |
Xi na |
d X; |
|
|
при этом X имеет стандартное нормальное распределение. Это означает, что для любого u
P |
Pj pn |
|
||
|
n=1 Xj |
na |
||
|
|
|
|
|
!
< u ! (u) = p1 2
Z
u |
2 |
e y2 dy:
1
10