Скачиваний:
22
Добавлен:
20.05.2014
Размер:
157.16 Кб
Скачать

Лекция 1.

Математическая (или теоретическая) статистика, так же как и теория вероятностей изучает случайные эксперименты. Математическая статистика, опираясь на методы и понятия теории вероятностей, решает задачи, в каком-то смысле, обратные задачам теории вероятностей. Теория вероятностей изучает свойства случайного эксперимента, которые позволяют по известным вероятностям одних событий вычислять вероятности других событий. В математической статистике, наблюдая за результатами случайного эксперимента, мы отвечаем на различные вопросы о том, как же этот случайный эксперимент устроен.

Рассмотрим следующий пример. Предположим бросаются три игральные кости. В результате эксперимента будет наблюдаться тройка чисел ! = (i1; i2; i3); ãäå ij - число очков,выпавших на j-ой кости (j = 1; 2; 3): Эта тройка чисел является элементарным исходом эксперимента. Пространство элементарных исходов = f!g состоит из 63 элементар-

ных исходов и если кости правильные, то все элементарные исходы -

равновозможны. Вероятность выпадения при этом трех шестерок равна соответственно (1=6)3 = 0:00463:

Предположим теперь, что наблюдая за бросанием трех игральных костей, мы видим что выпало три шестерки, то есть мы наблюдаем событие, которое происходит очень редко, если игральные кости правильные (примерно в 5 случаях из 1000). Опять бросаются эти же три кости и при этом опять выпадает три шестерки. Пять раз подряд бросаются три игральные кости и каждый раз при этом выпадают три шестерки.

Так как выпадение трех шестерок при одном бросание трех правиль- ных костей равна (1=6)3, то при 5 независимых бросаниях этих же ко-

стей, как известно из теории вероятностей, выпадение пять раз подряд трех шестерок равна (1=6)15: Это событие настолько редкое для правиль-

ных костей, что его появление вызывает подозрение, что кости какие-то неправильные. То есть по результату случайного эксперимента мы делаем вывод, что, скорее всего, элементарные исходы в этом эксперменте не равновозможны (по результатам эксперимента делается вывод о том, как этот эксперимент устроен).

Прежде, чем переходить к описанию основных понятий математиче- ской статистики, напомним некоторые сведения из теории вероятностей. Любой случайный эксперимент описывается с помощью вероятностного пространства ( ; A; P): Здесь пространство элементарных исходов

эксперимента, A - -алгебра случайных событий, P - вероятности этих событий. Функция от элементарных исходов X(!) называется случай-

1

ной величиной, а F (x) = P (X(!) < x) - функцией распределения этой

случайной величины. Если задана функция распределения случайной величины, то говорят, что задан закон распределения этой случайной величины. По функции распределения можно вычислить вероятности

P (a X < b) = F (b) F (a)

для любых a; b; a < b:

Случайные величины бывают дискретными и непрерывными. Дискретные случайные величины с положительной вероятностью принимают не более, чем счетное число значений. Функция распределения дискретной случайной величины - кусочно-постоянна. Скачки функции распределения дискретной случайной величины находятся в тех значениях, которые случайная величина принимает с положительной вероятностью.

Непрерывными случайными величинами мы называем такие случайные величины X(!); для которых существует плотность распределения

f(x): Плотность распределения f(x) это неотрицательная функция такая, что для любых a b

Z b

P (a < X(!) < b) = f(x)dx:

a

Для непрерывных случайных величин P (X = a) = 0 для любых a: Для

распределений, чаще всего встречающихся на практике, плотность является непрерывной (кроме конечного числа точек) функцией и f(x) =

F 0(x):

Числовые характеристики случайных величин.

I. Характеристики срединных значений случайной величи- ны (характеристики центра группирования)

1. Математическое ожидание случайной величины EX.

(

P

k xkpk; если X - дискретна

EX = 1 xf(x)dx; если X - непрерывна

R

1

Математическое ожидание по своему смыслу - среднее значение случайной величины.

2. Ìîäà m0:

Мода случайной величины - это наиболее вероятное значение слу- чайной величины (наиболее часто встречающееся).

2

P (X = m0) = max P (X = xk)

k

для дискретных случайных величин и

f(m0) = max f(x)

x

для непрерывных случайных величин. Мода не обязательно единственна.

3. Медиана me

Медиана - это такое значение случайной величины, для которого

P (X me)

1

; P (X me)

1

:

2

2

Если случайная величина непрерывнна, то

1

P (X me) = P (X me) = 2:

Медианой удобно пользоваться, когда среди значений случайной вели- чины с малой вероятностью появляются значения сильно удаленные от основной массы возможных значений.

Характеристики разброса.

4. Дисперсия DX.

Дисперсия - мера разброса случайной величины, относительно ее математического ожидания.

DX =

( 1

 

(x

EX)2f(x)dx

 

k

(xk

EX)2P (X = xk);

 

P

 

 

 

 

R1

 

 

5. Среднеквадратическое отклонение случайной величины

X p

X = DX

6. Коэффициент вариации

VX = EXX 100%

3

Числовые характеристики вида распределения.

Следующие две характеристики используются чаще всего, когда мы хотим сравнить распределение изучаемой совокупности с нормальным распределением

7. Асимметрия.

A =

E(X EX)3

(DX)3=2

Если случайная величина имеет распределение симметричное относительно математического ожидания, то коэффициент ассиметрии равен нулю

8. Эксцесс.

Эксцесс - характеристика островершинности в окрестности моды.

E = E(X EX)4 3

(DX)2

Для случайных величин, имеющих нормальное распределение, эксцесс равен нулю. Как правило, если в районе моды вершина острая, то E > 0;

а если вершина плоская, то E < 0:

9. Квантили распределения.

Пусть случайная величина X имеет непрерывную монотонную функцию распределения F (x): Число u называется квантилью уровня распределения F (x); если

P (X < u ) = :

То есть квантиль уровня - это корень уравнения F (u ) = :

Из определения квантили следует, что медиана распределения - это квантиль уровня 0.5 (me = u0:5).

Законы распределения вероятностей, наиболее распространенные

в практике статистических исследований.

Мы перечислим сейчас наиболее часто встречающиеся на практике законы распределения, значения соответствующих математических ожиданий, дисперсий. В некоторых случаях (когда формулы не очень сложные) приведем значения и других числовых характеристик.

1. Биномиальное распределение B(n; p):

Случайная величина X имеет биномиальное распределение, если

P (X = k) = Cnkpk(1 p)n k; k = 0; 1; :::; n

4

Биномиальное распределение возникает при повторении n раз одного и

того же эксперимента, в котором либо появляется, либо нет некоторое событие ; называемое успехом эксперимента. Число успехов в n незави-

симых испытаниях имеет биномиальное распределение. Для биномиального распределения

EX = np; DX = np(1 p):

Ìîäà mo целое число, находящееся в интервале единичной длины

p(n + 1) 1 mo p(n + 1):

Если p(n + 1) - не целое число, то единственное целое число в этом интервале равно целой части числа p(n + 1): Если же p(n + 1) - целое, то наиболее вероятными значениями случайной величины X являются два значения p(n + 1) и p(n + 1) 1:

Ассиметрия и эксцесс для биномиального распределения вычисляются по формулам

A =

 

1 2p

; E =

1 6p(1 p)

:

pnp(1 p)

np(1 p)

 

 

 

2. Гипергеометрическое распределение.

Предположим имеется N объектов, среди которых ровно M обладают заданным свойством (N > M): Из этих N объектов вынимается n: Обозначим через X число объектов, обладающих заданным свойством среди n вытащенных. Например, среди N людей M больны некоторой болезнью. Выбирается случайным образом n человек среди этих N: Тогда X - это число больных среди n выбранных.

Случайная величина X; имеющая гипергеометрическое распределение принимает целые значения и

Cn Cn m

P (X = m) = M N M :

CNn

Ïðè ýòîì

max(0; n (N M)) m min(n; M):

Например, если N=7, M=5, n=3, то 1 m 3: Для гипергеометрического распределения

EX = n N

; DX = nN 1 1

N

1 N

:

 

M

 

M

M

 

n

 

5

Если общее число объектов велико (N ! 1); число объектов, обладающих заданным свойством также велико (M ! 1); и при этом доля

объектов, обладащих заданным свойством стремится к некоторой кон- станте MN ! p; то гипергеометрическое распределение сходится к бино-

миальному распределению с параметрами n; p (B(n; p)); P (X = m) ! Cnmpm(1 p)n m:

Cоответственно, при этом

EX ! np; DX ! np(1 p)

3. Распределение Пуассона ( ):

Случайная величина X имеет распределение Пуассона, если

P (X = k) = e k ; k = 0; 1; 2; :::

k!

Пуассоновское распределение часто используется для изучения числа редких событий при большом числе испытаний. Например, число редких заболеваний, число несчастных случаев, число требований, поступивших на обслуживание и т.д.

Для распределения Пуассона

1

 

1

 

EX = ; DX = ; A =

p

 

; E =

 

 

:

 

 

4. Равномерное распределение на отрезке R[a,b].

Случайная величина X распределена равномерно на отрезке [a,b], если ее распределение задается плотностью

(

1 ; x 2 [a; b] f(x) = b a

0; x 2= [a; b]

Равномерное распределение используется тогда, когда известно лишь только то, что случайная величина принимает значения из интервала [a,b].

Для случайной величины, имеющей равномерное распределение на отрезке [a,b],

EX = b + a; DX = (b a)2 :

2 12

6

Остальные числовые характеристики равномерного распределения также легко вычисляются.

5. Гамма распределение ( ; ).

Случайная величина имеет гамма распределение с параметрами ; ; если плотность распределения этой случайной величины f(x) равна

(x) =

( x 1e x

; x 0

 

0; x < 0

 

 

( )

 

В этой формуле ( ) - гамма функция, определенная при всех значениях> 0 следующим образом

Z 1

( ) = y 1e ydy

0

Из определения следует, что

(1) = 1; 12 = p :

Если целое число, то ( ) = ( 1) ( 1) = ( 1)!

Если = 1; то плотность гамма распределения выглядит следующим

образом

(

0; x < 0

f(x) =

e x; x 0

Частный случай гамма распределения при = 1 называется экспонен-

циальным распределением. Для гамма распределения

EX =

 

;

DX =

 

:

 

2

 

 

 

 

Если - целое число, то гамма распределение часто называют распре-

делением Эрланга.

Гамма распределение обладает замечательным свойством. Если две незвисимые случайные величины X1 è X2 имеют гамма распределение( ; 1) è ( ; 2) соответственно, то сумма X1 + X2 имеет гамма рас- пределение ( ; 1 + 2):

6. Бета распределение. Случайная величина X имеет бета распределение, если P (0 < X < c) = 1 (c > 0) и плотность распределения этой случайной величины на отрезке [0,c] равна

f(u) = B( ; )

c

 

 

 

1

c

 

 

 

c :

 

 

u

 

 

1

 

 

u

 

 

1

1

 

7

Функция

B( ; ) = ( + ) :( ) ( )

Математическое ожидание и дисперсия случайной величины, имеющей бета распределение, равны

 

c

c2

 

EX =

 

; DX =

 

:

 

( + + 1)( + )2

 

+

 

Некоторые результаты теории вероятностей

1.Неравенство Чебышева

Для любой случайной величины, у которой существуют математиче- ское ожидание и дисперсия справедливо следующее неравенство

P (jX EXj )

DX

, P (jX EXj < ) 1

DX

:

 

 

2

2

Это неравентсво справедливо при любом > 0:

2.Сходимость по вероятности последовательности случайных величин.

Определение. Говорят, что последовательность случайных величин

p

Xn сходится по вероятности к случайной величине X; (Xn ! X); åñëè

для любого > 0

P (jXn Xj ) ! 0:

Свойства сходимости по вероятности.

p

p

Пусть Xn ! a;

Yn ! b; a; b const: Тогда

p

Xn Yn ! a b;

p

XnYn ! ab;

p

Xn=Yn ! a=b; b =6 0:

Теорема Слуцкого. Слуцкий Евгений Евгеньевич(1980-1948)

Пусть имеется k последовательностей случайных величин и при n ! 1 каждая из этих последовательностей сходится по вероятности к кон-

станте: Xn1

p

; Xn2

p

p

! a1

! a2; :::; Xnk ! ak: Пусть функция от k переменных

g(x1; :::; xk) непрерывна в точке a1; :::; ak: Тогда

 

 

 

g(Xn1

p

 

 

 

; :::; Xnk) ! g(a1; :::; ak):

8

Закон больших чисел.(А.Я. Хинчин)

Хинчин Александр Яковлевич Родился 19 июля 1894 г. Умер 18 ноября 1959 г., Москва.

Пусть X1; X2; ::: - последовательность независимых одинаково распределенных случайных величин, у которых существует математическое ожидание EXj = a < 1: Тогда

n

1 X p

n

Xj ! a:

j=1

3.Слабая сходимость функций распределения или сходимость последовательности случайных величин по распределению.

Последовательность функций распределения Fn(u) сходится слабо к функции распределения F (u)(Fn(u) ) F (u)); åñëè

lim Fn(u) = F (u)

n!1

во всех точках непрерывности функции F (u):

Последовательность случайных величин Xn сходится по распределе-

d

нию (слабо сходится) к случайной величине X (Xn ! X); если соответствующая последовательность функций распределения сходится слабо к функции распределения случайной величины X:

Это определение эквивалентно следующему. Последовательность слу- чайных величин Xn сходится слабо к случайной величине X; если для любых 1 < a < b < 1 (в которых распределение случайной величины

X непрерывно)

lim P (a Xn < b) = P (a X < b):

n!1

Свойства слабой сходимости

d p

Пусть Xn ! X; a Yn ! b (b = const): Тогда при n ! 1

d

Xn Yn ! X a;

d

XnYn ! aX;

d

Xn=Yn ! X=a; a =6 0:

9

Для слабой сходимости справедлив аналог теоремы Слуцкого.

d

Теорема. Если последовательность Xn ! X и функция g(u) непре-

d

рывна, то g(Xn) ! g(X):

4. Центральная предельная теорема Линдеберга - Леви(18861971).Национальность Дж.У Линдеберга - финн. Жил тоже с конца 19-го века.

Пусть X1; X2; :: - последовательность независимых одинаково распределенных случайных величин с EX = a; DX = 2: Тогда при n ! 1

P

pn

!

1n

Xi na

d X;

 

 

при этом X имеет стандартное нормальное распределение. Это означает, что для любого u

P

Pj pn

 

 

n=1 Xj

na

 

 

 

 

 

!

< u ! (u) = p1 2

Z

u

2

e y2 dy:

1

10

Соседние файлы в папке Лекции Мат.стат. (2007-2008)