Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Matematicheskaya_statistika_v_meditsine

.pdf
Скачиваний:
120
Добавлен:
19.02.2016
Размер:
5.63 Mб
Скачать

σ x =

D x .

Внашем случае:

σx = 2.76 = 1.66

.

д) Для построения многоугольника распределения вдоль оси абсцисс откладываем возможные значения случайной величины, вдоль оси ординат – вероятности этих значений:

Пример 9. Для дискретной случайной величины, заданной следующим законом распределения (см. таблицу ниже) построить функцию распределения и определить вероятность того, что данная случайная величина попадёт в интервал 2;3 .

 

X

 

2

 

3

 

4

5

 

P

 

0.1

 

0.2

 

0.6

0.1

 

Решение:

 

 

 

 

 

По определению функция распределения – это вероятность того, что случайная вели-

чина

X

будет меньше заданного числа

x , т. е.

F X = P X < x . Для нашего случая функция

распределения будет строиться следующим образом: будем определять вероятности того, что случайная величина будет меньше наибольшего числа из данного интервала.

 

1. < x < 2 .

 

Наибольшее число в данном интервале равно 2, поэтому находим вероятность того, что

СВ

X будет меньше 2 – это и будет значение функции распределения на данном интервале:

 

F = P X < 2 = 0 . Данная вероятность будет равна 0, т. к. в таблице нет значений СВ

меньших 2, т. е. появление СВ X < 2 является невозможным событием.

 

2. 2 x < 3 .

 

Наибольшее число в этом интервале равно 3, поэтому находим вероятность того, что

СВ

X будет меньше 3 – это и будет значение функции распределения на данном интерва-

ле:

F = P X < 3 = P2 = 0.1. Данная вероятность будет равна 0.1, так как в таблице есть

только одно значение СВ меньшее 3, и это значение равно 2, а его вероятность равна

P2 = 0.1.

 

 

 

 

3. 3 x < 4 .

 

 

Наибольшее число в этом интервале равно 4, поэтому находим вероятность того, что

СВ

X будет меньше 4 – это и будет значение функции распределения на данном интерва-

 

 

 

 

P

ле:

F = P X < 4

 

= P2 +

3 = 0.1+0.2 = 0.3. Данная вероятность будет равна 0.3, так как в

таблице есть два значения СВ меньшие 4 – это 2 и 3. В силу того, что СВ может принимать

оба значения (при этом одно значение исключает другое), то события X = 2 и

X = 3

явля-

ются несовместными, и вероятность осуществления одного из них равна сумме их вероятно-

стей, т. е. P + P = 0.1+0.2 = 0.3 .

2 3

4. 4 x < 5 .

21

 

Наибольшее число в этом интервале равно 5, поэтому находим вероятность того, что

СВ

X будет меньше 5 – это и будет значение функции распределения на данном интерва-

ле:

 

 

P

P

F = P X < 5 = P2 +

3 +

4 = 0.1+0.2+0.6 = 0.9 . Данная вероятность будет равна 0.9,

так как в таблице есть три значения СВ меньшие 4 – это 2, 3 и 4. В силу того, что СВ может принимать три значения (при этом одно значение исключает другие), то события X = 2 ,

X = 3 и X = 4 являются несовместными, и вероятность осуществления одного из них равна

сумме их вероятностей, т. е.

2 +

3 +

4 = 0.1+0.2+0.6 = 0.9 .

 

P

P

P

5. 5 x < + .

Наибольшее число в этом интервале равно +∞ поэтому находим вероятность того, что

СВ X

будет меньше +∞ – это и будет значение функции распределения на данном интерва-

ле:

F = P X <+ = P2 + P3 + P4 + P5 = 0.1+0.2+0.6+0.1=1.

 

Данная вероятность будет равна 1, так как все значения СВ в таблице меньше +∞. В си-

лу того, что СВ может принимать все возможные значения, указанные в таблице, то вероят-

ность того, что СВ примет одно из этих значений, равна сумме вероятностей этих значений,

т. е. P + P + P + P = 0.1+0.2+0.6+0.1= 1.

2

3

4

5

Окончательно записываем функцию распределения СВ

X :

0,

 

0.1,

 

 

 

 

F ( X ) 0.3,

 

 

0.9,

 

 

 

1,

 

 

Вероятность

лой: P α x β =

распределения была P 2 x 3 =

при

< x < 2;

 

 

 

при

2 x < 3;

 

 

 

 

при

3 x < 4;

 

 

 

 

при

4 x < 5;

 

 

 

 

при

5 x < + .

 

 

α; β

 

попадания СВ

X

в интервал

определяется

F β F α . Используем эту формулу для нашего случая вычислена выше) и получим искомую вероятность:

F 3 F 2 = 0.3 0.1= 0.2 .

форму- (функция

22

ГЛАВА 3. НЕКОТОРЫЕ ЗАКОНЫ РАСПРЕДЕЛЕНИЙ СЛУЧАЙНЫХ ВЕЛИЧИН

Напомним, что законом распределения случайной мость вероятности значений СВ от этих значений, т. е. P x

величины

.

X

называется зависи-

Рассмотрим несколько теоретических законов распределений случайных величин, которые часто используются в качестве моделей в медико-психологических исследованиях.

3.1. Биномиальное распределение

Пусть проводятся

n

независимых испытаний, в каждом из которых происходит (с ве-

роятностью p ) или не происходит (с вероятностью q =1 p ) событие A . Тогда вероятность того, в серии из n испытаний событие A произойдёт ровно x раз, определяется по формуле

x

p

x

q

n x

. Случайная величина X , состоящая в том, что событие A про-

Бернулли: Pn x = Cn

 

 

изошло x ( x = 0 , x = 2

, … ,

x = n ) раз в n независимых испытаниях, будет распределена по

биномиальному закону.

 

 

 

 

Без доказательств приведём основные свойства данного распределения:

1.

Математическое ожидание данного распределения определяется по формуле:

M X = np .

 

2.

Дисперсия данного распределения определяется по формуле:

D X = npq .

 

3.

Среднее квадратическое отклонение определяется по формуле:

σ X =

npq .

 

4.

Для вычисления вероятности значения СВ

x = 0 можно использовать формулу:

pn 0 = q

n

.

 

 

 

 

5.

Для вычисления вероятности значения СВ

x = n можно использовать формулу:

pn n = p

n

.

 

 

 

6. Если известно, что СВ подчиняется биномиальному закону распределения, то вероятности её возможных значений связаны рекуррентной формулой (следующее значение считается через предыдущее):

P

x = P x 1

n x +1

 

 

n

n

x

 

 

 

 

p q

.

3.2. Распределение Пуассона

Пусть проводится n независимых испытаний, в каждом из которых (с вероятностью

p ) происходит или не происходит (с вероятностью

q =1 p ) событие

A . Тогда при боль-

шом числе испытаний n и малой вероятности события A ( p < 0.1), при выполнении условия

= np <10

, вероятность того, что событие

A произойдёт

x

раз в

n испытаниях, определя-

ется по формуле Пуассона: Pn x =

 

x

e

 

 

 

 

 

 

. Случайная величина

X , состоящая в том, что

 

 

x!

 

 

 

 

 

 

 

 

 

событие A

произошло x ( x = 0 , x = 2

, … , x = n ) раз в

n

независимых испытаниях, будет

подчинятся распределению Пуассона.

 

 

 

 

 

 

 

Без доказательств приведём основные свойства данного распределения:

1.Математическое ожидание данного распределения определяется по формуле:

M X = = np .

2.Дисперсия данного распределения определяется по формуле:

23

D X = = np .

 

 

 

 

3. Среднее квадратическое отклонение определяется по формуле:

σ X =

=

np .

 

 

 

 

4. Для вычисления вероятности значения СВ

x = 0

можно использовать формулу:

Pn 0 = e

 

.

 

 

 

 

 

 

 

 

 

 

 

5. Для вычисления вероятности того, что событие

A произойдёт хотя бы 1 раз в

пытаниях можно воспользоваться формулой:

 

 

Pn 1 =1 Pn 0 =1 e

 

.

 

 

 

 

 

n

ис-

6. Если известно, что СВ подчиняется распределению Пуассона, то вероятности её возможных значений связаны рекуррентной формулой (новое значение считается через предыдущее):

P

x = P x 1

 

 

n

n

x

 

 

.

Рассмотрим два распределения, относящихся к классу непрерывных распределений случайных величин. В отличие от дискретных СВ, где дискретному набору значений сопоставляется дискретный набор вероятностей этих значений, у непрерывных СВ значение из интервала связано с собственной вероятностью функцией p(x) , называемой плотностью

вероятности. Как и закон распределения, функция распределения подчиняется условию нормировки:

+ p x dx

=

1

, по аналогии с

n Pi i=1

=

1

.

3.3. Равномерное распределение

 

 

 

Данное распределение характеризуется тем, что все значения СВ

X

из интервала a;b

имеют одинаковую плотность вероятности

p x , равную:

 

 

1

 

 

 

 

p x =

 

.

 

 

 

b a

 

 

 

Без доказательств приведём основные свойства данного распределения:

1. Математическое ожидание данного распределения определяется по формуле:

M X =

b a

.

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

2. Дисперсия данного распределения определяется по формуле:

 

D X =

b a 2 .

 

 

 

 

12

 

 

 

 

 

α; β (при условии, что

3. Вероятность того, что СВ

X

будет находиться в интервале

a α < β и α < β b ) определяется по формуле:

 

P α X β =

β α

.

 

 

 

 

 

 

 

 

 

 

b a

 

 

 

3.4. Нормальное распределение

Данное распределение характеризуется тем, что плотность вероятности СВ X зависит от значения x по следующему закону:

24

 

 

 

 

x μ

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

p x =

1

 

 

 

2

 

 

 

 

 

 

e

 

2σ

, где

μ

математическое ожидание СВ

X ,

σ

среднее квадра-

 

 

 

 

 

 

 

σ

2π

 

 

 

 

 

 

 

 

 

 

тическое отклонение данной величины.

Следует отметить, что нормальное распределение с параметрами

μ = 0

и

σ = 1

называ-

ется нормальным стандартным распределением (часто просто «стандартным распределением»).

Без доказательств приведём основные свойства данного распределения:

1. Математическое ожидание и среднее квадратическое отклонение для данного рас-

пределения составляют соответственно:

μ и σ .

Плотность вероятности стандартной нормально распределённой случайной величины

описывается формулой:

 

 

 

 

 

 

(x) =

1

e

x

2

/ 2

.

 

 

 

 

 

 

 

 

 

 

 

2π

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2. Вероятность того, что нормально распределенная СВ попадёт в интервал α, β опре-

деляется по формуле:

 

 

 

 

 

 

 

 

 

 

 

 

 

β μ

 

α μ

, где Φ z – функция Лапласа (см. таблицу 2).

P α X β = Φ

 

 

 

Φ

 

 

 

 

 

 

 

 

σ

 

 

σ

 

 

3. Вероятность того, что нормально распределённая СВ отклонится от своего математического ожидания не более чем на величину равна:

P X μ <

4. Примерно дятся в интервале

 

 

= 2Φ

.

 

σ

99.74% всехμ 3σ; μ +3σ

возможных значений нормально распределенной СВ нахо-. Данное правило называется правилом «трёх сигм» и широ-

ко используется для оценки диапазона значений СВ.

5.Медиана и мода нормального распределения совпадают и равны математическому ожиданию.

6.График плотности вероятности нормально распределённой СВ имеет характерную симметричную (относительно µ) колоколообразную форму:

7. Биномиальное распределение, распределение Пуассона, распределения Стьюдента, χ2-Пирсона и др. при больших количествах испытаний стремятся к нормальному.

25

Примеры решения задач Пример 10. Вероятность синтеза некоторого вещества в химическом опыте равна

p = 0.75

. Составить случайную величину

X

количество удачных синтезов вещества в

серии из 4 испытаний. Найти математическое ожидание, дисперсию, среднее квадратическое отклонение.

Решение:

Так как данная задача удовлетворяет схеме Бернулли, то СВ X будет подчиняться биномиальному закону распределения. Используя приведённые выше формулы, находим вероятности соответствующих значений:

X = 0 :

ле:

P

0 = q

 

4

4

 

= 0.254

=

0.004

. Далее находим вероятности по рекуррентной форму-

X X X X

= = = =

1 2 3 4

:

:

:

:

P4

1 = P4 0

4 1+1

 

 

0.75

= 0.004

4 3= 0.047 ,

 

1

 

0.25

 

 

 

 

 

 

 

 

 

 

 

 

P4

2 = P4

1

 

4 2+1

 

0.75

= 0.047

1.5 3= 0.211,

 

2

 

 

0.25

 

 

 

 

 

 

 

 

 

 

 

P

3 = P 2

 

4 3+1

 

0.75

= 0.211 2 / 3 3= 0.422 ,

 

 

 

 

 

4

4

 

 

3

 

 

 

 

0.25

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P4

4 = P4

3

4 4+1

 

0.75

= 0.422

1/ 4 3= 0.316 .

4

 

 

 

0.25

 

 

 

 

 

 

 

 

 

 

 

Строим закон распределения СВ

X

:

X

0

 

1

2

3

4

p

0.004

 

0.047

0.211

0.422

0.316

 

 

 

 

 

 

 

 

 

Так как известно, что СВ

X

подчиняется биномиальному закону распределения, то для

вычисления её параметров используем указанные формулы:

 

 

M x = np = 4 0.75 = 3 ,

 

 

 

 

 

D X = npq = 4 0.75 0.25 = 0.75 ,

 

 

 

σ X =

npq

=

4 0.75 0.25 =

0.866

.

Пример 11. Вероятность заболевания неким заболеванием в данной местности равна p = 0.001. Найти вероятность того, что из 2000 жителей данной местности заболевших будет: а) 0, 1, 2, 3, 4; б) хотя бы один.

Решение:

а) Условие задачи подходит под схему независимых испытаний Бернулли, и в силу того, что в единичном испытании вероятность события мала ( p = 0.001), а число испытаний велико ( n = 2000 ), то для нахождения вероятностей событий можно использовать формулу Пуассона. Параметр μ равен μ = np = 2000 0.001= 2 , поэтому, случайная величина X – число заболевших будет тогда подчиняться распределению Пуассона. Находим вероятности

значений X = 0 , X =1,

X = 2 ,

X = 3

,

X = 4 по указанным формулам:

X = 0 :

pn 0 = e

λ

= p2000

0 = e

2

= 0.135.

 

 

Для дальнейших вычислений используем рекуррентную формулу:

X =1,

X = 2 ,

P

1 = P

0

2000

2000

 

P2000 2 = P2000 1

λ

1 λ

2

=0.135

=0.270

2

=

1

 

 

2

=

2

 

0.270

;

0.270 ;

26

X X

= =

3 4

,

,

P

3 = P

2

λ

= 0.270

 

 

2000

2000

 

 

3

 

 

 

 

 

 

 

 

P

4 = P

 

3

λ

= 0.180

 

 

 

2000

2000

 

4

 

 

 

 

 

 

 

 

2

3 2

4

= =

0.180 0.090

;

.

б) Для нахождения вероятности события «будет хотя бы один заболевший» используем указанную формулу:

P2000 1 =1 P2000 0 =1 0.135= 0.865.

Пример 12. Непрерывная СВ X распределена по равномерному закону распределения в интервале 1;4 . Найти математическое ожидание, дисперсию, среднее квадратическое

отклонение данной СВ. Найти вероятность того, что СВ будет находиться в интервале

0;3 .

Решение:

Так как СВ X распределена равномерно, то для нахождения характеристик СВ будем

использовать готовые формулы:

 

 

M X =

b a

=

4 1

=

5

= 2.5

,

2

2

2

 

 

 

 

 

 

b a

 

4 1

 

5

 

 

D X =

2

 

2

 

 

 

 

12

=

12

=

12

= 0.417

,

 

 

 

 

 

σ X =

D X =

0.417

=

0.646

.

Находим искомую вероятность:

P 0 X 3 =

3 0

=

3

= 0.600

1

 

4

 

5

 

.

Пример 13. Непрерывная СВ

X

ность вероятности, описываемую

распределена по нормальному закону и имеет плот-

формулой: p x =

 

1

 

 

x 9 2

 

 

 

e

18

. Найти математиче-

 

 

 

 

 

 

 

18π

 

ское ожидание, дисперсию, среднее квадратическое отклонение. Определить вероятность попадания данной случайной величины в интервал 8;12 . Найти вероятность того, что СВ

отклонится от своего математического ожидания не более чем на величину = 2 . Оценить интервал, в котором находится 99.74% всех значений СВ. Найти интервал, симметричный относительно математического ожидания, в котором находятся 50% всех значений СВ X .

Решение:

Приведём сначала плотность вероятности СВ X к виду:

 

 

 

 

 

 

 

 

 

 

 

 

 

x μ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

p x =

1

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

e

 

 

2σ

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ

 

2π

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Итак,

 

 

 

 

 

 

 

 

x 9 2

 

 

 

 

 

 

 

 

 

 

x 9 2

 

p x =

 

1

 

 

 

 

 

 

1

 

 

 

 

 

 

 

e

 

18

 

=

 

 

e

2 9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

18π

 

 

 

 

2 9π

 

 

 

1

 

 

 

 

 

x 9 2

 

 

 

1

 

 

 

x 9 2

 

=

 

 

 

 

 

e

 

 

 

 

2 32

 

=

 

 

 

 

e

 

 

2 32

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

2 32 π

 

 

 

 

 

 

 

 

 

 

 

 

Сравнивая последнее выражение с эталонным получаем:

27

μ = 9

, σ = 3

, D = σ

2

2

= 9 .

 

= 3

Определяем вероятность попадания СВ

X

в интервал:

8;12

.Используем формулу:

 

β μ

 

α μ

P α X β = Φ

 

 

Φ

 

 

 

σ

 

 

σ

 

лицы 2):

и получаем (значения функции Φ(z) берем из таб-

12 9

 

 

8

9

P 8 X 12 = Φ

 

 

Φ

 

 

= Φ 1 Φ 0.333 =

 

 

 

 

3

 

 

3

 

 

= Φ 1 +Φ 0.333 = 0.159+ 0.371= 0.530

Для определения вероятности того, что СВ

X

отклонится от своего математического

ожидания не более чем на величину

получаем:

2

используем формулу:

 

 

P X μ < = 2Φ

 

 

σ

и

P X

9 < 2 =

 

2

 

2Φ

 

= 2Φ 0.667 =

 

3

 

2 0.251=

0.502

.

Для нахождения правило «трёх сигм» иμ 3σ; μ +3σ Для нахождения

интервала в который попадает 99.74% всех значений СВ используем получаем:

9 3 3;9+3 3 0;18 это и есть искомый интервал.

интервала, симметричного относительно математического ожидания, в

который попадают 50% всех значений СВ используем формулу:

 

 

 

 

P X μ < = 2Φ

. В

 

 

 

 

 

 

 

 

 

 

 

σ

данной формуле нам известна вероятность

P X μ < = 50% = 0.5, среднее квадратическое

отклонение

σ = 3 , и требуется вычислить полуширину искомого интервала . Подставляем

числа

из

 

условия

задачи

и

 

 

откуда

получа-

 

получаем: 0.5 = 2Φ

,

 

 

 

 

 

 

 

3

 

 

 

 

 

0.5

 

 

 

 

 

 

 

 

 

 

ем:

 

= Φ

 

0.25 = Φ

. Используя таблицу значений функции Лапласа (см. табли-

 

 

2

 

3

3

 

 

 

 

 

 

 

цу 2), получаем для выражения в скобках

3

=

0.675

. Откуда получаем:

3 0.675= 2.025 . Находим, наконец, искомый интервал:

μ ; μ + 9 2.025;9+ 2.025 6.975;11.025 .

28

ГЛАВА 4. ВЫБОРОЧНЫЙ МЕТОД. ПОГРЕШНОСТИ ИЗМЕРЕНИЙ

4.1. Выборочный метод. Генеральная совокупность и выборка

Множество объектов, подлежащих статистическому изучению, однородных относительно какого-либо качественного или количественного признака, составляет генеральную совокупность (количество объектов N – объем генеральной совокупности). Исследования, в которых участвуют все без исключения объекты, составляющие генеральную совокупность, называются сплошным исследованием. Однако на практике такие исследования часто невозможны или невыгодны. Обычно применяют выборочный метод для обследования привлекается часть объектов из генеральной совокупности, и по результатам исследования выборки судят о свойствах всей генеральной совокупности. Совокупность объектов, отобранных из генеральной совокупности для статистического исследования, называется выборочной совокупностью или выборкой (количество объектов, попавших в выборку, n – объем выборки). Выборка должна быть представительной, она должна быть произведена случайным образом, при этом каждый объект генеральной совокупности с равной вероятностью может попасть в выборку.

4.2. Статистическое распределение выборки. Полигон и гистограмма

Пусть из генеральной совокупности извлечена выборка объемом n. Количественное значение признака x1 появилось m1 раз, x2 m2 раз, …, xk mk раз. Наблюдаемые значения признака называют вариантами, а последовательность вариант, записанную в порядке возрастания вариационным рядом. m1 , m2 ,…, mk называют частотами, а их отношение к объему n выборки относительными частотами:

p* i

mi

/

n

, при этом

k

n

m

i

 

i 1

 

и

k

*

 

p

i 1

i

 

1

.

Если количественный признак дискретный,

xi и их частоты mi (или относительные частоты

p

то таблица, содержащая значения вариант

*

) называется статистическим дискрет-

i

ным рядом распределения или статистическим распределением выборки:

X

x1

x2

xk

m

m1

m2

mk

Графическое представление дискретного статистического распределения называют по-

лигоном частот (относительных частот):

29

Если признак непрерывный, тогда интервал, в котором заключены все наблюдаемые значения, разбивают на определенное количество (k) частичных интервалов шириной x . таблица, содержащая частичные интервалы и их частоты (или относительные частоты, или плотности относительных частот) называется статистическим интервальным рядом рас-

пределения:

Интервал

[x

; x

)

[x

; x

)

[x

; x

]

1

2

 

2

3

 

k 1

k

 

m

m1

 

m2

 

mk

 

Примечание: Плотность относительной частоты есть результат деления относительной

частоты интервала на его ширину:

pi

p* i

x

. Данная величина используется только для не-

прерывного признака.

Графическое представление интервального статистического распределения называют

гистограммой:

30

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]