Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Обработка эксперим данных Роганов

.pdf
Скачиваний:
23
Добавлен:
22.05.2015
Размер:
1.37 Mб
Скачать

P (k )1

1

ex2 / 2 , x = k np

n

2π

npq

npq

 

Пример. Найти вероятность того, что событие А наступит ровно 70 раз в 243 испытаниях, если вероятность появления этого события в каждом испытании равна 0,25.

Решение. По условию n = 243; k =70; p = 0,25; q = 0,75 . Так как n = 243

достаточно большое число, воспользуемся локальной теоремой Лапласа:

 

 

 

 

 

 

P (k )= 1

ϕ(x)

 

 

 

 

 

 

 

 

n

npq

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где ϕ(x)=

1

x2 / 2

 

k np

. Найдем значение х:

 

2π e

 

, x =

npq

 

 

 

 

x = k np

=

70 243 0,25

=

9,25

=137, .

 

 

 

 

npq

 

 

243 0,25 0,75

 

6,75

 

По таблице находим ϕ(1,37)= 0,1561. Искомая вероятность равна

P243 (70)=1/ 6,75 0.1561 = 0,0231

Однако практически при большом числе испытаний n и не слишком малой вероятности р нас редко интересует вероятность того, что данное событие наступит точно k раз. Важно бывает уметь оценить вероятность того, что число наступлений события лежит в некоторых границах. Такую оценку можно получить с помощью интегральной предельной теоремы Муавра-Лапласа.

Интегральная предельная теорема Муавра—Лапласа. Пусть k – число наступлений события А в серии из n независимых экспериментов, р – вероятность наступления А при каждом испытании, 0<p<1, a и b – любые фиксированные числа, a<b. Тогда

 

 

 

 

 

1

b

 

x2

 

lim P a k np

b

=

e

 

2 dx

n→∞

 

npq

 

 

2π

 

 

 

 

 

 

 

 

a

 

 

 

 

причем стремление к

пределу

равномерно

 

относительно а и b,

−∞ < a < b < +∞.

 

 

 

 

 

 

 

 

 

 

41

Доказательство этой теоремы получим как совсем простое следствие рассмотренной ниже центральной предельной теоремы [9].

Практическое применение интегральной предельной теоремы основано на приближенном равенстве

 

k np

 

 

1

b

x2

 

 

 

 

 

 

 

 

 

e

2

dx

P a

npq

b

2π

 

 

 

 

 

a

 

 

 

Оценка соответствующей погрешности показывает, что эта приближенная формула обеспечивает хорошую точность уже при значениях npq 10 и, естественно, тем лучшую точность, чем больше эта величина.

Рассмотрим некоторые типичные задачи, связанные с интегральной теоремой Муавра—Лапласа.

Заданы число испытаний n и вероятность р при каждом испытании. Требуется найти вероятность того, что число k будет заключено между

заданными числами k1 и k2 ,

0 k1 < k2 n .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k2 np

 

 

 

 

P(k k k

 

 

k np

 

k np

 

k

 

np

 

1

npq

 

x2

 

 

 

 

 

e

2 dx

2

)= P

1

 

 

 

 

 

2

 

 

 

1

 

 

 

npq

 

npq

 

 

 

 

 

2π

 

 

 

 

 

 

 

 

 

 

 

 

 

npq

 

k1 np

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

npq

 

 

 

 

Функция Φ(z)=

1

x

e

z 2

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

dz

называется интегралом ошибок, для нее

2

 

 

 

 

2π

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

составлены

таблицы,

поскольку

Φ(x)= −Φ(x),

значения

 

в таблицах

указаны лишь для x 0 .

Пусть заданы числа р, α и β. Требуется определить, какое наименьшее число n испытаний надо произвести для того, чтобы с вероятностью, не меньшей β, частота k/n появлений отклонялась от вероятности р не больше чем на α. Таким образом, надо найти n из условия

 

 

1

p

 

 

β .

 

 

P

 

n

 

α

 

 

 

 

 

 

 

 

 

Поскольку

42

 

1

 

 

α

n

k np

α

n

 

P

 

p α

= P

 

 

 

 

n

 

 

 

pq

 

npq

 

 

 

 

 

 

 

 

pq

 

 

α

 

 

n

 

 

 

 

 

 

 

1

 

pq

 

x2

 

n

 

 

 

 

 

 

 

π

 

e

2

 

 

 

 

 

 

dx = 2Φ α

pq

2

α

 

 

n

 

 

 

 

 

 

 

 

 

pq

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

то задача состоит в определении n из условия

 

n

 

β

2Φ α

 

 

 

 

 

 

 

pq

 

Пусть заданы числа n, p и β. Требуется определить границы возможных отклонений частоты появления успеха от вероятности р, т.е. надо найти α,

для которого

 

 

1

p

 

 

= β .

 

 

P

 

n

 

α

 

 

 

 

 

 

 

 

 

 

 

Согласно предыдущему примеру

 

k

 

 

n

 

= β

P

 

p α

2Φ α

 

 

n

 

 

 

 

 

 

pq

 

отсюда по таблицам определяем α.

43

Глава 2

Случайные величины и функции распределения § 1. Случайные величины и функции распределения

Изучая схему независимых экспериментов, мы имели дело с типичным примером случайной величины, когда рассматривали число успехов в серии из n испытаний. Примерами случайных величин является: число вызовов в единицу времени на телефонной станции, число молекул газа, продиффундировавших из одного объема газа в другой.

Определение 1. Пусть (Ω, Ξ, Ρ) — вероятностное пространство.

Случайной величиной Х называется однозначная действительная функция X = X (ω), определенная на Ω, для которой множество элементарных событий

вида [ω : X (ω)< x]

является событием (т.е. принадлежит Ξ)

для каждого

действительного числа х.

 

Определение

2. Функция F (x)= P{X < x}, −∞ < x < ∞ ,

называется

функцией распределения случайной величины Х. Примеры.

1. Пусть Х – число успехов в серии из n испытаний Бернулли. Тогда соответствующая функция распределения определена равенством

 

 

0,

x 0

F(x)=

 

n

< x n

 

C k pk qnk , 0

 

 

 

 

 

 

k<x

 

 

 

 

1,

x > n

 

 

2. Если Х распределена по закону Пуассона, то ее функция распределения F(x) имеет вид

0,

 

x < 0,

F(x)=

λk eλ

, x > 0.

k!

k<x

 

Случайная величина Х имеет нормальное, или гауссово, распределение

N(a,σ 2 ), если ее функция распределения имеет вид

44

{αn }

F(x)=

 

1

x (za )2

 

e 2σ 2 dz.

 

σ

2π

−∞

Рассмотрим основные свойства функции распределения.

Для x2 > x1

{X < x2 }= {X < x1}{x1 X x2 }

Поскольку события в правой части этого равенства несовместны, то

P{X < x2 }= P{X < x1}P{x1 X x2 }

следовательно,

P{x1 X x2 }= F (x2 )F (x1 )

Так как P{x1 X x2 }0 , то из последнего равенства следует, что F(x)

– неубывающая функция.

Функция F(x) непрерывна слева, т. е. если — любая последовательность положительных чисел, убывающая к нулю, то

lim F(x an )= F(x)

n→∞

Правое предельное значение F(x) в точке х равно P{X x}, т. е.

F (x + 0)= P{X x}.

2.

F(−∞)= lim F(x)= 0, F()= lim F(x)=1.

 

x→−∞

x→∞

3.Справедливо соотношение ( x1 x2 — любые):

P{x1 X x2 }= F (x2 + 0)F (x1 ) так как {X < x1}{x1 X x2 }= {X x2 }.

В частности, если x2 = x1 = x ,

P{X = x}= F(x + 0) — F(x).

Из этого равенства следует, что F(x) имеет скачки в точках х, для которых существует положительная вероятность события {X=x}.

P{x1 X x2 }= F (x2 + 0)F (x1 + 0)

так как

{X x1}{x1 < X x2 }= {X x2 }

45

и

P{x1 X x2 }= F (x2 )F (x1 + 0)

так как

{X x1}{x1 < X x2 }= {X < x2 }.

§ 2. Дискретные и непрерывные случайные величины

Рассмотренные выше случайные величины, распределенные нормально и по биномиальному закону, являются характерными примерами двух основных классов случайных величин: непрерывных и дискретных [9].

Определение 3. Случайная величина Х называется дискретной, если множество ее значений конечно или счетно.

Для полной вероятностной характеристики дискретной случайной величины, принимающей значения x1 , x2 ,... , достаточно задать вероятности pk = P{X = xk }. Зная значения xk и pk , k=1,2, …, можно записать функцию распределения F(x) дискретной случайной величины Х в виде

F(x)= pk .

k:xk <x

Функция F(x) не зависит от способа нумерации значений случайной величины Х. Таким образом, функция распределения любой дискретной случайной величины разрывна, возрастает скачками в точках x = xk ,

величина скачка равна

F(xk +0)F(xk )= pk .

Определение 4. Случайная величина Х называется непрерывной (или абсолютно непрерывной), если ее функция распределения представима в виде

 

F(x)= x

p(y)dy

 

 

−∞

 

 

Функция

p(y), −∞ < y < ∞ , называется плотностью

распределения

вероятностей

(или плотностью вероятности) случайной

величины Х и

46

далее предполагается неотрицательной и кусочно–непрерывной. Плотность p(y) полностью определяет функцию распределения F(x), а в точках непрерывности p(y) определяется по функции распределения, так как в этих точках

p(x)= dFdx(x),

и, следовательно, в этих точках свойство неотрицательности плотности является следствием неубывания F(x).

Для любых x1 < x2

 

 

 

 

x

 

P(x1 X x2 )= F(x2 )F(x2 )= 2

p(y)dy

 

 

 

 

x1

 

Очевидно, что

 

 

p(y)dy =F(+ ∞)=1

 

−∞

 

 

 

 

 

Примером непрерывной случайной

величины является нормальная

N (α,σ 2 ) случайная величина с плотностью

 

 

 

p(x)=

 

1

e

(xα )2

 

σ

2σ 2

 

 

2π

 

 

 

Следует сказать, что существуют случайные величины, которые не являются ни дискретными, ни непрерывными, ни их комбинацией (имеются в виду случайные величины с функцией распределения вида:

F(x)= q1 pk + q2 x

p(y)dy

k:xk <x

−∞

 

где

 

 

q1, q2 > 0, q1 + q2 =1, pk =1,

p(y)dy =1 ).

k

−∞

 

Это так называемые сингулярные случайные величины. Сингулярные распределения представляют собой некоторую “экзотику” и в реальных задачах практически не встречаются.

47

Все сказанное о функциях распределения автоматически переносится на случай условных вероятностей. Если P(B) > 0, то F(x / B) = P{X < x / B} называется условной функцией распределения случайной величины Х. Она обладает всеми указанными выше свойствами функций распределения.

§3. Векторные (или многомерные) случайные величины

Взадачах со случайным исходом обычно приходится учитывать взаимодействие различных случайных факторов [9]. Это естественно приводит к рассмотрению многомерных случайных величин.

Определение

5.

Пусть

(Ω, Ξ, Ρ) — вероятностное

пространство, и

X1 (ω), X 2 (ω), ..., X n (ω)

— случайные величины, определенные на Ω. Вектор

X (ω)= (X1 (ω), X 2 (ω), ..., X n (ω))

называется

cлучайным

вектором, или n—

мерной случайной

величиной,

а X j (ω),

j

= 1,2,

…,

n,

называются

координатами, или компонентами, случайного вектора Х.

 

 

Так как все

X j (ω), j

=

1,2, …, n,

заданы

на одном

и том же

вероятностном пространстве, а Ξ замкнуто относительно взятия

произведения

конечного

числа

событий,

то

множество

ω : (X1 (ω)< x1, ...,

X n (ω)< xn ) Ξ

для любого набора действительных чисел

x1, ..., xn . Таким образом, имеет место следующее

 

 

Определение 6. Функция

 

 

 

 

F(x1 , x2 ,..., xn )= P(X1 < x1 , X 2

< x2 ,..., X n < xn ), j = 1, 2, …, n,

называется n-мерной функцией распределения случайной величины

 

 

X = (X1, X 2 ,..., X n ).

 

 

Ради наглядности и краткости будем рассматривать двумерные

случайные величины. Геометрически двумерная функция

распределения

F(x,y), равная

 

 

 

 

 

 

F(x, y) = P{X < x, Y < y},

 

 

48

задает вероятность попадания точки (X, Y) в бесконечный прямоугольник X

< x, Y < y.

Перечислим основные свойства двумерной функции распределения

F(x,y):

F(x, y) не убывает по x и по y,

F(x, y) непрерывна слева по каждому аргументу,

F (,)=1, F (−∞, y)= 0, F (x,−∞)= 0

P(x1 X x2 , y1 Y y2 )= F(x2 , y2 )+ F(x1, y2 )F(x2 , y1 )+ F(x1, y1 ).

Пользуясь двумерной функцией распределения, можно найти функции распределения координат Х и Y (так называемые маргинальные распределения):

FX (x)= F(x,), FY (y)= F(, y)

Определение 7. Случайный вектор называется дискретным, если каждая его координата – дискретная случайная величина, и непрерывным, если существует кусочно—непрерывная неотрицательная функция p(x,y), такая, что для любых х и у

x y

F(x, y)= ∫ ∫ p(z1, z2 )dz1dz2

−∞−∞

Функция р(х, у) называется плотностью вероятности случайного вектора (Х, Y).

Плотность вероятности обладает следующими свойствами. В точках непрерывности р(х, у) справедливо равенство

p(x, y)= x2Fy ,

и, таким образом, в этих точках тот факт, что p(x, y)0 , следует из неубывания F(x, y) по каждой переменной х и y.

Для любой квадрируемой области D имеем

P((X ,Y ) D)= ∫∫p(x, y)dxdy

D

49

В

частности, если р(х, у)

непрерывна при x1 x x1 + x ,

y1 y y1 +

y , то с помощью последнего равенства и теоремы о среднем для

интеграла, получим

 

P(x1 X x1 + x, y1 Y y1 + y)= p(x1, y1 ) x y +o( x y)

Вследствие равенства F (,)=1

имеем

p(x, y)dxdy =1

−∞−∞

Если двумерная случайная величина (X,Y) имеет плотность, то и каждая ее компонента имеет плотность, причем

pX (x)= p(x, y)dy, pY (y)= p(x, y)dx

−∞

−∞

Пример. Случайный вектор (X,Y) называется равномерно

распределенным в области D, если

 

p(x, y)= 1/ μ(D), x, y D,

0,

x, y D

где μ(D) — площадь области D.

 

Рассмотрим теперь понятие плотности условного распределения. Пусть плотность р(х, у) случайного вектора (Х, Y) непрерывна. Обозначим через В событие: B = (y Y y + y); его вероятность равна

 

 

y+ y

 

 

 

 

 

P(B) = P(y Y y + y)=

pY (z)dz , где

pY (z)= p(x, z)dx .

 

 

y

 

 

 

−∞

Далее, имеем

 

y+ y

 

 

 

 

 

 

 

x

 

 

 

 

 

P(X < x, y Y y +

y)=

p(t, z)dtdz ,

 

 

 

 

−∞

y

 

 

 

 

 

и, следовательно, в силу определения условной вероятности, если P(B) > 0,

 

 

 

 

 

 

x

y+ y

F (x / B)P(X < x / B)=

P(X < x, y Y y +

y)

 

p(t, z)dtdz

=

−∞ y

 

 

 

 

X

P(B)

 

 

 

y+ y

 

 

 

 

 

pY (z)dz

 

 

 

 

 

 

 

y

50