Загребаев Лектсии по теории вероятностеы и математическоы статистике 2015
.pdfИспользуя связь между плотностью распределения и функцией распределения, получим
|
|
|
x |
|
|
x |
|
|
|
F(x) = f (x)dx = f (x)dx. |
|||||||||
Тогда |
|
|
−∞ |
|
|
α |
|
|
|
|
|
|
|
|
|
|
|
||
x |
|
|
|
x − α |
|
|
|||
|
|
f |
(x)dx = |
, |
α < x ≤ β; |
||||
β − α |
|||||||||
α |
|
|
|
|
(6.2) |
||||
F(x) = |
β |
|
|
|
|
|
|
||
|
|
1 |
|
|
|
|
|
||
|
|
dx = 1, |
x > β. |
||||||
|
|
|
|||||||
β − α |
|||||||||
α |
|
|
|
|
|
||||
|
|
|
|
|
|
|
|||
Числовые характеристики равномерно распределенной случайной величины
Математическое ожидание
|
|
|
|
|
|
+∞ |
|
β |
|
β − α |
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
mx = |
|
xf (x)dx = |
|
x |
1 |
dx = β + α . |
(6.3) |
||||
|
|
|
−∞ |
α |
|
|||||||||
Дисперсия |
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
+∞ |
|
|
)2 |
|
β |
|
|
β + α )2 |
1 |
dx = (β − α)2 . |
|
|
D |
= |
|
(x − m |
x |
f (x)dx = (x − |
(6.4) |
||||||||
|
|
|||||||||||||
|
x |
|
|
|
|
|
|
|
2 |
|
β − α |
12 |
|
|
|
|
−∞ |
|
|
|
|
α |
|
|
|
|
|
|
|
В силу симметрии медиана совпадает с математическим ожиданием, а так как функция плотности распределения не имеет максимума, мода отсутствует.
Для получения вероятности попадания случайной величины в интервал (a, b) можно воспользоваться явным видом функции рас-
пределения (6.2):
P(a < x < b) = F(b) − F(a) = |
b − a |
. |
(6.5) |
|
|||
|
β − α |
|
|
На рис. 6.1. показано, что вероятность попадания случайной величины в заданный интервал есть площадь прямоугольника, огра-
ниченного прямыми x = a и x =b . Из выражения (6.5) видно, что вероятность попадания в интервал (a, b) равна отношению длины
интервала ко всей длине участка (α, β) и не зависит от его месторасположения на этом участке.
51
Закон Пуассона
Закон Пуассона, как мы знаем, выражается формулой
P |
(m) = |
λ me−λ |
. |
(6.6) |
n |
|
m! |
|
|
|
|
|
|
При этом параметр λ мы называли средним значением числа появившихся событий. Математическое ожидание случайной величины, распределенной по закон Пуассона, в соответствии с общим правилом (5.3) нужно определять так:
N
M [X ] = mX = xi P[X = xi ].
i=1
Но случайная величина X в данном случае может принимать только значения x = m = 0,1, 2... , тогда математическое ожидание
есть
∞ |
∞ |
λ |
m |
e |
−λ |
|
|
mx = mPn (m) = m |
|
|
. |
(6.7) |
|||
m=0 |
m=0 |
|
m! |
|
|
||
Можно показать, что mx = λ. |
Таким образом, параметр λ в за- |
||||||
коне Пуассона есть математическое ожидание числа появлений редких (т.е. вероятность каждого отдельного события мала), но массовых (т.е. опытов может быть много) случайных событий. Оказывается, что дисперсия случайной величины тоже равна λ :
∞ |
∞ |
|
m |
−λ |
|
|
D = |
(m − λ)2 Pn (m) = (m − λ )2 |
λ |
e |
|
= λ. |
(6.8) |
m=0 |
m=0 |
|
m! |
|
|
|
Рассмотрим более подробно смысл и условия применимости закона Пуассона на таком примере.
Пример. Пусть в качестве события рассматривается дорож- но-транспортное происшествие в городе Москве. Чтобы можно было применить закон Пуассона для определения вероятности заданного количества ДТП за определенный период времени, должны соблюдаться следующие условия:
вероятность количества ДТП за время τ зависит только от величины этого промежутка времени τ и не зависит от того, в каком месте временнóй оси этот промежуток времени находится. То есть вероятность того или иного числа ДТП в течение часа не
52
зависит от того, будет это в интервале, например, 8.00−9.00 или
20.00−21.00;
число ДТП за интервал τ не зависит от того, сколько ДТП произошло за предыдущий интервал τ;
вероятность двух и более ДТП за практически малый промежуток времени пренебрежимо мала по сравнению с вероятностью одного ДТП в этот промежуток. (Опытные водители сразу скажут, что это не совсем так и приведут массу примеров из своего опыта, но если под ДТП мы понимаем не количество столкнувшихся машин, сам факт происшествия, то наше приближение справедливо.)
Пусть в среднем в Москве за сутки происходит 240 ДТП. Понятно, что за один час это число будет равно 10. Вероятность этого события легко подсчитать с помощью функции Пуассона в Exel. Она равна P(10) = 0,125. Определим вероятность того, что
за час произойдет ровно в два раза большее число |
ДТП, т.е. |
20 ДТП. Значит, в условиях этого примера λ = 10, а |
m = 20. Ис- |
пользуя функцию Пуассона в Excel, получим P(20) = 0,0018. Отме-
тим, что по сводкам ГИБДД за 29.01.07 отмечается, что число ДТП было равно 641, т.е. более чем в два раза превосходило среднее число за сутки.
Вероятность события существенно увеличивается, если мы хотим знать вероятность появления числа ДТП из некоторого интервала. Например, вероятность того, что за час произойдет от
9 до 11 ДТП, есть P(9 ≤ m ≤ 11) = P(9) + P(10) + P(11) = 0,363.
Показательный закон распределения
Показательным называется закон распределения случайной величины, в данном случае обозначим ее t, имеющий плотность вероятности вида:
|
−λ t |
, t ≥ 0; |
|
λe |
|
(6.9) |
|
f (t) = |
t < 0. |
||
0, |
|
||
|
|
|
|
Показательным распределением описывается довольно большой круг задач: от задач надежности до задач ядерной физики.
Применительно к бизнесу можно привести такой пример. Понятно, что ни одна из компаний не застрахована от банкротства (не
53
имеется в виду страхование страховой кампанией). Пусть вероятность банкротства компании в единицу времени не зависит от вре-
мени существования компании и равна λ. Тогда вероятность банкротства за время dt есть λ dt. Пусть P(t) − вероятность того, что
компания не обанкротилась за время t своего существования. Тогда событие, состоящее в том, что компания обанкротится именно в интервал времени от t до t + dt есть произведение событий C = A B. Событие A заключается в том, что компания не обанкротится к моменту времени t, а событие B заключается в том, что за время dt компания обанкротится. По теореме умножения вероятностей для независимых событий получим, что вероятность того, что компания обанкротится в интервале времени dt вслед за моментом времени t есть P(t)λdt. Понятно, что изменение вероятности не
обанкротится за время от t до t + dt есть P(t + dt) − P(t) = dP. И эта
величина, в свою очередь, равна вероятности банкротства фирмы в интервал времени (t, t + dt). То есть
dP = −λ P(t)dt. |
(6.10) |
Знак «минус» в выражении (6.10) стоит потому, что dP − отри-
цательная величина. |
|
Если обе части выражения (6.10) разделить на dt ≠ 0, |
то получим |
дифференциальное уравнение первого порядка |
|
dP = −λ P(t) |
(6.11) |
dt |
|
с начальным условием P(0) = 1, поскольку обанкротится в самый
момент начала работы невозможно.
Легко проверить, что решением данного уравнения с учетом начального условия является функция P(t) = e−λ t . Таким образом, вероятность избежать банкротства за время t со дня основания есть
P(t) = e−λ t . |
(6.12) |
Вероятность обанкротится, соответственно, будет |
F(t) = |
= 1− P(t) = 1− e−λ t . Функция F(t) в данном случае есть функция распределения вероятности банкротства. Тогда плотность вероятно-
54
сти банкротства есть f (t) = dFdt = λ e−λ t . Таким образом, примени-
тельно к данному примеру выражение (6.9) описывает плотность вероятности банкротства.
Математическое ожидание случайной величины T, |
распреде- |
||||||||
ленной по показательному закону есть |
|
|
|
||||||
|
+∞ |
+∞ |
1 |
|
|
||||
M [T ]= mt = t f (t)dt = t λ e−λ t dt = |
. |
(6.13) |
|||||||
|
|||||||||
|
−∞ |
0 |
|
|
λ |
|
|||
|
|
|
|
|
|
||||
По своему смыслу m = |
1 |
есть среднее время жизни кампании. |
|||||||
|
|||||||||
t |
|
λ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Легко показать, что дисперсия случайной величины T есть |
|
||||||||
D[T ] |
∞ |
|
1 |
|
|
|
|
||
= (t − mt )2 f (t)dt = |
. |
|
|
(6.14) |
|||||
2 |
|
|
|||||||
|
0 |
|
λ |
|
|
|
|||
|
|
|
|
|
|
|
|||
Геометрическая интерпретация показательного закона распределения приведена на рис. 6.3.
Рис. 6.3. Плотность распределения показательно распределения
Площадь заштрихованной области есть вероятность компании распасться за время от t1 до t2 , то есть F(t1) − F(t2 ) = e−λ t1
Лекция 7 . НОРМАЛЬНЫЙ ЗАКОН РАСПРЕДЕЛЕНИЯ
Нормальный (гауссов) закон распределения случайных величин играет особую роль. Во-первых, это наиболее часто встречающийся на практике закон распределения. Данное обстоятельство объясня-
55
ется тем, что большинство случайных величин представляют собой сумму большого числа независимых случайных величин, влияние каждой из которых мало. Предельные теоремы теории вероятностей, о которых мы будем говорить ниже, доказывают, что вне зависимости от того, по какому закону распределено каждое из слагаемых суммы, закон распределения суммы будет близок к нормальному. Это приводит, например, к тому, что ошибки измерения подчиняются нормальному закону. Нормальному закону подчиняются
ипараметры человеческого тела, если мы будем рассматривать их как случайные величины (сумма ошибок природы!). Например, рост человека или его вес. На рис. 7.1 приведены данные о росте юношей
идевушек − студентов ИИМ, которым я читал лекции в осеннем семестре.
Рис. 7.1. Гистограммы распределения студентов ИИМ по росту
Из рисунка видно, что гистограмма имеет «колоколообразный» вид. Нормальный закон распределения характеризуется функцией плотности распределения вида
|
1 |
|
− |
(x−mx )2 |
|
|
f (x) = |
|
e |
2σ2 |
|
||
|
|
x . |
(7.1) |
|||
σx |
2π |
|||||
|
|
|
|
Можно показать, что mx есть ничто иное, как математическое ожидание, а σx − среднее квадратическое отклонение случайной
величины X.
Поведение плотности распределения в зависимости от параметров mx и σx показано на рис. 5.2.
Из рисунка видно, что изменение математического ожидания приводит к сдвигу максимума функции, а изменение дисперсии − к
56
её «уширению» либо «сужению», при росте или уменьшении σ соответственно.
Функция распределения случайной величины X, распределенной по нормальному, закону есть
x |
|
|
1 |
|
x |
− |
( x−mx ) |
|
F(x) = |
f (x)dx = |
|
|
e |
|
2σ2x dx. |
(7.2) |
|
σ |
x |
2π |
|
|||||
−∞ |
|
−∞ |
|
|
|
|||
|
|
|
|
|
|
Вероятность попадания случайной величины в заданный интервал
Найдем вероятность попадания случайной величины X на участок от α до β. Согласно формуле
P(α < X < β) = F(β) − F(α) ,
|
|
|
1 |
|
β − |
(x−mx ) |
|
|
|
|
1 |
|
|
|
α − |
(x−mx ) |
|
|
|
|||||||||
F(β) − F(α) = |
|
|
|
e |
|
2σ2x |
dx − |
|
|
|
|
|
e |
2σ2x |
dx = |
|
||||||||||||
σ |
x |
|
2π |
|
σ |
x |
|
2π |
|
|||||||||||||||||||
|
|
−∞ |
|
|
|
|
|
|
|
|
|
|
−∞ |
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
1 |
|
|
β − ( x−mx ) |
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
= |
|
|
|
|
|
e |
|
2σ2x |
dx. |
|
|
|
|
|
|
(7.3) |
|||||||
|
|
|
|
|
|
σ |
x |
|
|
2π |
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
α |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x − mx |
|
|||||
Сделаем замену переменных в выражении (7.3) t = |
, тогда |
|||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||
легко показать, что |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
σx 2 |
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
β−mx |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
β−mx |
|
|
|
|
|
|||||
|
σx |
2 |
−t2 |
|
|
|
|
|
1 |
|
|
0 |
|
|
−t |
2 |
|
|
σ x |
2 |
−t2 |
|
|
|
||||
P(α < X < β) = |
|
|
|
|
|
|
|
|
|
|
|
|
|
+ |
|
|
|
|
||||||||||
e |
|
dt |
= |
|
|
|
|
|
e |
|
|
dt |
e |
|
|
dt |
= |
|||||||||||
|
|
π |
|
|
|
|
|
|||||||||||||||||||||
|
α−mx |
|
|
|
|
|
|
α−mx |
|
|
|
|
|
0 |
|
|
|
|
|
|
||||||||
|
σ |
x |
2 |
|
|
|
|
|
|
|
|
σ |
x |
2 |
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
β−mx |
|
|
|
α−mx |
|
|
|
|
|
1 |
|
2 |
σx |
2 |
−t2 |
|
2 |
σx 2 |
|
−t2 |
|
|
|
|
|
|
|
|
|
|||||
= |
2 |
|
|
e |
|
dt − |
|
e |
|
dt . |
||
π |
|
π |
|
|||||||||
|
|
0 |
|
|
|
0 |
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Выражение (7.4) можно переписать короче, если ввести смотрение так называемую функцию Лапласа
(7.4)
в рас-
57
|
2 |
x |
|
Φ(x) = |
e−t2 dt, |
||
|
|||
|
π |
||
|
|
0 |
|
вид которой показан на рис. 7.2.
Рис. 7.2. Функция Лапласа |
|
|
|
||||||
Из рисунка видно, что |
|
|
|
|
|
|
|
|
|
Φ(0) = 0; Φ(− x) = −Φ(x); Φ(+∞) = 1; |
Φ(−∞) = −1; |
||||||||
|
1 |
|
|
β − mx |
|
|
α − mx |
|
|
P(α < X < β) = |
|
|
|
|
|
|
|||
|
Φ |
|
|
− Φ |
|
|
. |
||
|
|
|
|||||||
|
2 |
|
|
σx 2 |
|
|
σx 2 |
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
(7.5)
(7.6)
На рис. 7.3 показан геометрический смысл этого выражения как заштрихованной площади под колоколообразной кривой, ограниченной прямыми x = α и x = β.
Рис. 7.3. Геометрический смысл вероятности попадания случайной величины в заданный интервал
58
Вероятное отклонение. Правило 3σ
Часто требуется найти такой интервал 2E около математического ожидания, вероятность попадания в который равна заданной
величине, например ε. Для нахождения этой вероятности восполь-
зуемся соотношением (7.6) в |
котором положим |
α = mx − E; |
||
β = mx + E. Тогда после несложных преобразований, получим |
||||
|
E |
|
|
|
ε = Φ |
|
|
. |
(7.7) |
|
|
|||
|
σx |
2 |
|
|
|
|
|
||
Для заданного ε по таблицам функции Лапласа находим аргу-
|
E |
|
E |
|
|
|
|
E |
= γ, то- |
мент |
при котором Φ |
|
= ε. |
Допустим, |
|
||||
|
|
|
|
||||||
|
σx 2 |
|
σx |
|
|
|
|
σx 2 |
|
|
|
2 |
|
|
|||||
гда E = γσx |
2. Например, пусть ε = 0,5, |
тогда по таблицам Лапла- |
|||||||
са находим |
γ = 0,477 и, следовательно, |
E = 0,675σx . Таким обра- |
|||||||
зом, с вероятностью 50 % значения случайной величины X, подчи- |
|||||||||
ненной нормальному закону попадают в интервал |
(mx − 0,675σx , |
||||||||
mx + 0,675σx ). Величина E = 0,675σx при этом называется вероят-
ным отклонением.
Поставим теперь задачу по-другому. Пусть требуется определить вероятность попадания в заданный интервал E, симметричный около математического ожидания. Будем измерять E в единицах среднего квадратического отклонения. Тогда получим
E = σx ; P(mx − σx < X
P(mx − 2σx < X < mx
P(mx − 3σx < X < mx
|
|
|
|
|
σx |
|
|
|
|
|
|
|
|
1 |
|
|
|
||||
< mx + σx ) = Φ |
|
|
|
|
|
|
|
= Φ |
|
|
|
|
|
|
= 0,677; |
||||||
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
σx |
2 |
|
|
|
|
|
|
2 |
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
E = 2σx ; |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
2σ |
x |
|
|
|
|
|
|
|
2 |
|
|
|
|
|||||||
+ 2σx ) = Φ |
|
|
|
|
|
= Φ |
|
|
|
|
|
|
|
|
= 0,953; |
||||||
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
σx |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
2 |
|
|
|
|
|
2 |
|
|
||||||||||
E = 3σx ; |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
3σ |
x |
|
|
|
|
3 |
|
|
|
|
||||||||||
+ 3σx ) = Φ |
|
|
|
= Φ |
|
|
|
|
|
|
|
|
= 0,997. (7.8) |
||||||||
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
2 |
|
|
|
|
2 |
|
|
|
|||||||||
σx |
|
|
|
|
|
|
|
|
|
|
|
||||||||||
59
Из выражения (7.8) видно: с вероятностью почти единица значение случайной величины попадет в интервал (mx − 3σx ,
mx + 3σx ). Иначе говоря, при нормальном законе распределения
почти все значения случайной величины не уклоняются от математического ожидания больше, чем на 3σx . Отсюда следуют такие
практические выводы:
1. Если известно, что случайная величина распределена по нормальному закону и дано некоторое множество ее значений, то σx
приблизительно можно определить, разделив разницу между мак-
симально удаленным значением и средним на 3, т.е. σx ≈ xmax − x . 3
2. По множеству значений случайной величины приближенно
|
N |
|
N |
|
|
(xi − x)2 |
|
xi |
|
находят σx ≈ |
i=1 |
, где x = |
i=1 |
. |
N − 1 |
|
|||
|
|
N |
||
Если самая удаленная точка отличается от среднего значения не более чем на 3σx , то закон распределения можно принять за нор-
мальный (конечно, в дальнейшем следует провести дополнительные исследования).
Пример. Фирма производит молодежную женскую обувь. Для успешной продажи нужна информация о размерах, требующихся покупателям. Размер ноги у молодого поколения, считаем нормально распределенным со средним значением 37 и стандартным отклонением 1,5 размера. Какая часть девушек имеет размер между
40 и 42?
Покажем, как с помощью программы Excel построить нормальный закон распределения с данными числовыми характеристиками,
азатем решим поставленную задачу.
1.Введем метки x и f (x) в ячейки A1 и B1.
2.Введем в столбец A численные значения. Начнем с минималь-
ного размера |
mx − 3 σx = 37 − 4,5 = 32,5 и будем прибавлять по |
0,1 σx = 0,15. |
Введем число 31.0 в ячейку A2 и 31.15 в ячейку A3. |
Выделим ячейки A2:A3, щелкнем по маркеру заполнения в нижнем правом углу выделенной области и перетащим к ячейке A81.
60
