
- •ПРЕДИСЛОВИЕ
- •ВВЕДЕНИЕ
- •§ 1. СЛУЧАЙНЫЕ СОБЫТИЯ И ИХ ВЕРОЯТНОСТИ
- •1.1. Понятие случайного события
- •1.2. Вероятность случайного события
- •1.3. Алгебра событий
- •1.4. Основные свойства вероятности
- •1.5. Классическая модель вероятности
- •§ 2. УСЛОВНАЯ ВЕРОЯТНОСТЬ. НЕЗАВИСИМОСТЬ. ФОРМУЛА БАЙЕСА
- •2.1. Условная вероятность
- •2.2. Независимые события
- •2.3. Формула полной вероятности
- •2.4. Формула Байеса
- •3.2. Дискретное вероятностное пространство
- •§ 4. НЕКОТОРЫЕ ДОПОЛНЕНИЯ И ПРИМЕРЫ
- •4.1. Обобщенная теорема умножения
- •4.2. Примеры
- •§ 5. ЭЛЕМЕНТЫ КОМБИНАТОРИКИ
- •5.1. Основные определения
- •5.2. Основное правило комбинаторики
- •5.3. Размещения, перестановки, сочетания
- •5.4. Примеры
- •§6. ИСПЫТАНИЯ БЕРНУЛЛИ. ФОРМУЛА ПУАССОНА
- •6.1. Схема независимых испытаний Бернулли
- •6.2. Обобщенная схема Бернулли
- •6.3. Некоторые следствия
- •6.4. Формула Пуассона
- •§ 6д. Приложения
- •6д.1. Доказательство теоремы Пуассона
- •6д.2. Теорема Муавра–Лапласа и ее приложения
- •6д.3. Последовательности зависимых испытаний. Цепи Маркова
- •§ 7. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ
- •7.1. Основные понятия и определения
- •7.3. Дисперсия
- •7.4. Независимые случайные величины

вероятностью p = 0.7 . Найти наиболее вероятное число m0 людей, которые придут на собрание, и соответствующую вероятность Pn (m0 ) .
Решение. Поскольку P50 (m0 ) =C50m0 (0,7)m0 (0,3)50−m0 , то задача состоит в отыскании неотрицательного целого числа m0 ≤50 ,доставляющего максимум функции P50 (m0 ) . Мы видели выше, что такое число дается формулой (6.4). В
нашем случае n =50, p = 0.7 . |
Подставляя эти |
значения в (6.4), получим: |
51 0.7 −1< m0 ≤51 0.7 , т.е. |
34.7 < m0 <35.7 , |
и m0 =35 . Вероятность |
P50 (35) =C5035 (0.7)35 (0.3)15 ≈ 0.123.
6.4. Формула Пуассона
Формулы (6.1) и (6.3) дают точныезначениявероятностей, связанных со схемой независимых испытаний Бернулли. Однако вычисления по этим формулам, особенно при больших значениях n и m, весьма затруднительны. Представляет большой практический интерес получение достаточно простых приближенных формул для вычисления соответствующих вероятностей. Впервые подобную формулу вывел в 1837 году французский математик и физик Симон Пуассон (1781–1840). Ниже дается формулировка результата Пуассона.
Рассмотрим схему независимых испытаний Бернулли, в которой число испытаний n «относительно велико», вероятность «успеха» p «относительно мала», а произведение λ = np «не мало и не велико»41. При этих условиях справедлива формула
b(k; n, p) ≈ |
λk |
e−λ, λ = np . |
(6.6) |
|
k! |
|
|
Это – знаменитое пуассоновское приближение для биномиального распределения. Доказательство формулы (6.6) будет дано в дополнении к настоящему параграфу.
41 Точный смысл взятых в кавычки терминов будет объяснен ниже, в частности, в § 6д.
90
Функция, стоящая в правой части формулы (6.6), называется
распределением Пуассона:
p(k, λ) = |
λk |
e-λ; k = 0,1,2,...; λ > 0. |
(6.7) |
|
k! |
|
|
При таком обозначении p(k, λ) будет приближенным выражением для вероятности b(k; n, λn), когда n «достаточно велико».
Прежде, чем обсуждать формулу (6.6), приведем весьма показательные примеры ее использования.
Значения биномиального распределения и значения распределения Пуассона при n =100, p = 0.01, λ =1 представлены в табл. 6.2. Как мы видим, точность приближенной формулы достаточно высока.
Чем больше n, тем выше точность формулы Пуассона. Это наглядно представляет следующий пример. Вычислим вероятность pk того, что в обществеиз500человекровно k человекродилисьводинитотжеконкретный день года. Если эти 500 человек выбраны наугад, то можно применить схему Бернулли из n =500 испытаний с вероятностью «успеха» p =1365 . Вычисления по точной формуле (6.1) и приближенной формуле (6.6) при λ =500
365≈1,3699 представлены в табл. 6.3. Как мы видим, ошибка лишь в четвертом десятичном знаке, что вполне приемлемо для практики.
|
|
|
Таблица 6.2 |
|
|
|
|
k |
b (k; 100, 1.100) |
|
p (k; 1) |
|
|
|
|
0 |
0,366032 |
|
0,367879 |
|
|
|
|
1 |
0,369730 |
|
0,367879 |
|
|
|
|
2 |
0,184865 |
|
0,183940 |
|
|
|
|
3 |
0,060999 |
|
0,061313 |
|
|
|
|
4 |
0,014942 |
|
0,015328 |
|
|
|
|
5 |
0,002898 |
|
0,003066 |
|
|
|
|
6 |
0,000463 |
|
0,000511 |
|
|
|
|
|
|
91 |
|

7 |
0,000063 |
0,000073 |
|
|
|
8 |
0,000007 |
0,000009 |
|
|
|
9 |
0,000001 |
0,000001 |
|
|
|
Таблица 6.3.
|
k |
b(k; 500,1/ 365) |
p(k, λ) |
|
|
|
|
|
|
|
0 |
0,2537 |
0,2541 |
|
|
|
|
|
|
1 |
0,3484 |
0,3481 |
|
|
|
|
|
|
|
2 |
0,2388 |
0,2385 |
|
|
|
|
|
|
|
3 |
0,1089 |
0,1089 |
|
|
|
|
|
|
|
4 |
0,0372 |
0,0373 |
|
|
|
|
|
|
|
5 |
0,0101 |
0,0102 |
|
|
|
|
|
|
|
6 |
0,0023 |
0,0023 |
|
|
|
|
|
|
|
Рассмотрим следующий типичный пример на применение формулы |
||||
Пуассона. |
|
|
|
Пусть известно, что вероятность «сбоя» в работе телефонной станции при каждом вызове равна 0,002. Поступило 1000 вызовов. Определить вероятность того, что при этом произойдет 7 «сбоев».
Решение. Естественно предположить, что в обычных условиях вызовы, поступающие на телефонную станцию – независимы друг от друга. Будем считать «успехом» в испытании – вызове – сбой телефонной станции. Вероятность сбоя ( p = 0,002 ) можно считать «достаточно малой» величиной, а число вызовов ( n =1000 ) – «достаточно большим». Таким образом, мы находимся в условиях теоремы Пуассона. Для параметра λ получаем значение
λ = 0,002 1000= 2 . Поэтому, |
по |
формуле Пуассона, получаем для |
интересующей нас вероятности числа сбоев величину |
||
p(7, 2) = |
27 e−2 |
≈ 0,0034 . |
|
7! |
|
Обсудим теперь пределы применимости формулы Пуассона. При
92

использовании любой приближенной формулы вопрос о пределах ее применимости возникает естественным образом. При этом мы встречаемся с двумя аспектами проблемы. Во-первых, закономерен вопрос о том, в каких реальных условиях применим закон Пуассона? Опыт показывает, что простое распределение Пуассона обладает сравнительно универсальной применимостью. Вообще, с точки зрения применений, математические теоремы бывают хорошими и плохими в следующем смысле: хорошие теоремы продолжают действовать, если даже нарушить их условия, а плохие сразу перестают быть верными при нарушении условий их вывода. Теорема Пуассона (6.6) является в этом смысле хорошей и даже превосходной. Именно, закон Пуассона продолжает действовать даже тогда, когда условия схемы Бернулли нарушаются (т.е. можно допускать переменную вероятность успеха и даже не слишком сильную зависимость результатов отдельных испытаний)42. Можно даже утверждать, что распределение Пуассона обладает сравнительно универсальной применимостью. Это надо понимать в том смысле, что если экспериментальные данные показывают, что закон Пуассона неприменим, в то время как, сообразно со здравым смыслом, он должен был бы действовать, то естественнее подвергнуть сомнению статистическую устойчивость наших данных, чем искать какой-то другой закон распределения.Инымисловами,распределениеПуассонапредставляетсобой очень удачную математическую формулировку одного из универсальных (в рамках применимости теории вероятностей) законов природы.
Во-вторых, возникает вопрос о порядках величин тех параметров, которые входят в формулу Пуассона, и для которых выше мы использовали расплывчатые термины «относительно велико», «относительно мало», «не малоиневелико».Опятьже,разъясняющиеответыдаетпрактикаприменения формулы (6.6). Оказывается, что формула Пуассона достаточно точна для практического применения, если число испытаний n имеет порядок
42 Естественно, этими особенностями распределения Пуассона не следует злоупотреблять. Например, закон Пуассона заведомо нарушается в ситуациях сильной зависимости результатов отдельных испытаний.
93

нескольких десятков (лучше – сотен), а величина параметра λ = np лежит в пределах от 0 до 10.
Для иллюстрации применения формулы Пуассона, рассмотрим еще один пример.
Пусть известно, что на выпечку 1000 сладких булочек с изюмом полагается 10 000 изюмин. Требуется найти распределения числа изюмин в какой-то случайным образом выбранной булочке.
Решение. Последовательность независимых испытаний мы формируем следующим образом. Всего будет n =10 000 испытаний (по числу изюмин), а именно: испытание с номером k будет состоять в том, что мы определяем, попалалиизюминасномеромk внашуслучайновыбраннуюбулочку43. Тогда, поскольку всего булочек 1000, вероятность того, что k-я изюмина попала именно в нашу булочку, есть p =1/1000 (при условии достаточно хорошего перемешивания теста при приготовлении булочек). Применяем теперь распределение Пуассона с параметром λ = np =10000 11000=10. Получим:
P10000 (k) ≈ p(k,10) =10k e−10 .
k!
В частности, вероятность того, что нам достанется булочка вовсе без изюма (k = 0) , равна e−10 ≈ 0,5 10−4 . Наиболее вероятное число изюмин будет, согласно формуле (6.4), равно 10. Соответствующая вероятность
P10000 (10) ≈1010 e−10 ≈ 0,125 . 10!
Пример с булочками и изюминами, несмотря на его приземленную формулировку, носит весьма общий характер. Так, вместо изюмин в булочках можно говорить, например, о числе бактерий в капле воды, взятой из хорошо перемешанного ведра. Другой пример. Предположим, что атомы радиоактивного вещества распадаются независимо друг от друга, причем в течение данного интервала времени распад данного атома происходит с
43 Заметим, что на покупку булочки в магазине вполне можно смотреть как на случайный выбор.
94