
- •Глава 3. Формула Бернулли. Математическое ожидание и дисперсия дискретной случайной величины
- •Случайная величина. Распределение вероятностей
- •Общий вид статистического ряда значении дискретной случайной величины и вероятностей ее появления
- •Статистический ряд вероятностей всех возможных значений при т попаданиях и остальных промахах в серии из 10 выстрелов
- •Математическое ожидание и дисперсия, их свойства
- •Математическое ожидание и дисперсия при биномиальном законе распределения
- •2. Распределение Пуассона
Математическое ожидание и дисперсия при биномиальном законе распределения
Биномиальное распределение иногда называют альтернативным, потому что в результате каждого испытания результат может быть только «да» или «нет» – успех или промах с постоянной вероятностью, соответственно p и q=1-p. Запишем таблицу распределения значений дискретной случайной величины Х при одном испытании, т.е. при n=1. Закодируем успех как значение 1 этой случайной величины, а промах как 0:
-
хi
0
1
pi
q
p
В любом испытании с номером i (в примере со стрельбой – при любом выстреле) математическое ожидание элементарного события по определению есть Мхi = 0·q + 1·р = р, т.е. элементарная вероятность – промежуточная величина между двумя крайними значениями случайной величины: промах (0) – успех (1)
М(Х2) =02· q + 12· р = р;
DX = М(Х2) - (МX)2 = р - р2 = р(1 - р) = рq.
Пусть теперь случайная величина Х означает число успехов в п независимых испытаниях. Поскольку у нас испытания проводятся по схеме Бернулли, то при каждом испытании вероятность успеха р одинакова, все они независимы друг от друга, и потому вероятности надо сложить или, что то же самое, вероятность успеха умножить на п
МХ =
=
np (3.12)
Пояснение. По 4-му свойству: МХ1 + МХ2 + …+ МХп = р+р+…+р = пр, где Х1, Х2,…,Хп – одинаковые события в различных испытаниях, означающие один успех, который численно характеризуется случайной величиной р. Формулу (3.12) называют формулой наивероятнейшего числа успехов.
Аналогично суммируем равные дисперсии каждого независимого испытания:
DX
=
=
npq (3.13)
Полученные формулы легко запоминаются и удобны для решения многих задач со схемой Бернулли. Они будут использованы ниже, в Лекции 4, при переходе к формулам для нормального распределения непрерывных величин, а также в задачах на «правило трех сигм».
Пример 2. Пусть n = 4, p = 0,3, тогда np = 1,2Þ МХ= m0 = 1. В случае, подобном рассмотренному выше со стрелком, это означает, что в серии из 4-х выстрелов с вероятностью попадания 0,3 наиболее вероятным событием будет один успех. Можно ожидать (экстраполировать), что если стрелок проводит, например, 10 серий из 4-х выстрелов, или, иначе говоря, серию из 40 выстрелов, то при p = 0,3, m0 = 12, т.е. вероятнее всего успехов будет 12.
Пример 3. Пусть по многолетним метеосводкам вероятность заморозков 3 мая в данной местности р = 0,227. Найти наивероятнейшее число дней с заморозками 3 мая: а) за 10 лет; б) за 30 лет.
а) m0 » 0,227 × 10 » 2; б) m0 » 0,227 × 30 » 7.
2. Распределение Пуассона
Пусть
некоторое явление исследуют путём
многократных испытаний или измерений
n
раз. Пусть при этом элементарные «успехи»
наступают редко и характеризуются
дискретной случайной величиной m,
так что элементарная вероятность
(тогда говорят о простейшем или
пуассоновском потоке событий). Если n
велико (
),
то применять формулу Бернулли (3,1)
неудобно из-за больших факториалов n!.
Однако, если
,
то её можно сильно упростить. Это делается
путём следующего предельного перехода,
который впервые применил великий
французский физик и математик Симеон
Пуассон (1781-1840).
Введём
новое обозначение для наивероятнейшего
числа “успехов”
,
которое принято называть параметром
Пуассона. Подставим
в формулу Бернулли.
(3.14)
Перейдём к пределу при , вынеся за знак предела величины, не зависящие от n.
(3.15)
Первая
дробь после лимита стремится к 1, так
как при
можно пренебречь числом «успехов» m
в числителе; тогда в нем n
будет повторено m
раз как множитель и сократится со
знаменателем. Во второй дроби после
лимита в числителе появится
(это второй замечательный предел со
знаком минус). В знаменателе же этой
дроби останется 1, так как
.
После таких кардинальных упрощений
сложная вероятность числа «успехов»
будет выражаться по следующей формуле
Пуассона,
которая называется также распределением
Пуассона.
(3.16)
Замечание:
Если бы элементарная вероятность
была любая, а не весьма малая, то нельзя
было бы выносить за знак предела
и проводить сделанные сокращения
после
знака лимита.
Математическое
ожидание, дисперсия и СКО случайной
величины
,
распределенной по закону Пуассона,
равны:
;
D
;
(приводим без вывода, который можно
найти в любом курсе по ТВ и МС).
Рис. 3.2. Распределение Пуассона при значениях параметра 1; 3; 5 (это вероятнейшие числа “успехов”; они даны здесь при п =100 и p =0,01; p = 0,03; p = 0,05 соответственно.
На
графиках видно, как при увеличении
параметра
происходит симметризация распределения.
При
9 или 10 распределение Пуассона практически
не отличается от нормального распределения
(см. Лекцию
4).
Пример 4. В сейсмически опасном районе число толчков за 10 лет равно примерно 5000. При этом разрушительное землетрясение было 1 раз. Сейсмоустойчивые здания строят так, что они способны выдержать 3 землетрясения без капитального ремонта.
Найти: вероятность трех разрушительных толчков за 10 лет.
Решение.
Формализуем задачу: n
= 5000;
.
.
Ответ:
;
иначе говоря, здания, скорее всего,
простоят 30 лет, так как вероятность трех
разрушительных толчков за 10 лет весьма
мала.
Пример
5. Дано:
Количество дефектов в конструкционном
материале подсчитывают под микроскопом
с помощью сетки, состоящей из 164 равных
клеток. Подсчет дал среднее значение
дефектов на клетку. Наблюдавшиеся
частоты по числам дефектов в одной
клетке приведены в 3-м столбце Таблицы
3.1.
Найти: (а) теоретические частоты по формуле Пуассона и вписать их в 4-ый столбец таблицы; (б) после изучения темы о проверке статистических гипотез (Глава 8) вернуться к данному примеру и показать, что с вероятностью 99,5 % данные 3-го и 4-го столбцов совпадают и, различаются незначимо, следовательно, распределение числа дефектов подчиняется закону Пуассона.
Решение.
Найдём сначала, например, в скольких
клетках из 164 должно теоретически
появляться по 6 дефектов, если последние
распределены по закону Пуассона. Учтём,
что это абсолютная частота
.
По формуле (3.16) получим:
.
Далее вычислим все частоты появления дефектов от 0 до 19 в расчете на 1 клетку и поместим их в 4-й столбец таблицы.
Таблица 3.1
№ разряда |
Число дефектов в одной клетке сетки |
Абсолютные частоты |
mi - mi* |
|
|
Наблюдаемые mi* |
Ожидаемые для распределения Пуассона mi |
||||
(1) |
(2) |
(3) |
(4) |
(5) |
(6) |
1 |
1 2 |
2 7 1 4 |
9,0 2,13 6,57 |
2,04 |
0,46 |
2 |
3 |
7 |
13,51 |
6,51 |
3,14 |
3 |
4 |
20 |
20,84 |
0,84 |
0,03 |
4 |
5 |
34 |
25,37 |
8,63 |
2,94 |
5 |
6 |
30 |
26,44 |
3,56 |
0,48 |
6 |
7 |
17 |
23,31 |
6,31 |
1,71 |
7 |
8 |
22 |
17,98 |
4,02 |
0,89 |
8 |
9 |
21 |
12,32 |
8,68 |
6,11 |
9 |
10 |
|
|
|
|
10 |
11 |
2 |
4,26 |
|
|
11 |
12 |
0 |
2,19 |
|
|
12 |
13 |
1 |
1,04 |
|
|
13 |
14 |
0 |
0,46 |
9,01 |
5,07 |
14 |
15 |
7 0 |
16,0 0,30 |
|
|
15 |
16 |
0 |
0,11 |
|
|
16 |
17 |
0 |
0,04 |
|
|
17 |
18 |
0 |
0,01 |
|
|
18 |
19 |
0 |
0,00 |
|
|
|
* * *
Для специалистов, связанных с анализом вещественного состава (химиков, материаловедов, геологов, почвоведов, экологов, биологов, медиков) существенно, что все виды весьма популярного метода полуколичественного (п/к) анализа (или экспресс-анализа по международной терминологии) подчиняются распределению Пуассона. Разберём подробно это положение (которое малоинтересно чистым математикам, но важно для многих прикладных специальностей).
Результаты п/к анализа представляют согласно довольно грубой шкале для дискретных случайных величин, которые обычно есть содержания различных химических элементов или фаз. Результаты считаются удовлетворительными, если экспериментальные значения отличаются от истинных (полученных контрольным методом) не более чем в заданное число раз, допустим, в 3 раза. Тогда говорят, что по порядку величины п/к анализ даёт правильный результат. Пусть, например, анализируют пробу, содержащую 0,01% некоторого элемента. Тогда результаты надо «привязать» к шкале, в которой поставим вначале 0,01%, а далее – пары значений, отличающиеся в 3 раза в обе стороны: 0,01%, 0,003%, 0,03%, 0,001%, 0,1% и т.д., все дальше от центра шкалы. Аналитик не может выдать никаких других результатов, кроме перечисленных дискретных значений, появившихся вследствие квантования. Теперь закодируем результаты многократного повторного анализа числами 0, 1, 2, 3, … по следующему правилу:
0 – если анализ правильный, т.е. даёт результат, близкий к 0,01%;
1 – если аналитик получил 0,003% или 0,03% (т.е. ошибка смещает результат в ближайший от центра 3-кратный интервал слева или справа).
2 – если аналитик получил 0,001% или 0,1% (т.е. ошибка смещает результат ещё на один 3-кратный интервал) и т.д.
В качестве реального примера приводим распределение полуколичественных спектрографических анализов вольфрама в отходах переработки руды. В Таблице 3.2 сопоставлены теоретические и экспериментальные частоты. Последние получены на искусственных эталонах с известным содержанием вольфрама, лежащем в интервале 0,01 – 0,03%. Эталон анализировали 15 раз. Получили ряд:
0 0 1 0 2 0 1 0 0 1 0 0 1 0 0
Отсюда
средняя кодовая оценка случайной
величины
= 0,4.
Подставляем её в формулу Пуассона (3,16)
и находим теоретические частоты.
Таблица 3.2
Распределение п/к анализов вольфрама по величине ошибки, закодированной числами 0, 1, 2, 3, 4.
-
Интервал содержаний, %
Код
Теор.
Эксп.
с = 0,01
0
98
92
0,003 или 0,03
1
39
49
0,001 или 0,1
2
7,8
5
0,0003 или 0,3
3
1,0
0
0,0001 или 1,0
4
0,1
0
Последующая проверка по критерию xи-квадрат (метод изложен в Лекции 8) подтвердила хорошую сходимость п/к анализов с законом Пуассона при указанном кодировании ошибок.
Замечания. (1) Поскольку параметр Пуассона здесь 1, то нельзя использовать нормальный закон (см. Лекцию 4) вместо закона Пуассона: их кривые слишком сильно различаются при столь малых = пр.
(2) Для интересующихся сообщаем, что качественный (сортовой) анализ подчиняется биномиальному закону. Его называют также альтернативным, поскольку учитываются только противоположные исходы: «есть-нет». Распределение случайной величины – частоты обнаружений или вероятности «успеха» выражается формулой Бернулли (3,1). Другой крайний случай в аналитике – количественный анализ – подчиняется нормальному закону распределения вероятностей, который будет изучаться в Лекции 4. Подробнее о применении статистики в аналитике см., например, в книге В.В.Налимова.