- •Глава 5. Дискретные случайные величины. – с. 359 – 400
- •1 Вопрос. Биномиальное распределение.
- •Биномиальные таблицы вероятностей
- •2 Вопрос. Распределение Пуассона
- •Связь с другими распределениями
- •3 Вопрос. Производящая функция.
- •4 Вопрос. Гипергеометрическое распределение
- •Связь с другими распределениями
- •5 Вопрос. Равномерное распределение.
- •6 Вопрос. Нормальное распределение
- •Правило трёх сигм
3 Вопрос. Производящая функция.
Функция , разложение которой по степеням z (где z – произвольный параметр) даёт в качестве коэффициентов вероятности значений СВ Х, называется производящей функцией для этой СВ.
Пример 4.
В билетном зале 3 кассы. Вероятность того, что с 12 часов до 13 они работают, соответственно равны 0.9, 0.8, 0.7. Составьте закон распределения числа работающих касс в течение этого часа, и вычислите числовые характеристики этого распределения.
Решение:
СВ Х – число работающих касс в течение часа – может принимать значения 0, 1, 2, 3.
Вероятности успеха, т.е. того, что каждая из касс работает, по условию равны соответственно р1 = 0,9; р2 = 0,8; р3 = 0,7. Тогда вероятности того, что каждая из касс не будет работать, равны q1 = 0,1; q2 = 0,2; q3 = 0,3.
Распределение СВ Х можно получить через производящую функцию.
= (q1 + p1z)(q2 + p2z)(q3 + p3z) = (0,1 + 0,9z)(0,2 + 0,8z)(0,3 + 0,7z) =
= 0,504z3 + 0,398z2 + 0,092z + 0,006.
Каждый из 4-х полученных коэффициентов при zm (m = 0, 1, 2, 3) в функции выражает соответствующую вероятность P(X=m).
Тогда распределение СВ Х – числа работающих касс – следующее:
Число успехов, X=m (xi) |
0 |
1 |
2 |
3 |
Вероятности, Рn, m (pi) |
0,006 |
0,092 |
0,398 |
0,504 |
0,006 + 0,092 + 0,398 + 0,504 = 1
Найдем числовые характеристики этого распределения:
- Математическое ожидание:
кассы.
Т.е. из трёх касс в билетном зале в течение следующего часа будет работать в среднем 2,4 кассы.
- Дисперсия:
Д/з – решить эту задачу, используя теоремы сложения и умножения вероятностей. Д/з – доказать, что формула Бернулли является частным случаем вычисления вероятностей Рn, m более общего способа через ПФ. См.: 2. Теория статистики с основами теории вероятностей: Учебное пособие для вузов/ И.И. Елисееева, В.С. Князевский, Л.И. Ниворожкина, З.А. Морозова; Под ред. И.И. Елисеевой. – М.: ЮНИТИ-ДАНА, 2001. – С. 111 – 114. |
4 Вопрос. Гипергеометрическое распределение
ДСВ Х имеет гипергеометрическое распределение, если она принимает значения 0, 1, 2, 3,…, min(n,M) с вероятностями
,
Вспомните уже знакомую вам схему невозвращённого шара:
N
М N-M
n
m n-m
Если по формуле вычислить вероятности для всех возможных значений m и поместить их в таблицу, то получим ряд распределения, называемый гипергеометрическим законом распределения.
X=m (xi) |
Вероятности, Р(X=m) (pi) |
0 |
|
1 |
|
2 |
|
3 |
|
… |
… |
m |
|
… |
… |
n |
|
Сумма |
1 |
Функция распределения F(x):
Математическое ожидание
Дисперсия:
- поправка на бесповторность выборки.
Пример 5.
Менеджер по персоналу рассматривает кандидатуры 12 человек, из которых 4 женщины, подавших заявление о приёме на работу в крупную фирму. Будут приняты только 5 человек.
Составьте ряд распределения числа женщин, среди лиц, занявших вакантные должности, и постройте его график.
Найдите числовые характеристики этого распределения.
Запишите функцию распределения и постройте её график.
Чему равна вероятность того, что менее 3-х женщин займут предложенные вакансии?
Решение:
СВ Х - число женщин, среди лиц, занявших вакантные должности – принимает значения 0, 1, 2, 3, 4.
Это - дискретная случайная величина, т.к. ее возможные значения отличаются друг от друга не менее чем на 1, и множество ее возможных значений является счетным.
Очевидно, что отбор кандидатов - бесповторный. Следовательно, испытания - зависимые.
Вышеперечисленные признаки указывают на то, что рассматриваемая случайная величина – число женщин среди лиц, занявших вакантные должности - подчиняется гипергеометрическому закону распределения.
Изобразим ситуацию на схеме:
12 кандидатов
4 женщины 8 мужчин
5 вакансий
0 5
1 4
2 3
3 2
4 1
Составим ряд распределения.
Вычислим вероятности того, что случайная величина примет каждое из своих возможных значений по формуле:
,
По условию задачи N=12, M=4, n=5, m=0, 1, 2, 3, 4
Занесем полученные результаты в таблицу:
Хi |
0 |
1 |
2 |
3 |
4 |
Рi |
0,0707 |
0,3535 |
0,4242 |
0,1414 |
0,0101 |
0,0707 + 0,3535 + 0,4242 + 0,1414 + 0,0101 = 0,9999 1.
График полученного распределения вероятностей дискретной случайной величины (полигон распределения вероятностей) изображен на рис 23
Рисунок 23.
Найдем числовые характеристики данного биномиального распределения: М(Х), D(Х), .
Математическое ожидание определим 2-мя способами:
- как М(Х) ДСВ
- как М(Х) ДСВ, распределённой по гипергеометрическому закону
женщин
Итак, среди случайно выбранных 5-х кандидатов можно ожидать появление в среднем 1,6667 женщин (точнее, менее двух).
Дисперсию определим:
- как D(X) ДСВ
- как D(X) ДСВ, распределённой по гипергеометрическому закону
Среднее квадратическое отклонение
Зададим дискретную случайную величину в виде функции распределения:
Рассчитаем значения F(х):
Эти данные можно представить и в виде таблицы:
Х |
x 0 |
0 < x 1 |
1 < x 2 |
2 < x 3 |
3 < x 4 |
x > 4 |
F(x) |
0 |
0,0707 |
0,4242 |
0,8484 |
0,9898 |
1 |
График функции распределения вероятностей дискретной случайной величины имеет ступенчатый вид (рис. 24).
Рисунок 24. Функция распределения вероятностей.
Определим вероятность того, что среди 5-х отобранных кандидатов на должности окажется меньше трёхх женщин. «Меньше трёх» - это «или ноль, или одна, или две».
Можно применить теорему сложения вероятностей несовместных событий:
P(X< 3) = P(X = 0) + P(X = 1) + P(X = 2) = 0,0707 + 0,3535 + 0,4242 = 0,8484.
Таблицы гипергеометрических вероятностей
В таблицах приводятся вероятности Р(Х=m) (в таблицах p(x)) при различных значениях N, M (в таблицах k), m (в таблицах х) и n. Так же приводятся значения накопленных вероятностей гипергеометрического распределения (в таблицах P(x)), т.е. табулированы значения интегральной функции (функции распределения)
Ниже приведён отрывок из Приложения 8 (Ниворожкина Л.И., Морозова З.А. Математическая статистика с элементами теории вероятностей в задачах с решениями: Учебное пособие. – М.: ИКЦ «МарТ»; Ростов-н/Д: Издательский центр «МарТ», 2005).
В таблице подчёркнуты вероятности, имеющие отношение к нашему примеру.
Значения функций N
и P(x, N, n, k)=p(i, N, n, k) k n N-k
x n-x
n |
k |
x |
P(x) |
p(x) |
N=12 |
||||
5 |
1 |
0 |
0,5833 |
0,5833 |
5 |
1 |
1 |
1,0000 |
0,4167 |
|
|
|
|
|
5 |
2 |
0 |
0,3182 |
0,3182 |
5 |
2 |
1 |
0,8485 |
0,5303 |
5 |
2 |
2 |
1,0000 |
0,1515 |
|
|
|
|
|
5 |
3 |
0 |
0,1591 |
0,1591 |
5 |
3 |
1 |
0,6364 |
0,4773 |
5 |
3 |
2 |
0,9545 |
0,3182 |
5 |
3 |
3 |
1,0000 |
0,0455 |
|
|
|
|
|
5 |
4 |
0 |
0,0707 |
0,0707 |
5 |
4 |
1 |
0,4242 |
0,3535 |
5 |
4 |
2 |
0,8485 |
0,4242 |
5 |
4 |
3 |
0,9899 |
0,1414 |
5 |
4 |
4 |
1,0000 |
0,0101 |
|
|
|
|
|
5 |
5 |
0 |
0,0265 |
0,0265 |
5 |
5 |
1 |
0,2475 |
0,2210 |
5 |
5 |
2 |
0,6894 |
0,4419 |
5 |
5 |
3 |
0,9545 |
0,2651 |
5 |
5 |
4 |
0,9987 |
0,0442 |
5 |
5 |
5 |
1,0000 |
0,0013 |
Использование EXCEL для вычисления гипергеометрических вероятностей.
Удобно рассчитывать гипергеометрические вероятности с помощью встроенной в EXCEL функции ГИПЕРГЕОМЕТ со следующими характеристиками:
ГИПЕРГЕОМЕТ (пример_s; размер_выборки; ген_совокупность_s; размер_ген_совокупности), где
пример_s – количество успешных испытаний в выборке m;
размер_выборки – разиер выборки n;
ген_совокупность_s – количество успешных испытаний в генеральной совокупности M;
размер_ген_совокупности – размер генеральной совокупности N.
Например, на рисунке 25 показана функция ГИПЕРГЕОМЕТ для вычисления вероятности того, что среди отобранных 5-ти человек на вакантные должности не будет ни одной женщины, т.е. Х=0. В ячейке А1 содержится формула =ГИПЕРГЕОМЕТ(0;5;4;12) с результатом 0,070707071
Рисунок 25.
На рисунках 26 – 29 показаны функции ГИПЕРГЕОМЕТ для вычисления вероятностей того, что среди 5-ти человек будут ровно 1 (рис. 26), 2 (рис. 27), 3 (рис. 28) и 4 (рис. 29) женщины.
Рисунок 26.
Рисунок 27.
Рисунок 28.
Рисунок 29.