
Раздаточный материал - 2014 логистика_1 / 02_03 - Основы теории и вероятности и мат_статистики / 02.4 - Дискретные распределения
.doc
2. Распределения случайных величин
2.4. Примеры дискретных распределений
Биномиальное распределение используется для моделирования ситуаций, характеризующихся следующими особенностями.
-
Выборка состоит из фиксированного числа элементов n, представляющих собой исходы некоего испытания.
-
Каждый элемент выборки принадлежит одной из двух взаимоисключающих категорий, исчерпывающих все выборочное пространство. Как правило, эти две категории называют успех и неудача.
-
Вероятность успеха р является постоянной. Следовательно, вероятность неудачи равна 1 – р.
-
Исход (т.е. удача или неудача) любого испытания не зависит от результата другого испытания. Чтобы гарантировать независимость исходов, элементы выборки, как правило, получают с помощью двух разных методов. Каждый элемент выборки случайным образом извлекается из бесконечной генеральной совокупности без возвращения или из конечной генеральной совокупности с возвращением.
Биномиальное распределение используется для оценки количества успехов в выборке, состоящей из n наблюдений.
Биноминальное распределение
Р(Х)
=
где Р(Х) — вероятность X успехов при заданных объеме выборки n и вероятности успеха р, X = 0, 1, … n.
Свойства биномиального распределения
Биномиальное распределение зависит от параметров n и р. Биномиальное распределение может быть, как симметричным, так и асимметричным. Если р = 0,5, биномиальное распределение является симметричным независимо от величины параметра n. Однако, если р ≠ 0,5, распределение становится асимметричным. Чем ближе значение параметра р к 0,5 и чем больше объем выборки n, тем слабее выражена асимметрия распределения.
Так, например, распределение при p = 0,1 смещено вправо (рис.).
|
Рис. Гистограмма биномиального распределения при n = 4 и p = 0,1
|
Математическое ожидание биномиального распределения равно произведению объема выборки n на вероятность успеха р:
μ = n*p
В среднем, при достаточно долгой серии испытаний в выборке, состоящей из четырех заказов, может оказаться μ = 4 * 0,1 = 0,4 неправильно заполненных форм.
Стандартное отклонение биномиального распределения
σ
= =
Другие примеры:
Функция Excel для биноминального распределения: P(X) = БИНОМРАСП (X, n, p, ЛОЖЬ)
ИСТИНА (в этом случае вычисляется вероятность не менее Х событий) – т.е. функция распределения
ЛОЖЬ (в этом случае вычисляется вероятность точно Х событий) – т.е. плотность распределения
Распределение Пуассона
Во многих практически важных приложениях большую роль играет распределение Пуассона. Многие из числовых дискретных величин являются реализациями пуассоновского процесса, обладающего следующими свойствами:
-
Нас интересует, сколько раз происходит некое событие в заданной области возможных исходов случайного эксперимента. Область возможных исходов может представлять собой интервал времени, отрезок, поверхность и т.п.
-
Вероятность данного события одинакова для всех областей возможных исходов.
-
Количество событий, происходящих в одной области возможных исходов, не зависит от количества событий, происходящих в других областях.
-
Вероятность того, что в одной и той же области возможных исходов данное событие происходит больше одного раза, стремится к нулю по мере уменьшения области возможных исходов.
Чтобы глубже понять смысл пуассоновского процесса, предположим, что мы исследуем количество клиентов, посещающих отделение банка, расположенное в центральном деловом районе, во время ланча, т.е. с 12 до 13 часов. Предположим, требуется определить количество клиентов, приходящих за одну минуту. Обладает ли эта ситуация особенностями, перечисленными выше? Во-первых, событие, которое нас интересует, представляет собой приход клиента, а область возможных исходов — одноминутный интервал. Сколько клиентов придет в банк за минуту — ни одного, один, два или больше? Во-вторых, разумно предположить, что вероятность прихода клиента на протяжении минуты одинакова для всех одноминутных интервалов. В-третьих, приход одного клиента в течение любого одноминутного интервала не зависит от прихода любого другого клиента в течение любого другого одноминутного интервала. И, наконец, вероятность того, что в банк придет больше одного клиента, стремится к нулю, если временной интервал стремится к нулю, например, становится меньше 0,1 с. Итак, количество клиентов, приходящих в банк во время ланча в течение одной минуты, описывается распределением Пуассона.
|
Варианты распределений Пуассона для разных значений λ |
Распределение
Пуассона имеет один параметр, обозначаемый
символом λ (греческая буква «лямбда»)
– среднее количество успешных испытаний
в заданной области возможных исходов.
Дисперсия распределения Пуассона также
равна λ, а его стандартное отклонение
равно .
Количество успешных испытаний Х
пуассоновской случайной величины
изменяется от 0 до бесконечности.
Распределение Пуассона описывается формулой:
(1)
Р(Х)
=
где Р(Х) — вероятность X успешных испытаний, λ — ожидаемое количество успехов, е— основание натурального логарифма, равное 2,71828, X— количество успехов в единицу времени.
Вернемся к нашему примеру. Допустим, что в течение обеденного перерыва в среднем в банк приходят три клиента в минуту.
Какова вероятность того, что в данную минуту в банк придут два клиента? Применим формулу (1) с параметром X = 2. Тогда вероятность того, что в течение данной минуты в банк придут два клиента, равна
А чему равна вероятность того, что в банк придут более двух клиентов?
Вероятность того, что в банк придут более двух клиентов, равна Р(Х > 2) = Р(Х = 3) + Р(Х = 4) + ... + Р(Х = ∞) . Поскольку сумма всех вероятностей должна быть равной 1, члены ряда, стоящего в правой части формулы, представляют собой вероятность дополнения к событию Х≤ 2. Иначе говоря, сумма этого ряда равна 1 – Р(Х ≤ 2). Таким образом, Р(Х> 2) = 1 – Р(Х≤2) = 1 – [Р(Х = 0) + Р(Х = 1) + Р(Х = 2)]. Теперь, используя формулу (1), получаем:
Функция Excel для распределения Пуассона:
p(X)/P(X) = ПУАССОН (X, λ, ЛОЖЬ/Истина)
ЛОЖЬ – в этом случае вычисляется вероятность числа успешных испытаний Х (только Х) в единицу времени, - т.е. плотность распределения.
ИСТИНА – в этом случае вычисляется вероятность числа успешных испытаний от 0 до Х в единицу времени, - т.е. функция распределения
Гипергеометрическое распределение
Гипергеометрическое распределение, как и биномиальное, позволяет оценить количество успехов в серии из n испытаний. Разница между ними заключается в способе получения исходных данных. В биномиальной модели данные выбираются либо из конечной генеральной совокупности с возвращением либо из бесконечной генеральной совокупности без возвращения. В гипергеометрической модели данные извлекаются только из конечной генеральной совокупности без возвращения. Таким образом, в то время как в биномиальной модели вероятность успеха р остается постоянной, а испытания не зависят друг от друга, в гипергеометрической модели эти условия не выполняются. Наоборот, в гипергеометрической модели каждый исход зависит от предыдущих исходов.
Гипергеометрическое распределение, описывающее вероятность X успехов при заданных параметрах n, N и А:
где Р(Х) — вероятность X успехов при заданных n, N и А, n — объем выборки, N — объем генеральной совокупности, А — количество успешных исходов в генеральной совокупности, N – A — количество неудачных исходов в генеральной совокупности, X — количество успехов в выборке, n – X — количество неудачных исходов в выборке.
Количество успехов X в выборке не может превосходить количество успехов А в генеральной совокупности либо объем выборки n. Таким образом, диапазон значений, которые может принимать случайная величина, подчиняющаяся гипергеометрическому распределению, ограничен либо объемом выборки (как и диапазон биномиальной переменной), либо объемом генеральной совокупности.
Математическое ожидание гипергеометрического распределения |
μ = n*A/N |
Стандартное отклонение гипергеометрического распределения |
|
Выражение
называется
поправочным
коэффициентом конечной генеральной
совокупности.
Он необходим, поскольку элементы выборки
извлекаются из конечной генеральной
совокупности.
Например, предположим, что некая организация пытается создать группу из 8 человек, обладающих определенными знаниями о производственном процессе. В организации работают 30 сотрудников, обладающих необходимыми знаниями, причем 10 из них работают в конструкторском бюро. Какова вероятность того, что в группу попадут два сотрудника из конструкторского бюро, если членов группы выбирают случайно? Объем генеральной совокупности в этой задаче N = 30, объем выборки n = 8, а количество успехов А = 10. Используя формулу (1), получаем:
Таким образом, вероятность того, что в группу попадут два сотрудника из конструкторского бюро, равна 0,298 (или 29,8%).
Функции Excel для гипергеометрического распределения
p(X) / P(X) = ГИПЕРГЕОМЕТ (X, n, А, N)