Скачиваний:
27
Добавлен:
23.05.2015
Размер:
370.69 Кб
Скачать

9

2. Распределения случайных величин

2.4. Примеры дискретных распределений

Биномиальное распределение используется для моделирования ситуаций, характеризующихся следующими особенностями.

  • Выборка состоит из фиксированного числа элементов n, представляющих собой исходы некоего испытания.

  • Каждый элемент выборки принадлежит одной из двух взаимоисключающих категорий, исчерпывающих все выборочное пространство. Как правило, эти две категории называют успех и неудача.

  • Вероятность успеха р является постоянной. Следовательно, вероятность неудачи равна 1 – р.

  • Исход (т.е. удача или неудача) любого испытания не зависит от результата другого испытания. Чтобы гарантировать независимость исходов, элементы выборки, как правило, получают с помощью двух разных методов. Каждый элемент выборки случайным образом извлекается из бесконечной генеральной совокупности без возвращения или из конечной генеральной совокупности с возвращением.

Биномиальное распределение используется для оценки количества успехов в выборке, состоящей из n наблюдений.

Биноминальное распределение

Р(Х) =

где Р(Х) — вероятность X успехов при заданных объеме выборки n и вероятности успеха р, X = 0, 1, … n.

Свойства биномиального распределения

Биномиальное распределение зависит от параметров n и р. Биномиальное распределение может быть, как симметричным, так и асимметричным. Если р = 0,5, биномиальное распределение является симметричным независимо от величины параметра n. Однако, если р ≠ 0,5, распределение становится асимметричным. Чем ближе значение параметра р к 0,5 и чем больше объем выборки n, тем слабее выражена асимметрия распределения.

Так, например, распределение при p = 0,1 смещено вправо (рис.).

Рис. Гистограмма биномиального распределения при n = 4 и p = 0,1

Математическое ожидание биномиального распределения равно произведению объема выборки n на вероятность успеха р:

μ = n*p

В среднем, при достаточно долгой серии испытаний в выборке, состоящей из четырех заказов, может оказаться μ = 4 * 0,1 = 0,4 неправильно заполненных форм.

Стандартное отклонение биномиального распределения

σ = =

Другие примеры:

Функция Excel для биноминального распределения: P(X) = БИНОМРАСП (X, n, p, ЛОЖЬ)

ИСТИНА (в этом случае вычисляется вероятность не менее Х событий) – т.е. функция распределения

ЛОЖЬ (в этом случае вычисляется вероятность точно Х событий) – т.е. плотность распределения

Распределение Пуассона

Во многих практически важных приложениях большую роль играет распределение Пуассона. Многие из числовых дискретных величин являются реализациями пуассоновского процесса, обладающего следующими свойствами:

  • Нас интересует, сколько раз происходит некое событие в заданной области возможных исходов случайного эксперимента. Область возможных исходов может представлять собой интервал времени, отрезок, поверхность и т.п.

  • Вероятность данного события одинакова для всех областей возможных исходов.

  • Количество событий, происходящих в одной области возможных исходов, не зависит от количества событий, происходящих в других областях.

  • Вероятность того, что в одной и той же области возможных исходов данное событие происходит больше одного раза, стремится к нулю по мере уменьшения области возможных исходов.

Чтобы глубже понять смысл пуассоновского процесса, предположим, что мы исследуем количество клиентов, посещающих отделение банка, расположенное в центральном деловом районе, во время ланча, т.е. с 12 до 13 часов. Предположим, требуется определить количество клиентов, приходящих за одну минуту. Обладает ли эта ситуация особенностями, перечисленными выше? Во-первых, событие, которое нас интересует, представляет собой приход клиента, а область возможных исходов — одноминутный интервал. Сколько клиентов придет в банк за минуту — ни одного, один, два или больше? Во-вторых, разумно предположить, что вероятность прихода клиента на протяжении минуты одинакова для всех одноминутных интервалов. В-третьих, приход одного клиента в течение любого одноминутного интервала не зависит от прихода любого другого клиента в течение любого другого одноминутного интервала. И, наконец, вероятность того, что в банк придет больше одного клиента, стремится к нулю, если временной интервал стремится к нулю, например, становится меньше 0,1 с. Итак, количество клиентов, приходящих в банк во время ланча в течение одной минуты, описывается распределением Пуассона.

Варианты распределений Пуассона для разных значений λ

Распределение Пуассона имеет один параметр, обозначаемый символом λ (греческая буква «лямбда») – среднее количество успешных испытаний в заданной области возможных исходов. Дисперсия распределения Пуассона также равна λ, а его стандартное отклонение равно . Количество успешных испытаний Х пуассоновской случайной величины изменяется от 0 до бесконечности.

Распределение Пуассона описывается формулой:

(1) Р(Х) =

где Р(Х) — вероятность X успешных испытаний, λ — ожидаемое количество успехов, е— основание натурального логарифма, равное 2,71828, X— количество успехов в единицу времени.

Вернемся к нашему примеру. Допустим, что в течение обеденного перерыва в среднем в банк приходят три клиента в минуту.

Какова вероятность того, что в данную минуту в банк придут два клиента? Применим формулу (1) с параметром X = 2. Тогда вероятность того, что в течение данной минуты в банк придут два клиента, равна

А чему равна вероятность того, что в банк придут более двух клиентов?

Вероятность того, что в банк придут более двух клиентов, равна Р(Х > 2) = Р(Х = 3) + Р(Х = 4) + ... + Р(Х = ∞) . Поскольку сумма всех вероятностей должна быть равной 1, члены ряда, стоящего в правой части формулы, представляют собой вероятность дополнения к событию Х≤ 2. Иначе говоря, сумма этого ряда равна 1 – Р(Х ≤ 2). Таким образом, Р(Х> 2) = 1 – Р(Х≤2) = 1 – [Р(Х = 0) + Р(Х = 1) + Р(Х = 2)]. Теперь, используя формулу (1), получаем:

Функция Excel для распределения Пуассона:

p(X)/P(X) = ПУАССОН (X, λ, ЛОЖЬ/Истина)

ЛОЖЬ – в этом случае вычисляется вероятность числа успешных испытаний Х (только Х) в единицу времени, - т.е. плотность распределения.

ИСТИНА – в этом случае вычисляется вероятность числа успешных испытаний от 0 до Х в единицу времени, - т.е. функция распределения

Гипергеометрическое распределение

Гипергеометрическое распределение, как и биномиальное, позволяет оценить количество успехов в серии из n испытаний. Разница между ними заключается в способе получения исходных данных. В биномиальной модели данные выбираются либо из конечной генеральной совокупности с возвращением либо из бесконечной генеральной совокупности без возвращения. В гипергеометрической модели данные извлекаются только из конечной генеральной совокупности без возвращения. Таким образом, в то время как в биномиальной модели вероятность успеха р остается постоянной, а испытания не зависят друг от друга, в гипергеометрической модели эти условия не выполняются. Наоборот, в гипергеометрической модели каждый исход зависит от предыдущих исходов.

Гипергеометрическое распределение, описывающее вероятность X успехов при заданных параметрах n, N и А:

где Р(Х) — вероятность X успехов при заданных n, N и А, n — объем выборки, N — объем генеральной совокупности, А — количество успешных исходов в генеральной совокупности, N – A — количество неудачных исходов в генеральной совокупности, X — количество успехов в выборке, n – X — количество неудачных исходов в выборке.

Количество успехов X в выборке не может превосходить количество успехов А в генеральной совокупности либо объем выборки n. Таким образом, диапазон значений, которые может принимать случайная величина, подчиняющаяся гипергеометрическому распределению, ограничен либо объемом выборки (как и диапазон биномиальной переменной), либо объемом генеральной совокупности.

Математическое ожидание гипергеометрического распределения

μ = n*A/N

Стандартное отклонение гипергеометрического распределения

Выражение называется поправочным коэффициентом конечной генеральной совокупности. Он необходим, поскольку элементы выборки извлекаются из конечной генеральной совокупности.

Например, предположим, что некая организация пытается создать группу из 8 человек, обладающих определенными знаниями о производственном процессе. В организации работают 30 сотрудников, обладающих необходимыми знаниями, причем 10 из них работают в конструкторском бюро. Какова вероятность того, что в группу попадут два сотрудника из конструкторского бюро, если членов группы выбирают случайно? Объем генеральной совокупности в этой задаче N = 30, объем выборки n = 8, а количество успехов А = 10. Используя формулу (1), получаем:

Таким образом, вероятность того, что в группу попадут два сотрудника из конструкторского бюро, равна 0,298 (или 29,8%).

Функции Excel для гипергеометрического распределения

p(X) / P(X) = ГИПЕРГЕОМЕТ (X, n, А, N)