Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский политехнический университет Петра Великого (бывш. СПбГПУ)

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

02.4 - Дискретные распределения

.doc

Скачиваний:

Добавлен:

23.05.2015

Размер:

370.69 Кб

Скачать

☆

2. Распределения случайных величин

2.4. Примеры дискретных распределений

Биномиальное распределение используется для моделирования ситуаций, характеризующихся следующими особенностями.

Выборка состоит из фиксированного числа элементов n, представляющих собой исходы некоего испытания.
Каждый элемент выборки принадлежит одной из двух взаимоисключающих категорий, исчерпывающих все выборочное пространство. Как правило, эти две категории называют успех и неудача.
Вероятность успеха р является постоянной. Следовательно, вероятность неудачи равна 1 – р.
Исход (т.е. удача или неудача) любого испытания не зависит от результата другого испытания. Чтобы гарантировать независимость исходов, элементы выборки, как правило, получают с помощью двух разных методов. Каждый элемент выборки случайным образом извлекается из бесконечной генеральной совокупности без возвращения или из конечной генеральной совокупности с возвращением.

Биномиальное распределение используется для оценки количества успехов в выборке, состоящей из n наблюдений.

Биноминальное распределение

Р(Х) =

где Р(Х) — вероятность X успехов при заданных объеме выборки n и вероятности успеха р, X = 0, 1, … n.

Свойства биномиального распределения

Биномиальное распределение зависит от параметров n и р. Биномиальное распределение может быть, как симметричным, так и асимметричным. Если р = 0,5, биномиальное распределение является симметричным независимо от величины параметра n. Однако, если р ≠ 0,5, распределение становится асимметричным. Чем ближе значение параметра р к 0,5 и чем больше объем выборки n, тем слабее выражена асимметрия распределения.

Так, например, распределение при p = 0,1 смещено вправо (рис.).

Рис. Гистограмма биномиального распределения при n = 4 и p = 0,1

Математическое ожидание биномиального распределения равно произведению объема выборки n на вероятность успеха р:

μ = n*p

В среднем, при достаточно долгой серии испытаний в выборке, состоящей из четырех заказов, может оказаться μ = 4 * 0,1 = 0,4 неправильно заполненных форм.

Стандартное отклонение биномиального распределения

σ = =

Другие примеры:

Функция Excel для биноминального распределения: P(X) = БИНОМРАСП (X, n, p, ЛОЖЬ)

ИСТИНА (в этом случае вычисляется вероятность не менее Х событий) – т.е. функция распределения

ЛОЖЬ (в этом случае вычисляется вероятность точно Х событий) – т.е. плотность распределения

Распределение Пуассона

Во многих практически важных приложениях большую роль играет распределение Пуассона. Многие из числовых дискретных величин являются реализациями пуассоновского процесса, обладающего следующими свойствами:

Нас интересует, сколько раз происходит некое событие в заданной области возможных исходов случайного эксперимента. Область возможных исходов может представлять собой интервал времени, отрезок, поверхность и т.п.
Вероятность данного события одинакова для всех областей возможных исходов.
Количество событий, происходящих в одной области возможных исходов, не зависит от количества событий, происходящих в других областях.
Вероятность того, что в одной и той же области возможных исходов данное событие происходит больше одного раза, стремится к нулю по мере уменьшения области возможных исходов.

Чтобы глубже понять смысл пуассоновского процесса, предположим, что мы исследуем количество клиентов, посещающих отделение банка, расположенное в центральном деловом районе, во время ланча, т.е. с 12 до 13 часов. Предположим, требуется определить количество клиентов, приходящих за одну минуту. Обладает ли эта ситуация особенностями, перечисленными выше? Во-первых, событие, которое нас интересует, представляет собой приход клиента, а область возможных исходов — одноминутный интервал. Сколько клиентов придет в банк за минуту — ни одного, один, два или больше? Во-вторых, разумно предположить, что вероятность прихода клиента на протяжении минуты одинакова для всех одноминутных интервалов. В-третьих, приход одного клиента в течение любого одноминутного интервала не зависит от прихода любого другого клиента в течение любого другого одноминутного интервала. И, наконец, вероятность того, что в банк придет больше одного клиента, стремится к нулю, если временной интервал стремится к нулю, например, становится меньше 0,1 с. Итак, количество клиентов, приходящих в банк во время ланча в течение одной минуты, описывается распределением Пуассона.

Варианты распределений Пуассона для разных значений λ

Распределение Пуассона имеет один параметр, обозначаемый символом λ (греческая буква «лямбда») – среднее количество успешных испытаний в заданной области возможных исходов. Дисперсия распределения Пуассона также равна λ, а его стандартное отклонение равно . Количество успешных испытаний Х пуассоновской случайной величины изменяется от 0 до бесконечности.

Распределение Пуассона описывается формулой:

(1) Р(Х) =

где Р(Х) — вероятность X успешных испытаний, λ — ожидаемое количество успехов, е— основание натурального логарифма, равное 2,71828, X— количество успехов в единицу времени.

Вернемся к нашему примеру. Допустим, что в течение обеденного перерыва в среднем в банк приходят три клиента в минуту.

Какова вероятность того, что в данную минуту в банк придут два клиента? Применим формулу (1) с параметром X = 2. Тогда вероятность того, что в течение данной минуты в банк придут два клиента, равна

А чему равна вероятность того, что в банк придут более двух клиентов?

Вероятность того, что в банк придут более двух клиентов, равна Р(Х > 2) = Р(Х = 3) + Р(Х = 4) + ... + Р(Х = ∞) . Поскольку сумма всех вероятностей должна быть равной 1, члены ряда, стоящего в правой части формулы, представляют собой вероятность дополнения к событию Х≤ 2. Иначе говоря, сумма этого ряда равна 1 – Р(Х ≤ 2). Таким образом, Р(Х> 2) = 1 – Р(Х≤2) = 1 – [Р(Х = 0) + Р(Х = 1) + Р(Х = 2)]. Теперь, используя формулу (1), получаем:

Функция Excel для распределения Пуассона:

p(X)/P(X) = ПУАССОН (X, λ, ЛОЖЬ/Истина)

ЛОЖЬ – в этом случае вычисляется вероятность числа успешных испытаний Х (только Х) в единицу времени, - т.е. плотность распределения.

ИСТИНА – в этом случае вычисляется вероятность числа успешных испытаний от 0 до Х в единицу времени, - т.е. функция распределения

Гипергеометрическое распределение

Гипергеометрическое распределение, как и биномиальное, позволяет оценить количество успехов в серии из n испытаний. Разница между ними заключается в способе получения исходных данных. В биномиальной модели данные выбираются либо из конечной генеральной совокупности с возвращением либо из бесконечной генеральной совокупности без возвращения. В гипергеометрической модели данные извлекаются только из конечной генеральной совокупности без возвращения. Таким образом, в то время как в биномиальной модели вероятность успеха р остается постоянной, а испытания не зависят друг от друга, в гипергеометрической модели эти условия не выполняются. Наоборот, в гипергеометрической модели каждый исход зависит от предыдущих исходов.

Гипергеометрическое распределение, описывающее вероятность X успехов при заданных параметрах n, N и А:

где Р(Х) — вероятность X успехов при заданных n, N и А, n — объем выборки, N — объем генеральной совокупности, А — количество успешных исходов в генеральной совокупности, N – A — количество неудачных исходов в генеральной совокупности, X — количество успехов в выборке, n – X — количество неудачных исходов в выборке.

Количество успехов X в выборке не может превосходить количество успехов А в генеральной совокупности либо объем выборки n. Таким образом, диапазон значений, которые может принимать случайная величина, подчиняющаяся гипергеометрическому распределению, ограничен либо объемом выборки (как и диапазон биномиальной переменной), либо объемом генеральной совокупности.

Математическое ожидание гипергеометрического распределения	μ = n*A/N
Стандартное отклонение гипергеометрического распределения

Выражение называется поправочным коэффициентом конечной генеральной совокупности. Он необходим, поскольку элементы выборки извлекаются из конечной генеральной совокупности.

Например, предположим, что некая организация пытается создать группу из 8 человек, обладающих определенными знаниями о производственном процессе. В организации работают 30 сотрудников, обладающих необходимыми знаниями, причем 10 из них работают в конструкторском бюро. Какова вероятность того, что в группу попадут два сотрудника из конструкторского бюро, если членов группы выбирают случайно? Объем генеральной совокупности в этой задаче N = 30, объем выборки n = 8, а количество успехов А = 10. Используя формулу (1), получаем:

Таким образом, вероятность того, что в группу попадут два сотрудника из конструкторского бюро, равна 0,298 (или 29,8%).

Функции Excel для гипергеометрического распределения

p(X) / P(X) = ГИПЕРГЕОМЕТ (X, n, А, N)

Соседние файлы в папке 02_03 - Основы теории и вероятности и мат_статистики

#
23.05.201547.1 Кб2901.1 - Базовые понятия.doc
#
23.05.201555.81 Кб3101.2_3 - Сложение вероятностей. Правила счета.doc
#
23.05.2015145.41 Кб2901.4 - Условная вероятность.doc
#
23.05.2015172.54 Кб5701.5 - Теорема Байеса.doc
#
23.05.201598.82 Кб3202.1_3 - Cлучайная величина. Плотность и функция распределения. Числовые значения.doc
#
23.05.2015370.69 Кб3102.4 - Дискретные распределения.doc
#
23.05.2015619.52 Кб2802.5 - Непрерывные распределения.doc