
Лекция № 4
.pdf
Можно показать, что
n |
|
Pn (m) ( p q)n |
(47). |
m 0
Так, при n=2 вероятность исходов равна p2 pq qp q2. При трех независимых испытаниях возможно 23=8 исходов, вероятности которых распределяются следующим образом: (p+q)3=p3+3p2q+3pq2+q3.
Таким образом, закон биномиального распределения выражается не только формулой Бернулли, но и формулой бинома Ньютона:
( p q)n pn npn 1q |
n(n 1) |
pn 2q2 ... qn |
(48). |
|
1 2 |
||||
|
|
|
Так, например, при n=10 возможны 210=1024 исхода. Если этот ряд представить в виде графика, получится полигон биномиального распределения, где ординаты соответствуют членам разложения бинома
(1/2+1/2)10. Биномиальная кривая строго симметрична относительно максимальной ординаты, являющейся центром биномиального распределения (рис. 32).
Рис. 32. Распределение вероятностей двучлена (1/2+1/2)n.
Распределение вероятностей соответствует коэффициентам разложения бинома Ньютона, отнесенным к одному и тому же знаменателю, равному 2n.
Биномиальные коэффициенты легко вычислить при помощи треугольника

Паскаля, в котором каждая цифра находится суммированием двух цифр,
стоящих над ней (рис. 7).
Рис. 33. Треугольник Паскаля.
Характер биномиальной кривой определяется двумя величинами:
числом испытаний n и вероятностью p ожидаемого результата. При p=q
биномиальная кривая строго симметрична и по мере увеличения числа испытаний приобретает все более плавный ход, приближаясь к своему пределу – нормальной кривой. Если p q, биномиальная кривая становится асимметричной и тем сильнее, чем больше разница между p и q.
Пример. Какова вероятность появления 0, 1, 2, 3, 4, 5 детей мужского пола в числе 5-и новорожденных?
Можно показать, что возможна серия из 5-и повторных наблюдений с
2-я исходами. При этом появление детей мужского пола может иметь в серии различное числовое выражение от 0 до 5, как и противоположное событие
(появление детей женского пола). В каждом испытании вероятность появления мальчика или девочки будет одинаковой и равной 1/2. Определяем Р5(0)=0,03125; Р5(1)=0,15625; Р5(2)=0,3125; Р5(3)=0,3125; Р5(4)=0,15625;
Р5(5)=0,03125.
Распределение Пуассона
- Другие люди, - бормотал он, ходя взад и вперед по комнате и время от времени посматривая в зеркало, чтобы убедиться, что он никуда не делся, - другие люди ведут кипучую, интересную жизнь. С ними происходят удивительные вещи…у них бывают приключения. Так почему же я этого лишен?
(Дж. Даррелл. Рози - моя родня)
Когда вероятность события очень мала и исчисляется сотыми и тысячными долями единицы, распределение частот таких редких событий в n
независимых испытаний становится крайне асимметричным. Для описания такого рода распределений редких событий служит формула Пуассона:
P (m) |
am |
|
e a |
am |
(49), |
|
|
||||
n |
m! |
|
m!ea |
||
|
|
|
где a np – наивероятнейшая частота ожидаемого события; m – частота
ожидаемого события в n независимых испытаний.
Формула Пуассона позволяет определить вероятность для любых
значений а от 0 до n.
Чтобы формула Пуассона выражала не вероятности, а ожидаемые абсолютные частоты f редкого события, ей придают следующий вид:
f n |
x m |
e x |
(50). |
|
|||
|
m! |
|
Здесь f - теоретические ординаты кривой распределения Пуассона,
или ожидаемое число случаев редкого события в каждом отдельно взятом классе испытания – 0, 1, 2, 3 и т.д.; n – число испытаний; x - среднее число фактически наблюдаемых случаев (взятое вместо а).
Распределение Пуассона – частный случай биномиального распределения. Оно, как и биномиальное распределение, приближается к нормальной кривой при возрастании числа a np.
Этому распределению хорошо соответствуют явления типа регистрации радиоактивности, прибытия самолетов, обрывов нити в ткацком производстве, число масляных пятен на участке поверхности и т.п.
Проверка гипотез о законах распределения
Эмпирический вариационный ряд и его график – вариационная кривая
- не позволяют с полной уверенностью судить о законе распределения совокупности, из которой взята выборка. На величине любого варьирующего признака сказывается влияние многочисленных, в том числе и случайных,
факторов, искажающих четкую картину варьирования. Между тем знание закона распределения позволяет избежать возможных ошибок в оценке генеральных параметров по выборочным характеристикам.
Поверка выборочного распределения на нормальность может быть проведена несколькими способами, каждый из которых дополняет друг друга:
1.Глазомерный метод в качестве предварительной субъективной оценки может быть осуществлен по рисунку гистограммы выборочного распределения с наложенной кривой плотности вероятности нормального распределения.
2.Проверка по коэффициентам асимметрии и эксцесса.
3.Проверка распределения по критериям Колмогорова, омега-квадрат
ихи-квадрат:
а) критерий Колмогорова реагирует на наибольшую разность между распределениями, которая обычно проявляется вблизи максимума функции плотности вероятности, поэтому он плохо приспособлен для выявления различий на концах распределений;
б) критерий омега-квадрат ( 2) является более равномерным,
учитывая различия между распределениями на всем интервале выборочных значений, однако он сравнительно менее исследован в плане составления
таблиц критических значений и предельных аппроксимаций для различных типов распределений;
в) критерий Пирсона хи-квадрат ( 2) также достаточно равномерно учитывает различия во всем диапазоне, однако требует большой осторожности при своем применении к непрерывным распределениям,
поскольку его результаты существенно зависят от объема выборки и разбиения выборочного пространства на интервалы.
Критерий согласия или соответствия 2 предложен в 1900 г. К.
Пирсоном.
Этот критерий представляет сумму квадратов отклонений эмпирических частот f от вычисленных или ожидаемых частот f , отнесенную к теоретическим частотам:
|
k |
( f f )2 |
|
k |
(d 2 ) |
|
2 |
|
|
|
|
|
(51). |
f |
f |
|||||
|
i 1 |
|
|
i 1 |
|
|
Величина критерия 2 всегда положительна. При полном совпадении эмпирических частот с вычисленными или ожидаемыми частотами 2 = 0.
Распределение вероятных значений случайной величины 2 является непрерывным и асимметричным, оно зависит от числа степеней свободы k и
приближается к нормальному по мере увеличения числа испытаний n.
Для того чтобы оценки были более точными, выборка, распределяемая в вариационный ряд, должна содержать не менее 50 вариант. Поэтому часто считают, что применение критерия 2 требует, чтобы в крайних классах вариационного ряда содержалось не менее 5 вариант. Если в крайних классах содержится меньше, чем 5 вариант, то вычисленные теоретические и эмпирические частоты объединяются до указанного минимума и соответственно уменьшается число классов вариационного ряда. (Существует и другая точка зрения на минимальные значения теоретических частот f , которые могут находиться в разных классах вариационного ряда.
Согласно ей, при n>50 k>6 одно из значений f может быть снижено даже до
0,5. При k=2 минимальное значение f составляет 2. И только при k=1
минимальное значение f должно быть не менее 4). Число степеней свободы устанавливают по вторичному числу классов с учетом ограничений свободы вариации, которая в разных случаях бывает разной. Так, при оценке эмпирических распределений, следующих нормальному закону, число степеней свободы k=N–3 (с учетом трех ограничений свободы вариации n, x , sx). Если же оценке подлежит распределение, следующее закону Пуассона,
число степеней свободы уменьшается на 2, т.е k=N–2 (с учетом двух ограничений свободы вариации n и x или sx2). В других случаях число степеней свободы устанавливают особо.