Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
151
Добавлен:
05.06.2015
Размер:
4.92 Mб
Скачать

5 Теоретические распределения

Пусть, в зависимости от формы статистического распределения выборки, по выборочным данным составлен полигон, гистограмма и (либо) график эмпирической плотности распределения. По их виду и соответствующим числовым характеристикам выборки выдвигаетсягипотеза Н0 о виде распределения исследуемой случайной величины Х с альтернативной гипотезой Н1о другом виде распределения. По виду предложенного распределения находятся егопараметры.

Перечислимосновные виды распределенийслучайных величин и укажем правила нахождения их параметров по статистическим данным.

5.1 Дискретные случайные величины

5.1.1 Биномиальное распределение

Пусть производится mнезависимых испытаний, в каждом из которых событие А появляется либо нет. Вероятность появления А в каждом испытании остаётся постоянным числомр (независимо от результатов других испытаний).

Если обозначить случайную величину Х – число появлений А за m испытаний, то формулаБернулли описывает вероятность для Х принимать значениеk,.

В этом случае говорят, что случайная величина Х имеет биномиальное распределение (илибиномиальнораспределена).

Пример7:

Описать биномиальное распределение при m=9 испытаниях, в каждом из которых вероятность события равна p1=0,3 ( p2=0,5 , p3=0,8) .

Решение:В результате вычислений с помощью формулы Бернулли получим следующие распределения :

x

0

1

2

3

4

5

6

7

8

9

p

0.3

0.0404

0.1556

0.2668

0.2668

0.1715

0.0735

0.021

0.0039

0.0004

0

0.5

0.002

0.0176

0.0703

0.1641

0.2461

0.2461

0.1641

0.0703

0.0176

0.002

0.8

0

0

0.0003

0.0028

0.0165

0.0661

0.1762

0.302

0.302

0.1342

Например:

при р=0,3,

, и т.д.

Изобразим графически полученные распределения (см. Рис.12).

По рисунку видно, что при меньшем значении рабсцисса точки максимума сдвигается влево. При удалении от точки максимума высота уменьшается.

Замечание: Распределение Х близко к биномиальному, если для выборки её значений у полигона (гистограммы) одна или несколько соседнихвариант имеют наибольшую высоту и удаление от них даёт уменьшение высоты (вероятности);

Из теории вероятностей известно, что для биномиально распределённой случайной величины Х числовые характеристики ,.

Параметром биномиального распределения служит р, её значение статистически может быть найдено следующим образом:

1) Производится серия nисследований, в каждом из которых производитсяm испытаний (в каждом из которых А происходит либо нет). В каждом исследовании фиксируется число появлений события А.

Получаем последовательность целочисленных значений х1,х2, …..,хn().

2) Для данной выборки находим ;

3) Из оценки М(Х)=и условия, получаем,

.

5.1.2 Альтернативный признак

Пусть в каждом испытании исходом является «1», если выполнился некоторый признак, либо «0», если признак не выполнился (других исходов нет). Такой признак называется альтернативным. Альтернативным признаком может быть «годная – негодная деталь», пол работника «мужской – женский» , событие произошло – не произошло и т.д.

В результате нескольких испытаний при альтернативном признаке Х получим выборку с двумя вариантами «0» и «1».

Обозначим

р– вероятность появления признака в каждом испытании,

q– вероятность непоявления признака в каждом испытании (),

–относительная частота (доля) элементов, обладающих данным

признаком,

m– число элементов, обладающих признаком средиnисследованных.

В таком случае

,

,

.

Максимальная дисперсия альтернативного признака при фиксированном nдостигается прир=0,5 и равна, в остальных случаях она меньшее чем.

Для выборки с исследованием альтернативного признака возможно только две варианты «1» (событие А появилось) с частотой появления m, либо «0» (событие А не появилось) с частотой появленияnm.

В таком случае средняя для доли равна относительной частоте элементов с выполнением признака , она и является точечной оценкой вероятности появления признака в одном испытаниир. Дисперсия такого значения оценивает значение, стремится к нулю при увеличении объёма выборки.

По выборочным данным вероятность рпоявления события А (альтернативного признака) можно оценит его точечной оценкой–относительной частотой появления события А.

      1. Распределение Пуассона

Пусть производится mнезависимых испытаний, в каждом из которых событие А появляется либо нет, среднее число появлений события А является известной величиной.

Если обозначить случайную величину Х – число появлений события А, то формула Пуассона описывает вероятность для Х принимать значениеk,. В таком случае говорят, что случайная величина Х имеетраспределение Пуассона.

Из теории вероятностей известно, что биномиальное распределение превращается в распределение Пуассона при если при этом величинаостаётся постоянной (– среднее число появлений).

Для вычисления вероятностей применяется таблица значений (приложение 7).

Пример 8:

Описать распределение Пуассона при 1=1 ,2=3 , 3=5 .

Решение:В результате вычислений получим следующие распределения:

х

0

1

2

3

4

5

6

7

8

9

10

11

12

1

0.3679

0.3679

0.1839

0.0613

0.0153

0.0031

0.0005

0.0001

0

0

0

0

0

3

0.0498

0.1494

0.224

0.224

0.168

0.1008

0.0504

0.0216

0.0081

0.0027

0.0008

0.0002

0.0001

5

0.0067

0.0337

0.0842

0.1404

0.1755

0.1755

0.1462

0.1044

0.0653

0.0363

0.0181

0.0082

0.0034

Из теории вероятностей известно, что для случайной величины Х, имеющей распределение Пуассона, числовые характеристики .

Замечание: Распределение Х близко к распределению Пуассона, если для полигона (гистограммы) её выборочных значений одна или несколькососеднихвариант имеют наибольшую высоту и удаление от них даёт уменьшение высоты (вероятности), а значениене сильно отличается от;

Для случайной величины Х, имеющей распределение Пуассона, параметром служит число , её значение по выборочным данным может быть найдено следующим образом:

1) Производится серия nисследований, в каждом из которых производитсяm испытаний (в каждом из которых А происходит либо нет) и фиксируется число появлений события А. Получаем последовательность целочисленных значений

х1,х2, …..,хn();

2) Для данной выборки находим . Еслисильно отличается от, то распределение Пуассона вряд ли имеет место;

3) Из оценки и условия, получаем Frame30;