Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Umk_Oed

.pdf
Скачиваний:
5
Добавлен:
29.03.2016
Размер:
1.8 Mб
Скачать

статистической функции распределения Fn (x), для нее справедливы те же свойства, что и для функции F(x).

Пример 3.1. Для разработанной имитационной модели системы массового обслуживания отмечены времена Хi между поступлениями (мин.) 200 требований в систему за 1 час моделирования. Статистическая совокупность приведена в табл.3 .1.

Табл. 3.1. Интервалы времени n=199 между поступлениями требований (мин.), отсортированные в порядке возрастания

0,01

0,05

0,08

0,12

0,21

0,26

0,36

0,45

0,53

0,69

0,95

0,02

0,05

0,09

0,12

0,21

0,26

0,37

0,45

0,53

0,69

0,97

0,02

0,05

0,09

0,13

0,21

0,26

0,37

0,46

0,53

0,70

1,00

0,03

0,06

0,10

0,13

0,21

0,26

0,38

0,47

0,54

0,72

1,05

0,03

0,06

0,10

0,14

0,21

0,26

0,38

0,47

0,54

0,72

1,05

0,03

0,06

0,10

0,14

0,22

0,27

0,38

0,47

0,55

0,72

1,17

0,04

0,06

0,10

0,14

0,22

0,28

0,38

0,48

0,55

0,74

1,18

0,04

0,07

0,10

0,14

0,22

0,28

0,38

0,49

0,56

0,75

1,24

0,04

0,07

0,10

0,15

0,23

0,29

0,38

0,49

0,57

0,76

1,24

0,04

0,07

0,10

0,15

0,23

0,29

0,38

0,49

0,57

0,77

 

0,04

0,07

0,10

0,15

0,23

0,30

0,39

0,49

0,60

0,79

 

0,04

0,07

0,10

0,15

0,23

0,31

0,40

0,50

0,61

0,84

 

0,05

0,07

0,11

0,15

0,23

0,31

0,40

0,50

0,61

0,86

 

0,05

0,07

0,11

0,17

0,24

0,32

0,41

0,50

0,63

0,87

 

0,05

0,07

0,11

0,18

0,25

0,35

0,41

0,51

0,63

0,88

 

0,05

0,07

0,11

0,19

0,25

0,35

0,43

0,51

0,64

0,88

 

0,05

0,08

0,11

0,19

0,25

0,35

0,43

0,51

0,65

0,90

 

0,05

0,08

0,12

0,19

0,25

0,36

0,43

0,52

0,65

0,93

 

0,05

0,08

0,12

0,20

0,25

0,36

0,44

0,52

0,65

0,93

 

Построим по данным наблюдений статистический ряд (табл . 3.2). Табл.3.2

Ii

[0;0,1)

[0,1;0,2)

[0,2;0,3)

[0,3;0,4)

[0,4;0,5)

[0,5;0,6)

mi

41

34

30

20

19

18

p

0,206

0,171

0,151

0,101

0,095

0,090

i

 

 

 

 

 

 

Ii

[0,6;0,7)

[0,7;0,8)

[0,8;0,9)

[0,9;1)

[1;1,1)

[1,1;12)

mi

11

9

5

5

3

2

p

0,055

0,045

0,025

0,025

0,016

0,010

i

 

 

 

 

 

 

Ii

[1,2;1,3)

 

 

 

 

 

mi

2

 

 

 

 

 

p

0,010

 

 

 

 

 

i

 

 

 

 

 

 

Здесь через Ii обозначены интервалы значений времени; mi – число наблюдений в данном интервале;

pi mi / n − соответствующие частоты.

Для построения статистической функции распределения будем использовать границы х1 , х2 , … разрядов, которые используются в статистическом ряде.

Построим приближенно статистическую функцию распределени я по данным табл.3.2 (рис. 3.1).

F1 9 9 (0,0)=0;

F1 9 9 (0,1)=0,206;

F1 9 9

(0,2)=0,377;

F1 9 9

(0,3)=0,528;

F1 9 9

(0,4)=0,629;

F1 9 9

(0,5)=0,724;

F1 9 9

(0,6)=0,814;

F1 9 9

(0,7)=0,869;

F1 9 9

(0,8)=0,914;

F1 9 9

(0,9)=0,939;

F1 9 9

(1,0)=0,964;

F1 9 9

(1,1)=0,98;

F1 9 9

(1,2)=0,99;

F1 9 9

(1,3)=1,0.

 

 

F199(x)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

x

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

1,1

1,2

1,3

 

 

 

 

 

 

Рис.3.1

 

 

 

 

 

 

 

3.3 Гистограммы

 

 

 

 

 

 

 

 

 

 

 

 

Статистический ряд часто оформляется графически в виде гистограммы. Гистограмма строится следующим образом. По оси абсцисс откладываются разряды, и на каждом из разрядов строится прямоугольник, площадь которого равна частоте данного разряда.

Таким образом, высота каждого прямоугольника равна pi / h , где h

– длина разряда. Тогда полная площадь гистограммы равна единице. По отношению к статистической совокупности гистограмма

является по существу графической оценкой графика плотности распределения случайной величины Х. Поэтому гистограмма может быть хорошей подсказкой в выборе распределений, которые можно дальше использовать как модель данных наблюдений. Иногда визуально достаточно просто отнести гистограмму к определенной плотности распределения вероятностей, которые были рассмотрены в разделе 2.

Однако, у такого подхода есть свои недостатки. Это выражается в отсутствии четких правил по выбору числа k интервалов (разрядов) и длины h разрядов. Посмотрим это на примере статистической совокупности, приведен ной в табл.2.1. Ниже (рис.3.2, 3.3, 3 .4) приведены три гистограммы для одних и тех же статистических данных с различными длинами разрядов: h=0,05; h=0,075; h=0,1. Наиболее ровная гистограмма получена для h =0,1, ее форма напоминает форму графика плотности экспоненциального распределения.

y

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

2,5

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

1,5

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

0,5

 

 

 

 

 

 

 

 

 

0

0,05

0,2

0,35

0,5

0,65

0,8

0,95

1,1

1,25 x

Рис. 3.2.

y

 

 

 

 

 

 

 

2,5

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

1,5

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

0,5

 

 

 

 

 

 

 

0

0,075

0,3

0,525

0,75

0,975

1,2

x

Рис.3.3

y

2

1,5

1

0,5

0

x

0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3

Рис.3.4

3.4 Числовые характеристики статистического распределения

В разделе 3 были рассмотрены числовые характеристики случайных величин: математическое ожидание, дисперсия, начальные и центральные моменты различных порядков. Аналогичные числовые характеристики существуют и для статистических распределений. Для основной характеристики положения случайной вел ичины − математического ожидания – такой аналогией является среднее арифметическое значение статистической совокупности { xn }:

n

X (n) ( xi ) / n , (3.1)

i 1

где xi – значение случайной величины Х в i-м опыте, n – число опытов. Эту характеристику называют также статистическим средним или

выборочной средней.

Статистической (выборочной) дисперсией случайной величины Х называют среднее арифметическое квадратов отклонений наблюдаемых значений случайной величины от их среднего значения:

n

DX (n) [ (xi X (n))2 ] / n . (3.2)

i 1

Исправленной дисперсией называют величину

S 2 (n)

n

D

 

.

 

 

X (n)

n 1

 

 

 

 

 

 

 

Аналогично определяются статистические центральные моменты любых порядков:

 

 

 

n

m (n) ( xS ) / n ,

S

 

 

 

i

 

 

 

i 1

o

n

 

 

 

(n))S ] / n .

m (n)

[

(x

 

X

S

i 1

i

 

 

 

 

 

 

 

 

(3.3)

начальные и

(3.4)

(3.5)

Все эти определения полностью аналогичны определениям числовых характеристик случайной величины, с той разницей, что в них везде вместо математического ожидания присутствует среднее арифметическое. При увеличении числа опытов все статистические характеристики будут сходиться по вероятности к соответствующим характеристикам случайной величины и при достаточно большом n могут быть приняты приближенно равными им.

При очень большом колич естве опытов вычисление статистичес ких характеристик по формулам (3.1) – (3.5) становится трудоемким и тогда используют следующий прием: в статистическом ряде или гистограмме

~

и их частоты

 

и используют для

берут среднее значение разрядов xi

pi

вычисления характеристик как средневзвешенных.

Таким образом, статистические характеристики будут выражаться приближенными формулами:

 

 

k

~

,

 

 

X (n) xi pi

 

 

i 1

 

 

 

k

~

DX (n) (xi

 

i 1

 

 

 

k

 

mS (n)

 

 

i 1

o

k

~

 

mS (n)

(xi

 

i 1

 

где ~ −середина i-го разряда, xi

X (n))2 pi ,

~S xi pi ,

X (n))S pi ,

pi − частота i-го разряда, k

разрядов.

При решении задачи определения законов распределений будут использован ы еще две статистические характеристики:

Статистический коэффициент вариации cv(n) S 2 (n) / X (n)

и статистическая асимметрия

(3.6)

(3.7)

(3.8)

(3.9)

число

нами

(3.10)

A (n) m (n) /(S 2

(n))3/ 2 .

(3.11)

S

3

 

 

Воспользуемся вышеперечисленными характеристиками для подбора подходящих законов распределений для данных статистической совокупности, предполагая данные Х1 , Х2 , …, Хn независимыми и одинаково распределенными. Сост авим так называемую итоговую статистику (табл.3 .3).

Табл.3.3

Функция

Итоговая статистика

 

Примечание

 

Минимум,

Х1 , Хn

 

 

 

 

 

[Х1 , Хn ] – оценка

максимум

 

 

 

 

 

 

 

 

 

 

интервала

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

наблюдений.

Для

 

 

 

 

 

 

 

 

 

 

 

 

 

непрерывных

и

 

 

 

 

 

 

 

 

 

 

 

 

 

дискретных

 

 

 

 

 

 

 

 

 

 

 

 

 

 

данных.

 

 

Среднее m

 

 

 

 

 

 

 

 

 

 

Оценка

среднего

X (n)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

значения.

 

Для

 

 

 

 

 

 

 

 

 

 

 

 

 

непрерывных

и

 

 

 

 

 

 

 

 

 

 

 

 

 

дискретных

 

 

 

 

 

 

 

 

 

 

 

 

 

 

данных.

 

 

Медиана

 

 

 

 

 

 

 

 

 

 

Альтернативный

x0 , 5

 

 

X (( n 1) / 2) ,

 

показатель

 

 

 

 

 

 

 

 

n нечетное;

 

среднего

значения.

 

 

 

 

 

 

 

 

Для непрерывных и

 

 

 

x0,5 (n)

X((n/2) 1) ] 2 ,

 

дискретных

 

 

 

 

 

 

[X(n/2)

 

 

 

 

 

 

 

 

данных.

 

 

 

 

 

 

 

 

 

n четное.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Дисперсия σ2

S2 (n)

 

 

 

 

 

Показатель

 

 

 

 

 

 

 

 

 

 

 

 

 

 

изменчивости.

Для

 

 

 

 

 

 

 

 

 

 

 

 

 

непрерывных

и

 

 

 

 

 

 

 

 

 

 

 

 

 

дискретных

 

 

 

 

 

 

 

 

 

 

 

 

 

 

данных.

 

 

Коэффициент

 

 

 

 

 

 

 

 

 

 

Альтернативный

вариации

 

 

 

 

 

 

 

 

 

 

показатель

 

 

 

 

 

 

 

 

 

 

 

 

изменчивости.

Для

cv σ2 /m

cv(n) S 2 (n) /

 

(n)

 

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

непрерывных

 

 

 

 

 

 

 

 

 

 

 

 

 

 

данных.

 

 

Коэффициент

 

 

 

 

 

 

 

 

 

 

Альтернативный

Лексиса

τ(n) S 2 (n) /

 

(n)

 

показатель

 

X

 

 

τ=σ2 /m

 

 

 

 

 

 

 

 

 

 

изменчивости.

Для

 

 

 

 

 

 

 

 

 

 

 

 

 

дискретных

 

 

 

 

 

 

 

 

 

 

 

 

 

 

данных.

 

 

Асимметрия

 

 

 

 

 

 

 

 

 

 

Показатель

 

o

 

 

o

 

 

 

 

 

симметрии.

Для

A m3/(σ2 )3 / 2

A (n) m3 (n) /(S 2 (n))3/ 2

 

непрерывных

и

S

 

S

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

дискретных

 

 

 

 

 

 

 

 

 

 

 

 

 

 

данных.

 

 

С помощью указанных функций в некоторых случаях можно выдвинуть предположение относительно семейства распределений.

Значение
0,01
1,24
0,351
0,260
0,081144
0,813953
1,000

Для симметричного распределения (например, нормального), среднее m равно медиане х0 , 5 . Следовательно, если оценки X (n) и xˆ0,5 (n) примерно одинаковы, можно предположить, что распределение

данной совокупности симметрично.

Иногда информацию о форме непрерывного распределения можно получить с помощью коэффициента вариации cv. В частности, cv=1 для экспоненциального распределения. Для гамма – распределения и распределения Вейбулла значение cv больше 1, равно 1 или меньше 1, когда параметр формы α соответственно меньше 1, равен 1 или больше

1.

Для гиперэкспоненциального распределения cv≥1. Для остальных распределений, рассмотренных в разделах 2 и 3, величина cv<1.

Для дискретного распределения коэффициент Лексиса (lexis ratio) τ выполняет ту же роль, что и коэффициент вариации для непрерывного распределения. Его целесообразно использовать при определении распределений Пуассона, биномиального и отрицательного биномиального (геометрического). Для этих распределений τ=1, τ<1 и τ >1 соответственно.

Асимметрия АS – показатель симметрии распределения. Как было сказано уже в разделе 2, АS =0 для симметричного распределения, подобного нормальному. Если АS >0 (для экспоненциального распределения АS =2), распределение смещено вправо, а если АS <0, оно смещено влево. Таким образом, асимметрия может использоваться для того, чтобы выяснить, какую форму имеет лежащее в основе статистических данных распределение.

Определим эти функции итоговой статистики для ста тистической совокупности по временам Хi между поступлениями требований из примера 3.1.

Итоговая статистика

Минимум

Максимум

Среднее

Медиана

Дисперсия Коэффициент вариации Асимметрия

Из этой таблицы следует, что среднее и среднеквадратическое отклонение примерно равны. Коэффициент вариации близок к единице, асимметрия положительная, т.е. распределение смещено вправо. Результаты итоговой статистики говорят в пользу экспоненциального распределения, как наиболее подходящего среди рассмотренных в разделе 2.

Приведенный на рис.3 .1 приближенный график статистической

функции распределения, гистограммы и результаты итоговой статистики позволяют выдвинуть гипотезу о том, что данные распределения времени поступления требований в систему массового обслуживания распределены по экспоненциальному закону.

Так как теоретическая кривая экспоненциального распределения зависит от одного параметра λ=1/ М(Х), то подставив вместо

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

математического

ожидания

М(Х)

величину

 

X (n) , получим оценку

параметра

ˆ

 

 

 

 

 

 

 

 

 

 

 

 

Тогда,

вычислив

 

значения

функции

1/ 0,351 2,849 .

 

 

 

f(x)=2,849e− 2 , 8 4 9 x на границах разрядов

 

 

 

 

 

 

 

 

 

 

 

 

 

 

х

 

0

 

0,2

 

 

0,3

 

 

0,4

 

 

0,5

 

0,6

 

0,7

 

0,8

 

0,9

 

1,0

 

 

 

 

0,1

 

 

 

 

 

 

 

 

 

 

 

 

 

f(x)

 

2,85

 

2,14

1,61

1,21

0,91

 

 

0,69

 

0,52

 

0,39

 

0,29

 

0,22

 

0,17

,

 

х

 

1,1

 

1,2

1,3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f(x)

 

0,12

0,09

0,07

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

построим график этой функции пов ерх гистограммы (рис.3 .5).

 

 

 

 

 

 

 

f(x)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2,5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1,5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

x

0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3

Рис.3.5

Из графика видно, что теоретическая кривая плотности распределения f(x), сохраняя в основном существенные особенности статистического распределения, свободна от случайных неправильностей хода гистограммы.

На этом завершается рассмотрение первой из трех осн овных задач математической статистики.

3.5 Критерии согласия

В этом разделе рассматривается вопрос о согласованности

теоретического и статистического распределений. Допустим, что для данного статистического распределения подобрано теоретическое распределение (например, экспоненциальное). Между ними неизбежны некоторые расхождения. Поэтому возникает вопрос: объясняются ли эти расхождения только случайными обстоятельствами, связанными с ограниченным числом наблюдений, или же они являются существенными и свя заны с тем, что плохо подобрано теоретическое распределение. Ответ на этот вопрос дают так называемые критерии согласия.

Рассмотрим наиболее старый критерий согласия – критерий «хи – квадрат» К. Пирсона (К. Pearson, 1900), в котором мера расхождения между теоретическим и статистическим распределением обозначается

χ2 .

Проверяя согласованность теоретического и статистического распределений, исходят из расхождений между теоретическими вероятностями pi − попадания случайной величины в каждый из

разрядов статисти ческого ряда и полученными частотами pi .

Пусть результаты n опытов сведены в k разрядов и оформлены в статистический ряд

Ii

1 2 )

2 3 )

k k + 1 )

 

 

 

 

pi

p1

p2

 

pk

и пусть подобрана плотность распределения f(х). Тогда теоретические вероятности попадания случайной величины в i-й разряд статистического ряда

pi

αi 1

f (x)dx − для непрерывных данных,

 

αi

pi

p(xi ) − для дискретных данных,

 

αi xi αi 1

где р – вероятностная мера подобранного распределения (например, геометрического).

Тогда статистика критерия χ 2 определяется по формуле

χ2 n k ( pi pi )2 .

i1 pi

Для удобства вычислений (чтобы не иметь дела со слишком малыми величинами) можно ввести n под знак суммы и использовать критерий в виде

χ

2

k

(m np )2

.

 

i

i

 

 

 

 

 

i 1

 

npi

 

Отсюда видно, что величина χ 2 – случайная и ее распределение

зависит от параметра r, называемого числом степеней свободы распределения. Число степеней свободы r равно числу разрядов k минус

число независимых условий (связей), наложенных на частоты

p .

 

i

k

 

Например, таким условием может быть p 1.

 

i

 

i 1

 

В частности, если предполагаемое распределение экспоненциальное, то r=k−2. Если нормальное, то r=k−3.

В п.3.5.5 было отмечено, что распределение χ 2 является частным случаем гамма – распределения при α=r/2 и β=2. Таким образом, распределение χ 2 с r степенями свободы является распределением суммы квадратов r независимых случайных вели чин Хi , каждая из которых подчинена нормальному закону с параметрами mx =0, σx =1. Это распределение имеет плотность

 

 

r

1

 

u

 

 

 

 

u 2

e

2

 

 

 

 

 

 

 

 

 

 

r

 

 

 

 

 

fr (u)

 

 

(

r

 

 

2

2

)

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

0,

 

 

 

 

 

,u 0;

u 0,

где (z) t z 1e t dt − гамма – функция аргумента z.

0

Объясним теперь понятие критерия согласия.

Критерий согласия – это статистический критерий для проверки гипотезы, применяемый, чтобы формально оценить, являются ли данные наблюдений Х1 , Х2 , …, Хn независимой выборкой из определенного распределения с функцией распределения F(х) или плотностью f(x). Таким образом, критерий согласия используют для проверки так называемой нулевой гипотезы Н0 : Хi – независимые и одинаково распределенные случайные величины с функцией распределения F(х) или плотностью f(х).

После выбора определенного критерия множество всех его возможных значений разбивают на два непересекающихся подмножества: одно из них содержит значения критерия, при которых нулевая гипотеза отвергается, другое – при которых она принимается. Так как любой критерий представляет собой одномерную случайную величину, то все ее возможные значения принадлежат некоторому интервалу. Рассмотрим сказанное на примере критерия «хи − квадрат».

Зададимся вопросом нахождения такого значения χ кр2 (α,r) при

заданной вероятности (уровне значимости) α и зада нном числе степеней свободы r, при котором было бы выполнено условие:

P2 χкр2 (α, r)) α .

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]