Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Загребаев Лектсии по теории вероятностеы и математическоы статистике 2015

.pdf
Скачиваний:
6
Добавлен:
12.11.2022
Размер:
4.61 Mб
Скачать

этот менеджер окончил Институт инновационного менеджмента и случайно вспомнил, чему его пять лет учили). С этой целью в один из дней был проведен хронометраж работы кассиров – сколько времени тратит кассир на обслуживание клиента. Предварительный анализ выборки из 1000 клиентов позволил получить распределение частот по временным интервалам, что отражено на гистограмме

(рис. 17.1).

Рис. 17.1. Гистограмма распределения эмпирических частот

Визуальный анализ гистограммы дает основание думать, что закон распределения имеет нормальный характер. Как проверить это предположение? Сформулируем задачу в общем виде.

Пусть высказывается предположение, что ряд наблюдений X1,..., Xn образует случайную выборку, извлеченную из генераль-

ной совокупности, имеющей плотность распределения вида f (x, θ1,..., θs ), где параметры θ1,..., θs неизвестны. В этом случае

для проверки гипотезы о том, что плотность распределения случайной величины X есть f (x, θ1,..., θs ) применяется критерий Пирсона.

Критерий Пирсона

Суть критерия cостоит в том, что сравниваются эмпирические и теоретические (в предположении справедливости гипотезы

H0: f = f (x, θ1,..., θs )) частоты. Например, получены следующие данные (табл. 17.1).

141

 

 

 

 

 

 

 

Таблица 17.1

Эмпирические и теоретические частоты

 

 

 

 

 

 

 

 

 

 

 

 

 

Эмпирические

5

13

38

74

106

85

30

10

4

частоты

 

 

 

 

 

 

 

 

 

Теоретические

3

12

45

82

99

76

37

11

2

частоты

 

 

 

 

 

 

 

 

 

Возникает вопрос: случайно ли расхождение частот? С одной стороны, расхождение частот может быть случайным и объясняется малым числом измерений и ошибками при измерении. С другой стороны, возможно, что закон распределения, который мы выбрали для описания случайной величины и на основании которого рассчитаны теоретические частоты, не соответствует действительности. На эти вопросы и отвечает критерий распределения Пирсона. Для применения критерия Пирсона сделаем следующие шаги:

1) разобьем область изменения случайной величины X на l интервалов 1,..., l и подсчитаем по экспериментальным данным

количество попаданий случайной величины в каждый из этих интервалов mi . При этом обычно разбиение на интервалы подчиняют

следующим условиям:

а) общее количество интеравлов l должно быть не менее 8. Предполагается, что число неизвестных параметров распределения s не превосходит 7 (На практике s 3);

б) в каждый интервал группировки должно попасть не менее 7– 10 выборочных значений xi ;

2) на основании выборочных данных x1,..., xn строятся оценки

неизвестных параметров θ1*,..., θ*s ;

 

 

 

 

 

3) вычислим вероятности событий, что значение случайной

ве-

личины X попадет в

i

интервал:

P = F

(x , θ*,..., θ* )

 

 

i

M

i

1

s

FM (xi1, θ1*,..., θ*s ) , где xi и xi1

– правый и левый концы интерва-

ла i .

 

 

 

 

 

 

 

Строим таблицу, где m1 + ... + ml = n; p1 + ... + pl = 1.

 

 

142

Таблица 17.2 Иллюстрация к определению закона распределения

Интервалы

1

2

….

l

Эмпирическая частота

m1

m2

….

ml

Теоретическая частота

n p1

n p2

….

n pl

Критерий χ2

l

(m np )2

=

i

np

i

. Из этого выражения видно, что

 

i=1

 

i

 

 

чем меньше отличие эмпирической и теоретической частоты, тем меньше значения критерия.

Можно доказать, что при n → ∞ этот критерий распределен по закону χ2 с числом степеней свободы k = l s 1. Если предпола-

гаемое распределение нормальное, то оно полностью характеризуется двумя параметрами – математическим ожиданием и средним квадратическим отклонением, следовательно, s = 2 и число степеней свободы k = l 3;

4) зададимся уровнем значимости α.

По таблицам находим такие критические точки χ12кр и χ22 кр , чтобы выполнялись соотношения

P(χ2 > χ2

кр

) = α

и P(χ2 > χ2

) = 1α .

2

2

1 кр

2

 

 

 

По экспериментальным данным и по теоретическим частотам вычисляется конкретное значение величины

 

 

 

 

 

 

l (m np )2

 

 

 

 

 

χнабл2

=

i np i .

 

 

 

 

 

 

i=1

i

Если полученное значение χнабл2

таково, что выполняется усло-

вие

χ2

< χ2

< χ2

кр

, то нет оснований для отвержения гипотезы

 

1 кр

набл

2

 

 

 

H0 . В противном случае гипотеза отвергается. Интересно отметить

тот факт, что нулевая гипотеза отвергается как при слишком большом различии между экспериментальными и теоретическими частотами, так и при слишком малом отличии. Последнее обстоятель-

143

ство может возникнуть, если неудачно выбран закон распределения или нарушена корректность и объективность эксперимента.

Пример. Вернемся к задаче об организации работы касс в супермаркете.

Решение.

Обработку результатов проведем с помощью программы Excel (рис. 17.2). Мы фактически уже сделали это при построении гистограммы. Для ее построения необходимо сделать следующее.

Рис. 17.2. Окно программы

В столбец А записываются результаты контроля за временем обслуживания клиента (приведен фрагмент). В столбце С задаются временные интервалы. В данном случае ширина интервала выбрана в 10 секунд. Затем выполняются действия Сервис → Анализ

данных → Гистограмма.

144

Рис. 17.3. Окно построения гистограммы

На вкладке гистограммы указывается входной интервал (столбец А с исходными данными), столбец карманов (столбец С). В результате выводится распределение частот по карманам (по временным интервалам) и сам график, если установлен флажок в опции «вывод графика». Дальнейший порядок расчетов поясняет табл. 17.3.

Таблица 17.3

 

 

 

Расчет теоретических частот

 

 

 

 

3

 

 

 

 

 

 

1

2

4

5

6

7

8

9

xi

xi+1

zi

zi+1

F(zi )

F(zi+1 )

npi

mi

1

20

30

2,87

2,60

0,002

0,005

5

6

2

30

40

2,60

2,34

0,005

0,01

5

6

3

40

50

2,34

2,07

0,01

0,02

9

9

4

50

60

2,07

1,80

0,02

0,04

16

14

5

60

70

1,80

1,54

0,04

0,06

26

36

6

70

80

1,54

1,27

0,06

0,10

39

37

7

80

90

1,27

1,01

0,10

0,16

54

60

 

 

 

 

145

 

 

 

 

 

 

 

 

 

 

Продолжение табл. 17.3

 

 

3

 

 

 

 

 

 

1

2

4

5

6

7

8

9

8

90

100

1,01

0,74

0,16

0,23

71

69

9

100

110

0,74

0,48

0,23

0,32

86

72

10

110

120

0,48

0,21

0,32

0,41

98

87

11

120

130

0,21

0,05

0,41

0,52

103

88

12

10

140

0,05

0,31

0,52

0,62

102

97

13

140

150

0,31

0,58

0,62

0,72

94

114

14

150

160

0,58

0,84

0,72

0,80

81

87

15

160

170

0,84

1,11

0,80

0,87

64

69

16

170

180

1,11

1,37

0,87

0,92

48

55

17

180

190

1,37

1,64

0,92

0,95

33

33

18

190

200

1,64

1,91

0,95

0,97

22

28

19

200

210

1,91

2,17

0,97

0,98

13

8

20

210

220

2,17

2,60

0,98

0,99

7

8

Для расчета теоретических частот весь временной интервал был разбит на 20 частей. В столбцах 2 и 3 показаны правая xi+1 и

левая xi границы интервалов соответственно. Затем рассчитыва-

лись середины интервалов

x′ =

xi + xi+1

 

и среднее выборочное зна-

 

 

 

 

 

 

i

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

ximi

 

 

 

 

 

 

 

 

 

 

 

 

 

чение x =

i=1

 

. В столбцах 4 и 5 представлены границы нор-

 

n

 

 

 

 

xi x

 

 

 

 

 

xi+1 x

 

 

мированных интервалов z

=

и z

i+1

=

.

Исправленная

 

 

 

 

 

i

 

sx

 

 

sx

 

 

 

 

 

 

 

 

 

 

выборочная дисперсия определялась по формуле

 

 

 

 

 

 

n

(xi x)2 mi

 

 

 

 

 

 

 

 

sx =

 

i=1

 

 

 

 

 

.

 

 

 

 

 

 

 

 

n 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

146

Для границ интервалов вычислялись значения функции распреде-

 

 

 

z

 

y2

 

 

 

 

 

z

 

y2

 

 

 

1

i

 

 

 

 

 

 

1

i+1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ления

F(z ) =

 

 

 

2 dy

и F(z

i+1

) =

=

 

 

 

2 dy.

От-

 

 

 

i

σ 2π

 

 

 

 

 

 

σ 2π

 

 

 

 

 

 

 

−∞

 

 

 

 

 

 

 

 

−∞

 

 

 

 

метим, что при этом использовалась стандартная функция НОРМРАСП (Вставка → Функция → Статистические →

НОРМРАСП).

Рис. 17.4. Окно функции НОРМПАСП

Теоретическая вероятность попадания в интервал i = zi+1 zi есть pi = F(zi+1) F(zi ), а теоретическая частота npi . Округлен-

ная до целых чисел теоретическая частота представлена в столбце 8 табл. 17.3. Для сравнения в столбце 9 приведены эмпирические

частоты. Далее вычислялось значение χнабл2

l

(m np )2

=

i

i

=

 

i=1

npi

 

 

= 21,62. По таблицам критических точек распределения χ2

нахо-

дим критическое значение χкр2 = 27,6.

 

 

 

 

147

Таблица 17.4

Число степеней

 

 

 

 

Уровень значимости α

 

свободы k

 

 

 

 

 

 

 

 

 

 

 

 

0.01

 

0,025

 

 

0,05

 

0,95

0,975

0,89

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

6,6

 

5,0

 

3,8

 

0,0039

0,00098

0,00016

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

33,4

 

30,2

 

 

 

 

8,67

7,56

6,41

17

27,6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

30

 

50,9

 

47,0

 

43,8

18,5

16.8

15,0

Так как χнабл2

< χкр2 ,

то нет оснований отвергать гипотезу о

нормальном законе распределении времени обслуживания кассиром клиента.

Вместо послесловия

Вот вы и прослушали (или прочитали) элементарные сведения из теории вероятностей и математической статистики. Что-то поняли, что-то нет. Огорчаться не стоит. К непонятному месту можно еще раз вернуться. Важно другое – можете ли вы посмотреть с позиций теории вероятностей и математической статистики на возникающую в вашей профессиональной деятельности проблему и сформулировать ее как математическую задачу. Это самое сложное. Если в математическом плане задача подходит под те, которые мы рассматривали – смело приступайте к решению, если нет – посмотрите дополнительную литературу. Мы же рассмотрели для примера только некоторые задачи теории вероятностей и математической статистики. И еще, вы не должны бояться читать книги по данному предмету. Хороших книг очень много – все не перечислить. Поскольку данный предмет не является вашей специальностью, – я не рекомендовал бы вам читать «очень умные» математические книжки. Начните с тех, где доступно излагаются основные идеи и методы. Список литературы прилагается. Желаю успеха!

148

Приложение 1

 

 

 

 

 

 

 

 

1

 

x

z2

 

 

 

 

 

 

Φ(x) =

 

 

 

 

 

Таблица значений функции Лапласа

 

2

 

dz

 

 

 

 

 

 

 

 

 

 

 

 

2π

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

x

 

Φ(x)

x

Φ(x)

x

Φ(x)

 

 

x

 

 

Φ(x)

 

 

 

 

 

 

 

 

 

 

 

 

0,00

 

0,0000

0,24

0,0948

0,48

0,1844

 

 

0,72

 

0,2642

0,01

 

0,0040

0,25

0,0987

0,49

0,1879

 

 

0,73

 

0,2673

0,02

 

0,0080

0,26

0,1026

0,50

0,1915

 

 

0,74

 

0,2703

0,03

 

0,0120

0,27

0,1064

0,51

0,1950

 

 

0,75

 

0.2734

0,04

 

0,0160

0,28

0,1103

0,52

0,1985

 

 

0,76

 

0,2764

0,05

 

0,0199

0,29

0,1141

0,53

0,2019

 

 

0,77

 

0,2794

0,06

 

0,0239

0,30

0,1179

0,54

0,2054

 

 

0,78

 

0,2823

0,07

 

0,0279

0,31

0,1217

0,55

0,2088

 

 

0,79

 

0,2852

0,08

 

0,0319

0,32

0,1255

0,56

0,2123

 

 

0,80

 

0,2881

0,09

 

0,0359

0,33

0,1293

0,57

0,2157

 

 

0,81

 

0,2910

0,10

 

0,0398

0,34

0,1331

0,58

0,2190

 

 

0,82

 

0,2939

0,11

 

0,0438

0,35

0,1368

0,59

0,2224

 

 

0,83

 

0,2967

0,12

 

0,0478

0,36

0,1406

0,60

0,2257

 

 

0,84

 

0,2995

0,13

 

0,0517

0,37

0,1443

0,61

0,2291

 

 

0,85

 

0,3023

0,14

 

0,0557

0,38

0,1480

0,62

0,2324

 

 

0,86

 

0,3051

0,15

 

0,0596

0,39

0,1517

0,63

0,2357

 

 

0,87

 

0,3078

0,16

 

0,0636

0,40

0,1554

0,64

0,2389

 

 

0,88

 

0,3106

0,17

 

0,0675

0,41

0,1591

0,65

0,2422

 

 

0,89

 

0,3133

0,18

 

0,0714

0,42

0,1628

0,66

0,2454

 

 

0,90

 

0,3159

0,19

 

0,0753

0,43

0,1664

0,67

0,2486

 

 

0,91

 

0,3186

0,20

 

0,0793

0,44

0,1700

0,68

0,2517

 

 

0,92

 

0,3212

0,21

 

0,0832

0,45

0,1736

0,69

0,2549

 

 

0,93

 

0,3238

0,22

 

0,0871

0,46

0,1772

0,70

0,2580

 

 

0,94

 

0,3264

 

 

 

 

 

 

 

 

 

 

 

 

 

 

149

Продолжение приложения 1

x

Φ(x)

x

Φ(x)

x

 

Φ(x)

x

Φ(x)

 

 

 

 

 

 

 

 

 

 

0,23

0,0910

0,47

0,1808

 

0,71

0,2611

0,95

0,3289

0,96

0,3315

1,37

0,4147

 

1,78

0,4625

2,30

0,4909

0,97

0,3340

1,38

0,4162

 

1,79

0,4633

2,38

0,4913

0,98

0,3365

1,39

0,4177

 

1,80

0,4641

2,40

0,4918

0,99

0,3389

1,40

0,4192

 

1,81

0,4649

2,42

0,4922

1,00

0,3413

1,41

0,4207

 

1,82

0,4656

2,44

0,4927

1,01

0,3438

1,42

0,4222

 

1,83

0,4664

2,46

0,4931

1,02

0,3461

1,43

0,4236

 

1,84

0,4671

2,48

0,4934

1,03

0,3485

1,44

0,4251

 

1,85

0,4678

2,50

0,4938

1,04

0,3508

1,45

0,4265

 

1,86

0,4686

2,52

0,4941

1,05

0,3531

1,46

0,4279

 

1,87

0,4693

2,54

0,4945

1,06

0,3554

1,47

0,4292

 

1,88

0,4699

2,56

0,4948

1,07

0,3577

1,48

0,4306

 

1,89

0,4706

2,58

0,4951

1,08

0,3599

1,49

0,4319

 

1,90

0,4713

2,60

0,4953

1,09

0,3621

1,50

0,4332

 

1,91

0,4719

2,62

0,4956

1,10

0,3643

1,51

0,4345

 

1,92

0,4726

2,64

0,4959

1,11

0,3665

1,52

0,4357

 

1,93

0,4732

2,66

0,4961

1,12

0,3686

1,53

0,4370

 

1,94

0,4738

2,68

0,4963

1,13

0,3608

1,54

0,4382

 

1,95

0,4744

2,70

0,4965

1,14

0,3729

1,55

0,4394

 

1,96

0,4750

2,72

0,4967

1,15

0,3749

1,56

0,4406

 

1,97

0,4756

2,74

0,4969

1,16

0,3770

1,57

0,4418

 

1,98

0,4761

2,76

0,4971

1,17

0,3790

1,58

0,4429

 

1,99

0,4767

2,78

0,4973

1,18

0,3810

11,59

0,4441

 

2,00

0,4772

2,80

0,4974

1,19

0,3830

1,60

0,4452

 

2,02

0,4783

2,82

0,4976

1,20

0,3849

1,61

0,4463

 

 

0,4793

2,84

0,4977

 

2,04

 

 

 

 

 

 

 

 

 

 

150

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]