Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Учебное пособие мат. статистика+контрольные работы

.pdf
Скачиваний:
11
Добавлен:
30.11.2016
Размер:
811.62 Кб
Скачать

Используя факт, что оценка дисперсии s2

получена в виде суммы слабоза-

 

 

 

 

X

 

висимых случайных величин, примем, что случайная величина s2 подчиняет-

 

 

 

 

 

 

 

x

ся нормальному закону с математическим ожиданием ms 2 =¾x2, и дисперсией

 

2

 

 

 

 

 

x

Ds2=

s4.

 

n ¡ 1

 

x

x

 

Доверительный интервал для оценки дисперсии в этом случае имеет вид:

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

P fjsx2 ¡ ¾x2j < 2s

 

 

¢ sx2g = 0; 95;

 

 

(n ¡ 1)

или, после подстановки значений в правую часть неравенства:

P fjsx2

¡ ¾x2j < 2r

2

¢ 142; 576 = 92; 515g = 0; 95:

19

Этот результат показывает, что при числе наблюдений порядка двух десятков, точность определения дисперсии составляет §90% с вероятностью 0,95, то есть точность крайне невысока.

Третий способ определения доверительного интервала предполагает, что случайная величина X подчиняется нормальному закону, в этом случае вели-

чина

V =

(n ¡ 1)sx2

подчиняется закону

Â2

с

n

¡

1

степенями свободы.

 

¾x2

 

 

 

Обращаясь к таблице критических точек распределения Â2, для 1=19,

получаем:

 

 

 

 

 

19 ¢ 152; 76

 

 

 

 

 

 

 

 

 

 

 

34; 2 >

 

> 9; 52;

 

откуда

 

 

 

 

¾2

 

 

 

 

 

 

 

 

 

 

 

1

 

¾2

 

 

 

 

 

 

 

1

 

 

 

 

 

<

 

 

 

<

 

 

 

;

 

 

 

 

34; 2

19 ¢ 142; 576

 

9; 59

Проведя простые вычисления, получаем доверительный интервал для оценки дисперсии в виде:

P f77; 2 < ¾x < 282; 5g = 0; 95:

ОЦЕНКА ВЕРОЯТНОСТИ ПО ЧАСТОТЕ

Точечная оценка

Для подсч¸та вероятности появления события проводится серия из n опытов, в качестве оценки вероятности принимается относительная частота: отношение количества опытов, в которых событие произошло – m, к полному количеству опытов:

w = mn :

51

Обратите внимание, что закон распределения относительной частоты – биномиальный, с вероятностью p наступления события при проведении опыта, которая неизвестна.

Интервальная оценка

Для нахождения доверительного интервала оценки p определим математическое ожидание и дисперсию оценки w. Для этого введ¸м вспомогательную случайную величину X, зависящую от результата опыта: если событие произошло, X=1, не произошло, X=0. Вероятность w выражается через значения X, полученные при каждом опыте:

1

 

+ x2 + ¢ ¢ ¢ + xn):

 

w = n

(x1

(8)

Математическое ожидание X равно:

mx = 1 ¢ p + 0 ¢ (1 ¡ p) = p:

Дисперсия X равна:

¾x2 = (1 ¡ p)2 ¢ p + (0 ¡ p)2 ¢ (1 ¡ p) = p(1 ¡ p):

Используя свойства математического ожидания, из (8) получаем:

mw = p;

оценка w – несмещ¸нная.

Применяя к формуле (8) операцию вычисления дисперсии, получаем:

¾2 = p(1 ¡ p):

w n

При сравнительно большом количестве испытаний (когда применимы теоремы Муавра-Лапласа для вычисления вероятностей в ситуации последовательности независимых испытаний) можно рассчитать доверительный интервал в нормальном приближении, используя формулы математического ожидания и стандартного отклонения w:

m = p; ¾ =

r

p(1 ¡ p)

:

n

w

w

 

Доверительный интервал получается из формулы:

P fjp ¡ mwj < t¯g = ¯;

52

где t¯, удовлетворяет соотношению p

t¯ =

p(1 ¡ p)

©¡1(¯);

n

 

 

а ©¡1(x) – функция, обратная функции Лапласа.

Для построения границ возможных значений вероятности p надо решить неравенство

jp ¡ mwj < p

 

 

©¡1

(¯):

n¡

 

 

 

p(1

p)

 

 

Существуют формулы и номограммы для точного определения границ доверительного интервала оценки вероятности, основанные на биномиальном распределении (См., например, учебник Е.С.Вентцель Теория вероятностей).

ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ

Другой способ определения адекватности статистических оценок опирается на схему проверки статистических гипотез о значениях оцениваемого параметра.

Идея его заключается в следующем.

Исследователь, на основании тех или иных теоретических и других данных формулирует гипотезу о действительном значении параметра µ. Например предполагается гипотеза, что истинное значение µ = 0. Обычно предполагаемая гипотеза называется нулевой и обозначается H0. Также часто определяется альтернативная гипотеза H1. Например, за альтернативную гипотезу можно принять утверждение µ 6= 0.

В принятых предположениях две гипотезы записываются в виде обо-

значений

H0 : µ = 0

H1 : µ 6= 0:

Альтернативная гипотеза включает в себя не одно, а множество значений µ, в данном случае все значения, кроме нулевого. Гипотеза, допускающая несколько значений параметра, называется сложной. Она отвечает существу задачи, но случай со сложными гипотезами теоретически трудно анализируется.

Теоретически разработан случай простых основной и альтернативной гипотез.

Рассмотрим общую схему проверки гипотез в случае простых основной и альтернативной гипотез.

53

H0 : µ = 0

H1 : µ = µ1:

Для иллюстрации изложения будем считать, что распределение по-

^

лученной в результате обработки выборки, оценки µ параметра µ – нормальное, с единичной дисперсией и математическим ожиданием, которое равно нулю в случае выполнения нулевой гипотезы и, µ1 в случае выполнения альтернативной.

Если верна нулевая гипотеза, закон распределения оценки парамет-

^

ра µ » N(0; 1) (нормальный, с нулевым математическим ожиданием и единичной дисперсией). По закону распределения можно построить доверительный интервал, в котором должна находиться граница оценки с заданной вероятностью. Например, с вероятностью P = 0; 95, при выпол-

^

нении гипотезы H0 значение оценки µ должно находиться в интервале

^

jµj < 2¾^;

µ

(правило двух сигм). Если в результате обработки выборки получена

^

оценка параметра µ, находящаяся в этом интервале, можно сказать, с известной долей смелости, что гипотеза H0 выполняется, или, аккурат-

^

нее: результаты опыта не противоречат гипотезе H0. Если µ окажется вне доверительного интервала сказав, что гипотеза H0 не выполняется, мы можем совершить ошибку, которая называется ошибкой первого рода и состоит в том, что нулевая гипотеза отвергнута, несмотря на то, что она в действительности выполняется. Вероятность ошибки первого рода в данном случае равна 0,05 – это вероятность того, что полученное значение оценки находится вне доверительного интервала.

Если нулевая гипотеза принята, то можно совершить ошибку второго рода – принять нулевую гипотезу, когда в действительности выполняется альтернативная. При выполнении альтернативной гипотезы закон

^

распределение оценки µ » N(µ1; 1). Вероятность ошибки второго рода, в данном случае, равняется вероятности попадания нормально распределенной с математическим ожиданием µ1 и единичной дисперсией величины в доверительный интервал для проверки нулевой гипотезы (¡2; 2).

Пусть µ1=5. Вероятность ошибки второго рода равна:

P (¡2 < x¹ ¡ 5 < 2) = P (3 < x¹ < 7) =

=©(7) ¡ ©(3) = 0; 5 ¡ 0; 49865 = 0; 00135:

Вданном случае вероятность ошибки второго рода оказалась очень маленькой.

54

Если µ1=1, вероятность ошибки второго рода равна:

P (¡2 < x¹ ¡ 1 < 2) = P (¡1 < x¹ < 3) =

= ©(3) ¡ ©(¡1) = 0; 49865 + 0; 3413 = 0; 84:

Вероятность ошибки второго рода велика, этот факт нельзя не учитывать при принятии нулевой гипотезы.

Неопытные исследователи очень часто игнорируют расчет вероятности ошибки второго рода, в результате могут не заметить необоснованность вывода.

Тем более, что в случае, когда альтернативная гипотеза сложная, вычислить ошибку второго рода трудно.

В рассматриваемом вначале варианте введение сложной альтерна-

^

тивная гипотеза H1 : µ =6 0 бессмысленно. Действительно условие, что истинное значение параметра равняется отличному от нуля, но очень маленькому значению, формально удовлетворяет альтернативной гипотезе, а по существу совпадает с нулевой. Ошибка второго рода в этом случае близка к единице, и задача различения нулевой и альтернативной гипотез бессмыслена и теоретически и практически.

ПРОВЕРКА ГИПОТЕЗЫ О РАСПРЕДЕЛЕНИИ НОРМАЛЬНОЙ СОВОКУПНОСТИ. КРИТЕРИЙ ПИРСОНА

Критерием согласия называется критерий проверки гипотезы о предполагаемом законе распределения случайной величины X на основании

обработки выборки fx1; x2; : : : ; xng.

Предполагается (нулевая гипотеза), что плотность распределения f(x; µ) случайной величины X зависит от вектора с неизвестными параметрами

µ = (µ1; µ2; : : : ; µr).

Аналогично тому, как это делается при построении гистограммы, интервал возможных значений X разбивается на m непересекающихся интервалов ¢i, (i = 1; : : : ; m), для которых определяются числа попаданий элементов выборки ni.

Для принятых значений составляющих вектора параметров µ и формы закона распределения вычисляются теоретические вероятности pi попадания случайной величины X в заданные интервалы ¢i.

В качестве критерия согласия выбирается случайная величина

Â2 = m (ni ¡ npi)2 : (9)

X

i=1 npi

55

Теоретически доказано, что при n ! 1 закон распределения этой величины стремится к закону распределения Â2 с k=1¡r степенями свободы, где m число интервалов, используемых при построении гистограммы, r – число дополнительных условий, используемых в теоретическом законе распределения, например, используются оценки математического ожидания и дисперсии.

В частности, если предполагаемое распределение – нормальное и определяется по оцененным математическому ожиданию и дисперсии, число степеней свободы k=1¡2=3.

Распределение Â2 – несимметричное, а нам важно заметить различие между выполнимостью гипотезы о виде закона распределения и имеющимися статистическими данными. Целесообразно взять односторонний критерий, принимая за область принятия нулевой гипотезы интервал между нул¸м (минимальное значение распределения Â2) и значением Â2кр(°; k), удовлетворяющим неравенству

P fÂ2 < Â2кр(¯; k)g < °:

Если для вычисленного значения Â2 это неравенство выполняется, нулевая гипотеза принимается.

Пример 18. Проверим гипотезу о том, что случайная величина, выборка которой рассмотрена в примере 12, подчиняется нормальному закону распределения с рассчитанными в примерах 14 и 15 математическим ожиданием m¤x=174; 95 и дисперсией s2x = 142; 576.

Решение: При построении гистограммы распределения выборки в примере 12 использовались интервалы

[150; 162); [162; 174); [174; 186); [186; 198); [198; 210):

(a)

а числа ni попаданий значений выборки в эти интервалы равны:

3; 6; 8; 2; 1:

(b)

Используя формулу для расч¸та вероятности попадания случайной величины X в интервал (a; b)

P fa < X < bg =

¾x2

¾x2

 

¾x2

 

¾

 

 

 

 

½

 

 

 

 

 

 

=

a ¡ mx

<

X ¡ mx

<

b ¡ mx

=

¡

µ

¾x2

 

 

 

 

 

 

 

µ

 

¾x2

 

 

 

 

= ©

b ¡ mx

 

©

a ¡ mx

;

 

 

 

 

 

 

 

56

получим теоретические вероятности попадания случайной величины X в интервалы (a): 0; 0985; 0; 3551; 0; 3503; 0; 1476; 0; 0244, а умножив эти вероятности на объ¸м выборки n=20, получим числа npi:

1; 97; 7; 102; 7; 006; 2; 952; 0; 488:

(c)

Подставляя числа ni и npi из (b) и (c) в (9), рассчитываем значение Â2 = 1; 695. Случайная величина Â2 имеет 5-1-2=2 степени свободы. Одностороннее критическое значение, взятое из таблицы критических значений распределения Â2, и соответствующее вероятности попадания в область принятия гипотезы с вероятностью 0,95 в нашем случае равно 6. Поскольку вычисленное значение Â2 меньше критического, гипотеза нормальности распределения принимается.

57

ПРИЛОЖЕНИЕ 1

ТАБЛИЦЫ

58

Таблица значений функции ©(x) = p12¼ R0x e¡t2=2 dt

x

©(x)

x

©(x)

x

©(x)

x

©(x)

0.01

0.0040

0.33

0.1293

0.65

0.2422

0.97

0.3340

0.02

0.0080

0.34

0.1331

0.66

0.2454

0.98

0.3365

0.03

0.0120

0.35

0.1368

0.67

0.2486

0.99

0.3389

0.04

0.0160

0.36

0.1406

0.68

0.2517

1.00

0.3413

0.05

0.0199

0.37

0.1443

0.69

0.2549

1.01

0.3438

0.06

0.0239

0.38

0.1480

0.70

0.2580

1.02

0.3461

0.07

0.0279

0.39

0.1517

0.71

0.2611

1.03

0.3485

0.08

0.0319

0.40

0.1554

0.72

0.2642

1.04

0.3508

0.09

0.0359

0.41

0.1591

0.73

0.2673

1.05

0.3531

0.10

0.0398

0.42

0.1628

0.74

0.2703

1.06

0.3554

0.11

0.0438

0.43

0.1664

0.75

0.2734

1.07

0.3577

0.12

0.0478

0.44

0.1700

0.76

0.2764

1.08

0.3599

0.13

0.0517

0.45

0.1736

0.77

0.2794

1.09

0.3621

0.14

0.0557

0.46

0.1772

0.78

0.2823

1.10

0.3643

0.15

0.0596

0.47

0.1808

0.79

0.2852

1.11

0.3665

0.16

0.0636

0.48

0.1844

0.80

0.2881

1.12

0.3686

0.17

0.0675

0.49

0.1879

0.81

0.2910

1.13

0.3708.

0.18

0.0714

0.50

0.1915

0.82

0.2939

1.14

0.3729

0.19

0.0753

0.51

0.1950

0.83

0.2967

1.15

0.3749

0.20

0.0793

0.52

0.1985

0.84

0.2995

1.16

0.3770

0.21

0.0832

0.53

0.2019

0.85

0.3023

1.17

0.3790

0.22

0.0871

0.54

0.2054

0.86

0.3051

1.18

0.3810

0.23

0.0910

0.55

0.2088

0.87

0.3078

1.19

0.3830

0.24

0.0948

0.56

0.2123

0.88

0.3106

1.20

0.3849

0.25

0.0987

0.57

0.2157

0.89

0.3133

1.21

0.3869

0.26

0.1026

0.58

0.2190

0.90

0.3159

1.22

0.3883

0.27

0.1064

0.59

0.2224

0.91

0.3186

1.23

0.3907

0.28

0.1103

0.60

0.2257

0.92

0.3212

1.24

0.3925

0.29

0.1141

0.61

0.2291

0.93

0.3238

1.25

0.3944

0.30

0.1179

0.62

0.2324

0.94

0.3264

 

 

0.31

0.1217

0.63

0.2357

0.95

0.3289

 

 

Продолжение на следующей странице.

59

ПРОДОЛЖЕНИЕ

x

©(x)

x

©(x)

x

©(x)

x

©(x)

1.26

0.3962

1.59

0.4441

1.92

0.4726

2.50

0.4938

1.27

0.3980

1.60

0.4452

1.93

0.4732

2.52

0.4941

1.28

0.3997

1.61

0.4463

1.94

0.4738

2.54

0.4945

1.29

0.4015

1.62

0.4474

1.95

0.4744

2.56

0.4948

1.30

0.4032

1.63

0.4484

1.96

0.4750

2.58

0.4951

1.31

0.4049

1.64

0.4495

1.97

0.4756

2.60

0.4953

1.32

0.4066

1.65

0.4505

1.98

0.4761

2.62

0.4956

1.33

0.4082

1.66

0.4515

1.99

0.4767

2.64

0.4959

1.34

0.4099

1.67

0.4525

2.00

0.4772

2.66

0.4961

1.35

0.4115

1.68

0.4535

2.02

0.4783

2.68

0.4963

1.36

0.4131

1.69

0.4545

2.04

0.4793

2.70

0.4965

1.37

0.4147

1.70

0.4554

2.06

0.4803

2.72

0.4967

1.38

0.4162

1.71

0.4564

2.08

0.4812

2.74

0.4969

1.39

0.4177

1.72

0.4573

2.10

0.4821

2.76

0.4971

1.40

0.4192

1.73

0.4582

2.12

0.4830

2.78

0.4973

1.41

0.4207

1.74

0.4591

2.14

0.4838

2.80

0.4974

1.42

0.4222

1.75

0.4599

2.16

0.4846

2.82

0.4976

1.43

0.4236

1.76

0.4608

2.18

0.4854

2.84

0.4977

1.44

0.4251

1-77

0.4616

2.20

0.4861

2.86

0.4979

1.45

0.4265

1.78

0.4625

2.22

0.4868

2.88

0.4980

1.46

0.4279

1.79

0.4633

2.24

0.4875

2.90

0.4981

1.47

0.4292

1.80

0.4641

2.26

0.4881

2.92

0.4982

1.48

0.4306

1.81

0.4649

2.28

0.4887

2.94

0.4984

1.49

0.4319

1.82

0.4656

2.30

0.4893

2.96

0.4985

1.50

0.4332

1.83

0.4664

2.32

0.4898

2.98

0.4986

1.51

0.4345

1.84

0.4671

2.34

0.4904

3.00

0.49865

1.52

0.4357

1.85

0.4678

2.36

0.4909

3.20

0.49931

1.53

0.4370

1.86

0.4686

2.38

0.4913

3.40

0.49966

1.54

0.4382

1.87

0.4693

2.40

0.4918

3.60

0.499841

1.55

0.4394

1.88

0.4699

2.42

0.4922

3.80

0.499928

1.56

0.4406

1.89

0.4706

2.44

0.4927

4.00

0.499968

1.57

0.4418

1.90

0.4713

2.46

0.4931

4.50

0.499997

1.58

0.4429

1.91

0.4719

2.48

0.4934

5.00

0.499997

60