Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

3645

.pdf
Скачиваний:
2
Добавлен:
08.01.2021
Размер:
612.17 Кб
Скачать
(xi , yi )

 

 

 

1,20

 

 

 

 

 

 

 

1,00

 

 

 

 

 

 

 

0,80

 

 

 

 

 

 

 

0,60

 

 

 

N100

 

 

 

 

 

 

N(0,1)

 

 

 

 

 

 

 

 

 

 

0,40

 

 

 

 

 

 

 

0,20

 

 

 

 

 

 

 

0,00

 

 

 

 

-3,0000

-2,0000

-1,0000

0,0000

1,0000

2,0000

3,0000

4,0000

 

 

 

 

Рисунок 2

 

 

 

Обозначим через xi абсциссу середины i -го разряда. Тогда точка есть середина верхнего основания прямоугольника i -го разряда.

Соединяя эти точки отрезками прямых линий, получим полигон частот,

который позволяет сравнить гистограмму с функцией плотности теоретического распределения, к которой стремится гистограмма при увеличении n и неограниченном уменьшении длины разряда.

Задача 3.

Используя данные задачи 2 построить на одном графике для сравнения гистограмму, полигон частот и функцию плотности стандартного нормального распределения.

Решение.

Используя таблицу (3) составим таблицу (4) для построения требуемых графиков. Графики представлены на рисунке 3. Графики показывают небольшую левую асимметрию и выброс в центре, обусловленные случайными отклонениями.

Таблица 4

i

a

x

n

p

y

(a )

 

i

i

i

i

i

i

10

0

-3,0000

 

0

 

0,00

0,0000

 

 

0,004432

 

 

 

 

1

-2,4063

-2,1463

4

 

0,04

0,0769

 

 

0,022056

 

 

 

 

2

-1,8863

-1,6263

8

 

0,08

0,1538

 

 

0,067335

 

 

 

 

3

-1,3663

-1,1063

10

0,10

0,1923

 

 

0,156863

 

 

 

 

4

-0,8463

-0,5863

26

0,26

0,5000

 

 

0,278849

 

 

 

 

5

-0,3263

-0,0663

18

0,18

0,3462

 

 

0,378255

 

 

 

 

6

0,1937

0,4537

13

0,13

0,2500

 

 

0,391531

 

 

 

 

7

0,7137

0,9737

9

 

0,09

0,1731

 

 

0,309254

 

 

 

 

8

1,2337

1,4937

8

 

0,08

0,1538

 

 

0,186393

 

 

 

 

9

1,7537

2,0137

3

 

0,03

0,0577

 

 

0,085726

 

 

 

 

10

2,2737

2,5337

1

 

0,01

0,0192

 

 

0,030086

 

 

 

 

11

2,7937

 

 

 

 

 

 

 

0,008057

 

 

 

 

12

3,0000

 

100

 

 

 

 

0,004432

 

 

 

 

 

 

 

 

 

 

0,60

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,50

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,40

 

0,392

 

 

 

 

 

 

 

 

 

 

 

0,378

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,30

 

 

0,309

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,279

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,20

 

 

 

0,186

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,157

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,10

 

 

 

 

0,086

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,067

 

 

 

 

 

 

 

 

 

 

 

 

0,022

 

 

 

 

 

 

 

 

0,030

0,008

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,004

 

 

 

0,00

 

 

 

 

 

 

 

0,004

 

 

-2,41

-1,89

-1,37

-0,85

-0,33

0,19

0,71

1,23

1,75

2,27

2,79

 

Рисунок 3

2.Критерии согласия эмпирического и теоретического законов распределения.

Построенные на рисунках 2 и 3 графики позволяют высказать предположение о том, что наблюдаемая случайная величина имеет нормальное распределение с математическим ожиданием 0 и дисперсией 1 -

N (0,1) . Способы, позволяющие проверить это утверждение (гипотезу),

называются критериями.

2.1 Критерий Колмогорова

11

Этот критерий основывается на максимальном значении модуля разности между статистической функцией распределения Fn (x) и теоретической функцией распределения F (x) :

D max Fn (x) F(x)

А.Н. Колмогоров доказал, что для любой непрерывной функции распределения F (x) вероятность неравенства

Dn

при неограниченном возрастании n стремится к пределу

P( ) 1 (1)k e 2k 2 2

k

Значения этих вероятностей для различных значений приведены в таблице

5.

Таблица 5

 

P()

 

P()

 

P()

0,000

1,000

0,700

0,711

1,400

0,040

0,100

1,000

0,800

0,544

1,500

0,022

0,200

1,000

0,900

0,393

1,600

0,012

0,300

1,000

1,000

0,270

1,700

0,006

0,400

0,997

1,100

0,178

1,800

0,003

0,500

0,964

1,200

0,112

1,900

0,002

0,600

0,864

1,300

0,068

2,000

0,001

Покажем, как работает критерий Колмогорова на примере конкретной задачи

Задача 4

Используя данные задачи 3, проверить гипотезу о том, что выборка значений случайной величины произведена из нормального распределения

N (0,1) .

Решение.

В таблице 3 сосчитано значение D для этой выборки:

D 0,107917

Вычислим :

Dn 0,107917 10 1, 08

12

Интерполируя по таблице 5, находим P(1, 08) 0, 20 . Эта вероятность довольно велика, поэтому можно считать, что высказанная гипотеза не противоречит опытным данным. Если бы вычисленное значение оказалось порядка 0,01, то мы бы отвергли эту гипотезу на уровне значимости 0,05, так как при таком уровне значимости мы считаем все события, вероятность которых меньше 0,05 практически невозможными.

2.2. Критерий хи-квадрат.

Другим критерием, позволяющим проверить соответствие теоретической и статистической функции распределения, является критерий хи-квадрат, который основан на статистике (функции наблюденных значений):

2 n ( pi pi )2

i pi

Это выражение удобно переписать в другом виде:

2 (ni npi )2 .

inpi

Последнее выражение более удобно для вычислений.

Здесь, как и прежде, ni - число наблюдений, попавших в i - й разряд, а pi -

теоретическая вероятность попадания в i - й разряд согласно функции распределения F (x) случайной величины X .

К. Пирсон доказал, что при неограниченном увеличении числа опытов

n и для любой функции F (x) распределение статистики 2 стремится к

одному и тому же пределу, именно функции распределения хи-квадрат с r k s степенями свободы. Степени свободы это линейные ограничения,

наложенные на частоты pi . Например, одно ограничение есть всегда:

pi 1.

i

Если других ограничений нет, то число степеней, свободы равно 1, а

r k 1.

13

могут быть еще ограничения, обусловленные оценками неизвестных параметров. Этот случай мы рассмотрим несколько позже. Для распределения 2 составлены специальные таблицы, оно также включено в состав математического обеспечения многих программных продуктов, в

частности, Excel. Рассмотрим применение критерия 2 на примере задачи.

Задача 5

Используя данные задачи 3, проверить по критерию 2 гипотезу о том,

что выборка значений случайной величины произведена из нормального распределения N (0,1) .

Решение.

Исходим из данных таблицы 3. Для применения критерия 2 ,

требуется, чтобы количество наблюдений в разряде было не менее 5.

Поэтому объединяем 1 и 2 разряды, а также 8, 9 и 10 разряды таблицы 3. В

результате приходим к таблице 6. В новой таблице будет 7 разрядов, причем a1 , а a8 , так как теоретически нормально распределенная случайная величина может принимать любые значения на числовой прямой.

В таблице обозначено:

(ai ) - значение функции стандартного распределения в точке ai , а

pi (ai 1 ) (ai )

Вправом нижнем углу желтым цветом выделено значение статистики

2 и вероятность наблюдать такое или большее значение за счет случайных

отклонений. Как видим, вероятность довольно большая, поэтому нет оснований отвергать проверяемую гипотезу. Заметим, однако, что эта вероятность несколько меньше, чем для критерия Колмогорова.

Таблица 6

i

ai

ni

(ai )

pi

npi

ni npi

(ni npi )2

 

npi

 

 

 

 

 

 

 

1

-∞

 

0,0000

 

 

 

 

 

2

-1,3663

12

0,0859

0,0859

8,59

3,41

1,3522

3

-0,8463

10

0,1987

0,1128

11,28

-1,28

0,1445

4

-0,3263

26

0,3721

0,1734

17,34

8,66

4,3248

 

 

 

 

14

 

 

 

 

m 0,1391

5

0,1937

18

0,5768

0,2047

20,47

-2,47

0,2979

6

0,7137

13

0,7623

0,1855

18,55

-5,55

1,6606

7

1,2337

9

0,8913

0,1291

12,91

-3,91

1,1818

8

+∞

12

1,0000

0,1087

10,87

1,13

0,1182

 

100

 

1,0000

100,00

0,00

9,0801

 

 

 

 

 

 

 

0,1691

Рассмотрим теперь следующую задачу.

Задача 6

Используя данные задачи 3, проверить по критерию 2 гипотезу о том,

что выборка значений случайной величины произведена из нормального распределения, параметры которого математическое ожидание и

среднеквадратическое отклонение нам неизвестны. Вместо них использовать оценки этих параметров, рассчитанные по выборке:

иs 1, 0322 . Методы расчета оценок параметров будут рассмотрены в

следующем разделе.

Решение.

Построим таблицу 7, такую же, как таблица 6, но вместо функции (x) будем

использовать функцию

(x) нормального распределения с параметрами

m 0,1391 и s 1, 0322 . Получим следующую таблицу.

 

 

 

Таблица 7

 

 

 

 

 

 

 

 

 

i

ai

ni

(ai )

pi

npi

ni npi

(ni npi )2

 

npi

1

-∞

 

0,0000

 

 

 

 

 

 

 

2

-1,3663

12

0,1172

0,1172

11,72

0,28

 

0,0065

 

3

-0,8463

10

0,2466

0,1294

12,94

-2,94

 

0,6676

 

4

-0,3263

26

0,4280

0,1814

18,14

7,86

 

3,4046

 

5

0,1937

18

0,6264

0,1984

19,84

-1,84

 

0,1704

 

6

0,7137

13

0,7956

0,1692

16,92

-3,92

 

0,9090

 

7

1,2337

9

0,9082

0,1126

11,26

-2,26

 

0,4530

 

8

+∞

12

1,0000

0,0918

9,18

2,82

 

0,8685

 

 

100

 

1,0000

100,00

0,00

 

6,4796

 

 

 

 

 

 

 

 

 

0,1661

 

Новое значение статистики 2 6, 4796 , а вероятность такого же или большего отклонения, вычисленная при числе степеней свободы r 7 1 2 4 , оказалась равной 0,1661, т.е. почти такая же, как и в предыдущем случае. Поэтому мы с таким же уровнем доверия можем

15

принять гипотезу о том, что данные извлечены из распределения

N(0,1391;1, 0322) .

3. Оценка числовых характеристик и неизвестных параметров1

распределения.

3.1. Точечные оценки моментов распределения.

Напомним, что понятие момента пришло в теорию вероятностей из механики, где моменты используются для описания распределения масс. В

теории вероятностей моменты служат для описания распределения вероятностной массы.

Различают моменты относительно начала координат, так называемые

начальные моменты. Для дискретной случайной величины начальный момент r - го порядка задается формулой:

r xir pi i

Начальный момент 1-го порядка называется математическим ожиданием и характеризует положения центра распределения:

M[ X ] 1 xi pi

i

Физически математическое ожидание представляет центр тяжести распределенной массы.

Центральные моменты вычисляются относительно математического ожидания:

r

(xi )r pi

 

i

Мы будем рассматривать только первые 4 момента, которые в основном используются на практике.

Центральный момент 1-го порядка равен 0.

1 Параметрами мы называем такие числовые характеристики, которые явно входят в выражение для функции плотности или распределения вероятностей случайной величины.

 

 

1

 

 

 

( x )2

 

Например, μ и σ для нормального закона с плотностью f (x)

 

 

e

2 2

.

 

 

 

 

 

 

 

 

2

 

 

16

 

 

 

 

 

 

 

Центральный момент 2-го порядка характеризует рассеяние вероятностной массы относительно центра распределения и называется

дисперсией:

D[ X ] 2 (xi )2 pi .

i

Третий и четвертый центральные моменты служат для определения асимметрии A распределения и эксцесса E (меры островершинности)

распределения:

A 33

E 4 34

Для непрерывной случайной величины формулы для моментов

заменяются интегралами. Так, например, формула для центрального момента

r -го порядка будет следующей:

 

 

r

(x )r f (x)dx (x )r dF(x) ,

 

 

где f (x) - плотность, а F (x) - функция распределения вероятностей случайной

величины X . Аналогично изменятся и другие формулы.

Точным статистическим аналогом моментов теоретического

(истинного) распределения являются моменты статистической функции распределения, которые вычисляются по формулам:

m

1

i

xr

 

r

 

n

i

mr

 

1

(xi m)r

n

 

 

i

 

Для первых четырех моментов имеем:

 

 

 

 

1

xi

(3)

 

 

 

 

 

m m1

 

n

 

 

 

 

 

i

 

 

m2

 

1

(xi

m)2

(4)

n

 

 

 

i

 

 

 

m3

 

1

(xi

m)3

(5)

n

 

 

 

i

 

 

 

17

m4

 

1

 

(xi m)4

(6)

n

 

 

 

 

 

 

i

 

 

 

A

 

m3

 

 

 

 

 

(7)

 

s3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

E

 

m4

 

3

(8)

s4

 

 

 

 

 

 

 

 

 

 

 

где

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s

 

 

 

 

n

 

 

 

m

(9)

 

 

 

 

 

 

 

 

 

 

 

n 1

2

 

 

 

 

 

 

 

Приведенные выше статистики являются состоятельными оценками соответствующих численных характеристик истинного распределения, т.е.

при возрастании n сходятся по вероятности к соответствующим значениям.

Но несмещенными являются только оценки m , в частности, оценка m . Легко

r

проверить, что M[m ]

n 1

 

 

,

 

поэтому при малых n

для оценки дисперсии

 

 

2

2

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

используется выборочная дисперсия:

 

 

 

 

 

s2

 

1

 

 

(xi m)2

n

 

m2

(10)

 

 

n 1

n 1

 

 

 

 

i

 

 

Ясно, что при больших n статистики s2 и m2 эквивалентны.

Рассмотрим технику вычисления выборочных моментов на конкретных примерах.

3.1.1. Малая выборка

Задача 7.

Произведено 16 измерений начальной скорости снаряда. Результаты измерений (в м/сек) следующие: 1245.6, 1247.5, 1242.9, 1246.2, 1248.5, 1244.2,

1245.9, 1243.3, 1244.5, 1246.8, 1247.6, 1243.1, 1244.3, 1247.5, 1245.4, 1244.7.

Вычислить 4 первых выборочных момента распределения, а также асимметрию и эксцесс.

Решение.

18

Составляем таблицу Таблица 8

№п/п

xi

zi=xi-m

zi2

zi3

zi4

1

1245,6

0,1

0,01

0,0010

0,0001

2

1247,5

2

4

8,0000

16,0000

3

1242,9

-2,6

6,76

-17,5760

45,6976

4

1246,2

0,7

0,49

0,3430

0,2401

5

1248,5

3

9

27,0000

81,0000

6

1244,2

-1,3

1,69

-2,1970

2,8561

7

1245,9

0,4

0,16

0,0640

0,0256

8

1243,3

-2,2

4,84

-10,6480

23,4256

9

1244,5

-1

1

-1,0000

1,0000

10

1246,8

1,3

1,69

2,1970

2,8561

11

1247,6

2,1

4,41

9,2610

19,4481

12

1243,1

-2,4

5,76

-13,8240

33,1776

13

1244,3

-1,2

1,44

-1,7280

2,0736

14

1247,5

2

4

8,0000

16,0000

15

1245,4

-0,1

0,01

-0,0010

0,0001

16

1244,7

-0,8

0,64

-0,5120

0,4096

19928

0

45,9

7,3800

244,2102

Затем по формулам (3) – (10) вычисляются требуемые величины:

m = m'1

1245,5

m2

2,8687

3,0600

m3

0,4612

m4

15,2631

S

1,7493

A*

0,0862

E*

-1,3699

3.1.2. Большая выборка

Задача 8.

Используя данные табл.2, вычислить 4 первых выборочных момента распределения, а также асимметрию и эксцесс.

Решение.

Составляем таблицу:

Таблица 9

i

ai

ni

pi*

xi*

xi*pi*

zi=xi*-m zipi*

zi2pi*

zi3pi*

zi4pi*

1

-

 

 

 

 

 

 

 

 

 

2,406341

4

0,04

-2,1463 -0,08585

-2,0072 -0,080290,161154

-0,3235

0,6493

2

-

 

 

 

 

 

 

 

 

 

1,886341

8

0,08

-1,6263 -0,13011 -1,4872 -0,118980,176941

-0,2631

0,3914

3

-

10

0,10

-1,1063 -0,11063

-0,9672 -0,096720,093548 -0,0905

0,0875

 

 

 

 

 

19

 

 

 

 

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]