Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Курсовик «статистические Методы Обработки Данных» По Теории Вероятностей (Беклемишев Н. Д.).doc
Скачиваний:
11
Добавлен:
07.10.2014
Размер:
374.78 Кб
Скачать

5.Проверка гипотезы о распределении с помощью критерия согласия Пирсона.

Ранее была выдвинута гипотеза о законе распределения рассматриваемой случайной величины. Сопоставление статистического распределения (гистограмма) и предполагаемого теоретического (графика плотности) показывает наличие некоторых расхождений между ними. Поэтому возникает естественный вопрос: чем объясняются эти несовпадения? Ответить на него можно двояко:

  1. Указанные расхождения несущественны и вызваны ограниченным количеством наблюдений и случайными факторами – случайностью результата единичного наблюдения, способа группировки данных и т.п. В этом случае выдвинутая гипотеза о распределении считается правдоподобной и принимается как не противоречащая опытным данным.

  1. Указанные расхождения являются существенными (неслучайными) и связаны с тем, что действительное распределение случайной величины отличается от предполагаемого. В этом случае выдвинутая гипотеза о распределении отвергается как плохо согласующаяся данными наблюдений.

Для выбора первого или второго варианта ответа и служат так называемые критерии согласия. Словари толкуют слово критерий (от греч. kriterion– средство для суждения) как признак, на основании которого производится оценка, определение и классификация чего-либо.

Существуют различные критерии согласия: К. Пирсона, А.Н. Колмогорова, Н.В. Смирнова, В.И. Романовского и другие. Мы рассмотрим лишь один из них – критерий Пирсона, называемый также критерием 2(«хи - квадрат»). (К. Пирсон (1857 - 1936) – английский математик, биолог, философ – позитивист.)

Критерий Пирсона выгодно отличается от остальных, во – первых, применимостью к любым (дискретным, непрерывным) распределениям и, во – вторых, простотой вычислительного алгоритма.

Правило проверки статистических гипотез с помощью критерия Пирсона будет объяснено на примерах.

Группировка исходных данных.

Применяется критерий Пирсона к сгруппированным данным. Предположим, что произведено nнезависимых опытов, в каждом из которых изучаемая случайная величина приняла определенное значение. Предположим, что вся числовая ось разбита на несколько непересекающихся промежутков (интервалов и полуинтервалов). Обозначим черезI количество результатов измерений (значений случайной величины), попавших вi-й промежуток. Очевидно, чтоI=n.

Отметим, что критерий 2 будет давать удовлетворительный для практических приложений результат, если:

  1. количество nопытов достаточно велико, по крайней мереn100;

  2. в каждом промежутке окажется не менее 5…10 результатов измерений, т.е. i5 при любомi; если количество полученных значений в отдельных промежутках мало (меньше 5), то такие промежутки следует объединить с соседними, суммируя соответствующие частоты.

Пусть концами построенного разбиения являются точки zi, гдеz1z2…zi – 1, т.е. само разбиение имеет вид

(- z0;z1) ,z1;z2) ,z2;z3) , … ,zi – 1;zi ).

После объединения соответствующих промежутков (последних двух) и замены самой левой границы разбиения на - , а самой правой на +(поскольку на промежутки должна разбиваться вся числовая ось, а не только диапазон полученных в результате опыта значений), мы приходим к следующим интервальным распределениям, пригодным для непосредственного применения критерия Пирсона:

zi –1; zi

- ; 3,2

3,2;5,2

5,2;7,2

7,2;9,2

9,2;11,2

11,2;13,2

i

5

9

16

23

25

30

13,2;15,2

15,2;17,2

17,2;19,2

19,2;21,2

21,2;+∞

22

20

16

8

6


    1. Вычисление теоретических частот.

Критерий Пирсона основан на сравнении эмпирических (опытных) частот с теоретическими. Эмпирические частоты Iопределяются по фактическим результатам наблюдений. Теоретические частоты, обозначаемые далее, находятся с помощью равенства

= n  pi ,

где n– количество испытаний, аpi zi –1xzi- теоретическая вероятность попадания значений случайной величины вi-й промежуток (1i1).Теоретические вероятности вычисляются в условиях выдвинутой гипотезы о законе распределения изучаемой случайной величины.

Процедура отыскания теоретических вероятностей и частот показана в расчетной таблице: _

n = 180; а=x= 12,11; σ= s=3,5

i

Концы промежутков

Аргументы фунцкции Ф0

Значения функции Ф0

Pi= Ф0(ui)- Ф0(ui-1)

ν1=npi

zi -1

zi

Ui-1=

(zi-1-x)/s

Ui=

(zi-x)/s

Ф0(ui-1)

Ф0(ui)

1

2

3

4

5

6

7

8

9

10

11

-∞

3,2

5,2

7,2

9,2

11,2

13,2

15,2

17,2

19,2

21,2

3,2

5,2

7,2

9,2

11,2

13,2

15,2

17,2

19,2

21,2

+∞

-∞

-2,55

-1,97

-1,40

-0,83

-0,26

0,31

0,88

1,45

2,03

2,60

-2,55

-1,97

-1,40

-0,83

-0,26

0,31

0,88

1,45

2,03

2,60

+∞

-0,5

-0,4946

-0,4756

-0,4192

-0,2967

-0,1026

0,1217

0,3106

0,4265

0,4788

0,4953

-0,4946

-0,4756

-0,4192

-0,2967

-0,1026

0,1217

0,3106

0,4265

0,4788

0,4953

0,5

0,0054

0,019

0,0564

0,1225

0,1941

0,2243

0,1889

0,1159

0,0523

0,0165

0,0047

0,972

3,42

10,152

22,05

34,938

40,374

34,002

20,862

9,414

2,97

0,846

:1,0000 180,00

    1. Статистика 2 и вычисление ее значения по опытным данным.

Для того чтобы принять или отвергнуть гипотезу о законе распределения изучаемой случайной величины, в каждом из критериев согласия рассматривается некоторая (специальным образом подбираемая) величина, характеризующая степень расхождения теоретического (предполагаемого) и статистического распределения.

В критерии Пирсона в качестве такой меры расхождения используется величина

,

называемая статистикой «хи - квадрат» или статистикой Пирсона(вообще, статистикой называют любую функцию от результатов наблюдений). Ясно, что всегда2 , причем2= 0, тогда и только тогда, когдапри каждомi, т.е. когда все соответствующие эмпирические и теоретические частоты совпадают. Во всех остальных случаях2; при этом значение2тем больше, чем больше различаются эмпирические и теоретические частоты.

Прежде чем рассказать о применении статистики 2к проверке гипотезы о закон е распределения , вычислим ее значение для данного варианта; это значение, найденное по данным наблюдений и в рамках выдвинутой гипотезы, будем обозначать через2набл..

i

i

1

2

3

4

5

6

7

8

9

10

11

5

9

16

23

25

30

22

20

16

8

6

0,972

3,42

10,152

22,05

34,938

40,374

34,002

20,862

9,414

2,97

0,846

16,69

9,10

3,37

0,04

2,83

2,67

4,24

0,04

4,61

8,52

31,40

: 180 180 83,50

2набл. = 83,50

Соседние файлы в предмете Теория вероятностей и математическая статистика