
- •Министерство образования Российской Федерации
- •2.Нахождение точечных оценок математического ожидания и
- •3.Выдвижение гипотезы о распределении случайной величины.
- •4.Построение графика теоретической плотности распределения.
- •5.Проверка гипотезы о распределении с помощью критерия согласия Пирсона.
- •5.4. Распределение статистики 2.
- •Область принятия Критическая область
5.Проверка гипотезы о распределении с помощью критерия согласия Пирсона.
Ранее была выдвинута гипотеза о законе распределения рассматриваемой случайной величины. Сопоставление статистического распределения (гистограмма) и предполагаемого теоретического (графика плотности) показывает наличие некоторых расхождений между ними. Поэтому возникает естественный вопрос: чем объясняются эти несовпадения? Ответить на него можно двояко:
Указанные расхождения несущественны и вызваны ограниченным количеством наблюдений и случайными факторами – случайностью результата единичного наблюдения, способа группировки данных и т.п. В этом случае выдвинутая гипотеза о распределении считается правдоподобной и принимается как не противоречащая опытным данным.
Указанные расхождения являются существенными (неслучайными) и связаны с тем, что действительное распределение случайной величины отличается от предполагаемого. В этом случае выдвинутая гипотеза о распределении отвергается как плохо согласующаяся данными наблюдений.
Для выбора первого или второго варианта ответа и служат так называемые критерии согласия. Словари толкуют слово критерий (от греч. kriterion– средство для суждения) как признак, на основании которого производится оценка, определение и классификация чего-либо.
Существуют различные критерии согласия: К. Пирсона, А.Н. Колмогорова, Н.В. Смирнова, В.И. Романовского и другие. Мы рассмотрим лишь один из них – критерий Пирсона, называемый также критерием 2(«хи - квадрат»). (К. Пирсон (1857 - 1936) – английский математик, биолог, философ – позитивист.)
Критерий Пирсона выгодно отличается от остальных, во – первых, применимостью к любым (дискретным, непрерывным) распределениям и, во – вторых, простотой вычислительного алгоритма.
Правило проверки статистических гипотез с помощью критерия Пирсона будет объяснено на примерах.
Группировка исходных данных.
Применяется критерий Пирсона к сгруппированным данным. Предположим, что произведено nнезависимых опытов, в каждом из которых изучаемая случайная величина приняла определенное значение. Предположим, что вся числовая ось разбита на несколько непересекающихся промежутков (интервалов и полуинтервалов). Обозначим черезI количество результатов измерений (значений случайной величины), попавших вi-й промежуток. Очевидно, чтоI=n.
Отметим, что критерий 2 будет давать удовлетворительный для практических приложений результат, если:
количество nопытов достаточно велико, по крайней мереn100;
в каждом промежутке окажется не менее 5…10 результатов измерений, т.е. i5 при любомi; если количество полученных значений в отдельных промежутках мало (меньше 5), то такие промежутки следует объединить с соседними, суммируя соответствующие частоты.
Пусть концами построенного разбиения являются точки zi, гдеz1z2…zi – 1, т.е. само разбиение имеет вид
(- z0;z1) ,z1;z2) ,z2;z3) , … ,zi – 1;zi ).
После объединения соответствующих промежутков (последних двух) и замены самой левой границы разбиения на - , а самой правой на +(поскольку на промежутки должна разбиваться вся числовая ось, а не только диапазон полученных в результате опыта значений), мы приходим к следующим интервальным распределениям, пригодным для непосредственного применения критерия Пирсона:
-
zi –1; zi
- ; 3,2
3,2;5,2
5,2;7,2
7,2;9,2
9,2;11,2
11,2;13,2
i
5
9
16
23
25
30
13,2;15,2 |
15,2;17,2 |
17,2;19,2 |
19,2;21,2 |
21,2;+∞ |
22 |
20 |
16 |
8 |
6 |
Вычисление теоретических частот.
Критерий Пирсона
основан на сравнении эмпирических
(опытных) частот с теоретическими.
Эмпирические частоты Iопределяются по фактическим результатам
наблюдений. Теоретические частоты,
обозначаемые далее,
находятся с помощью равенства
=
n
pi
,
где n– количество испытаний, аpi zi –1xzi- теоретическая вероятность попадания значений случайной величины вi-й промежуток (1i1).Теоретические вероятности вычисляются в условиях выдвинутой гипотезы о законе распределения изучаемой случайной величины.
Процедура отыскания теоретических вероятностей и частот показана в расчетной таблице: _
n = 180; а=x= 12,11; σ= s=3,5
i |
Концы промежутков |
Аргументы фунцкции Ф0 |
Значения функции Ф0 |
Pi= Ф0(ui)- Ф0(ui-1) |
ν1’=npi | |||
zi -1 |
zi |
Ui-1= (zi-1-x)/s |
Ui= (zi-x)/s |
Ф0(ui-1) |
Ф0(ui) | |||
1 2 3 4 5 6 7 8 9 10 11 |
-∞ 3,2 5,2 7,2 9,2 11,2 13,2 15,2 17,2 19,2 21,2
|
3,2 5,2 7,2 9,2 11,2 13,2 15,2 17,2 19,2 21,2 +∞
|
-∞ -2,55 -1,97 -1,40 -0,83 -0,26 0,31 0,88 1,45 2,03 2,60
|
-2,55 -1,97 -1,40 -0,83 -0,26 0,31 0,88 1,45 2,03 2,60 +∞
|
-0,5 -0,4946 -0,4756 -0,4192 -0,2967 -0,1026 0,1217 0,3106 0,4265 0,4788 0,4953
|
-0,4946 -0,4756 -0,4192 -0,2967 -0,1026 0,1217 0,3106 0,4265 0,4788 0,4953 0,5
|
0,0054 0,019 0,0564 0,1225 0,1941 0,2243 0,1889 0,1159 0,0523 0,0165 0,0047
|
0,972 3,42 10,152 22,05 34,938 40,374 34,002 20,862 9,414 2,97 0,846
|
:1,0000 180,00
Статистика 2 и вычисление ее значения по опытным данным.
Для того чтобы принять или отвергнуть гипотезу о законе распределения изучаемой случайной величины, в каждом из критериев согласия рассматривается некоторая (специальным образом подбираемая) величина, характеризующая степень расхождения теоретического (предполагаемого) и статистического распределения.
В критерии Пирсона в качестве такой меры расхождения используется величина
,
называемая
статистикой «хи - квадрат» или
статистикой Пирсона(вообще, статистикой
называют любую функцию от результатов
наблюдений). Ясно, что всегда2
, причем2= 0, тогда и только тогда, когдапри каждомi, т.е. когда
все соответствующие эмпирические и
теоретические частоты совпадают. Во
всех остальных случаях2; при этом значение2тем больше,
чем больше различаются эмпирические и
теоретические частоты.
Прежде чем рассказать о применении статистики 2к проверке гипотезы о закон е распределения , вычислим ее значение для данного варианта; это значение, найденное по данным наблюдений и в рамках выдвинутой гипотезы, будем обозначать через2набл..
-
i
i
1
2
3
4
5
6
7
8
9
10
11
5
9
16
23
25
30
22
20
16
8
6
0,972
3,42
10,152
22,05
34,938
40,374
34,002
20,862
9,414
2,97
0,846
16,69
9,10
3,37
0,04
2,83
2,67
4,24
0,04
4,61
8,52
31,40
:
180 180 83,50
2набл. = 83,50