Критерий согласия пирсона
Для проверки гипотез о виде распределения
применяются различные критерии согласия:
(«хи- квадрат») К. Пирсона или критерий
Колмогорова. Наиболее удобным и
универсальным критерием является
критерий
Пирсона. Он совершенно не зависит ни от
вида распределения случайной величины,
ни от ее размерности.
Ограничимся описанием применения критерия Пирсона для проверки гипотезы о нормальном распределении генеральной совокупности (критерий аналогично применяется и для других распределений).
Схема применения критерия согласия
:
1). Выдвигается гипотеза
:
генеральная совокупность имеет нормальное
распределение с плотностью вероятностей
:

с параметрами
,
,
то есть выборочное среднее
и модифицированная выборочная дисперсия
принимаются соответственно за
математическое ожидание
и дисперсию
нормально распределенной случайной
величины.
2). По выборке наблюдений случайной
величины
составляется группированный вариационный
ряд (таблица 4).
3). Вычисляются вероятности

попадания значений случайной величины
в
-тый
интервал.
Для нормального закона
.
Здесь
– функция распределения нормального
закона
,
значения которой находят по таблицам.
4). Вычисляется выборочное значение
статистики критерия
:
,
где
– число интервалов разбиения выборки;
– объем выборки;
– частота
-того
интервала;
– теоретическая вероятность попадания
значений случайной величины
в
-тый
интервал.
К. Пирсон доказал, что эта статистика
независимо от вида распределения
генеральной совокупности при
имеет
- распределение с
степенями свободы, где
– число интервалов разбиения,
– число оцениваемых параметров
гипотетического закона распределения.
Для нормального закона
(параметры
и
).
5). Областью отклонения
(критической областью) гипотезы
называется такая область, при попадании
в которую статистики
гипотеза
отклоняется. Область отклонения
выбирается так, чтобы вероятность
попадания в нее величины
,
когда гипотеза
верна, была равна уровню значимости.
Тогда критическая точка
,
ограничивающая область
,
определяется из уравнения:
.
Из этой формулы следует, что критическая
точка
равна с квантили распределения Пирсона
,
отвечающей вероятности
с числом степеней свободы
(таблица П 5 Приложения).
Таким образом, если вычисленная выборочная
статистика
,
то гипотеза
принимается. Если
,
то гипотеза
отвергается.
Область принятия критерия имеет вид, представленный на рис. 10.
Выбор области принятия гипотезы можно
объяснить следующим образом: значения
теоретических вероятностей
и относительных частот интервалов
должны быть достаточно близки, поэтому
разности
не должны быть слишком велики.
Рис. 10 - Область принятия критерия
Статистический выводневерно
формулировать в виде: генеральная
совокупность имеет нормальный закон
распределения. Можно лишь утверждать,
что данная выборкасогласуетсяс
гипотезой о нормальном распределении
генеральной совокупности с параметрами
,
на уровне значимости
.
З а м е ч а н и е:критерий
использует тот факт, что случайная
величина
имеет распределение, близкое к нормальному.
Чтобы это утверждение было достаточно
точным, необходимо выполнение условия
для всех интервалов. Интервалы, для
которых это условие не выполняется,
следует объединить с соседними.
ПРИМЕР 5
Требуется для выборки (таблица 1) с
помощью критерия согласия Пирсона
проверить гипотезу
о виде распределения генеральной
совокупности (нормальное распределение)
на уровне значимости
.
Сделать статистический вывод.
Для данной выборки объема n=99
ранее были вычислены выборочное среднее
и модифицированная выборочная дисперсия
,
составлен группированный вариационный
ряд (таблица 4), а также выдвинута гипотеза
о нормальном распределении генеральной
совокупности.
Вычислим теперь вероятности

попадания значений случайной величины
в
-тый
интервал и выборочное значение статистики
критерия
:
.
Результаты вычислений занесем в таблицу.
Таблица 9
|
|
|
|
|
|
|
|
|
1 |
3,00 |
-6,0000 |
|
-2,3134 |
-0,4896 |
|
|
2 |
3,90 |
-5,0000 |
4,0000 |
-1,7031 |
-0,4554 |
0,0342 |
|
3 |
4,80 |
-4,0000 |
12,0000 |
-1,0929 |
-0,3621 |
0,0933 |
|
4 |
5,70 |
-3,0000 |
16,0000 |
-0,4827 |
-0,1844 |
0,1777 |
|
5 |
6,60 |
-2,0000 |
21,0000 |
0,1275 |
0,0517 |
0,2361 |
|
6 |
7,50 |
-1,0000 |
23,0000 |
0,7378 |
0,2703 |
0,2186 |
|
7 |
8,40 |
0,0000 |
12,0000 |
1,3480 |
0,4115 |
0,1412 |
|
8 |
9,30 |
1,0000 |
10,0000 |
1,9582 |
0,4750 |
0,0635 |
|
9 |
10,20 |
2,0000 |
1,0000 |
2,5684 |
0,4949 |
0,0199 |

Так как в первом и последнем интервалах
не выполняется условие
,
то объединим эти интервалы с соседними.
При объединении интервалов значения
и
суммируются
Таблица 10
|
|
|
|
|
|
1 |
16,0000 |
12,6225 |
0,9037 |
|
2 |
16,0000 |
17,5923 |
0,1441 |
|
3 |
21,0000 |
23,3739 |
0,2411 |
|
4 |
23,0000 |
21,6414 |
0,0853 |
|
5 |
12,0000 |
13,9788 |
0,2801 |
|
6 |
11,0000 |
8,2566 |
0,9115 |
|
Сумма |
99 |
|
2,5659 |
Суммируя элементы последнего столбца таблицы, получим
.
Число степеней свободы после укрупнения
таблицы 10 равно
.
Область принятиягипотезы можно записать в виде
,
откуда следует, что критическое значение
совпадает с квантилем
распределения хи- квадрат с доверительной
вероятностью
.
В нашем случае
и
,
число степеней свободы
.
По таблице П5 Приложения находим значение
критической точки распределения
(квантили)
=6,2514.
Так как
,
то на данном уровне значимости гипотеза
принимается.
Статистический вывод: данная выборка
согласуется с гипотезой о нормальном
распределении с параметрами
,
=1,6387
на уровне значимости
,
то есть вероятность отвергнуть гипотезу
,
при условии, что она верна, равна
.











