
8.3.2. Критерий согласия а. Н. Колмогорова.
Этот критерий в ряде отношений отличается от критерия хи-квадрат. Пусть точно известна теоретическая функция распределения F(x) и выборка не группирована. В качестве меры расхождения теоретического распределения и выборочных данных возьмем максимальное значение модуля разности между F(x) и статистической функцией распределения F*(x):
|
(8.3.9) |
Такая мера
расхождения позволяет построить критерий
с исключительно простыми свойствами
распределения величины критерия. А
именно, А. Н. Колмогоров показал, что
если взять величину критерия в виде
,
то вероятность неравенства
не зависит от вида
и параметров теоретической функции
распределения F(x)
и при
стремится
к пределу
|
(8.3.10) |
Таблица 8.3.1.
|
P( |
|
P( |
|
P( |
0.0 |
1.000 |
0.7 |
0.711 |
1.4 |
0.040 |
0.1 |
1.000 |
0.8 |
0.544 |
1.5 |
0.022 |
0.2 |
1.000 |
0.9 |
0.393 |
1.6 |
0.012 |
0.3 |
1.000 |
1.0 |
0.270 |
1.7 |
0.006 |
0.4 |
0.997 |
1.1 |
0.178 |
1.8 |
0.003 |
0.5 |
0.964 |
1.2 |
0.112 |
1.9 |
0.002 |
0.6 |
0.864 |
1.3 |
0.068 |
2.0 |
0.001 |
Рисунок 8.3.1.
Значения этого
предела, рассчитанные по (8.3.10), приведены
в табл. 8.3.1, график функции
показан на рис. 8.3.1.
Алгоритм применения критерия А. Н. Колмогорова для проверки согласия теоретического распределения F(x) с выборочными данными сводится к следующему.
1) Строится теоретическая функция распределения F(x).
2) Строится статистическая функция распределения F*(x). Напомним (см. п. 6.3 и формулу (6.3.1)), что F*(x) обладает всеми свойствами функции распределения дискретной СВ, у которой значения совпадают с выборочными значениями, а все вероятности равны 1/n.
3) Находится D как максимум модуля разности между F(x) и F*(x), согласно (8.3.9).
4) Задается критическая вероятность pcr .
5) По табл. 8.3.1
(существуют таблицы с более мелким
шагом), или по формуле (8.3.10) (на компьютере)
находится вероятность
того,
что по чисто случайным причинам величина
U
превзойдет
наблюденную величину критерия
.
6) Вероятность
сравнивается с критической вероятностьюpcr
и
принимается решение: если
,
то принимается решение «отвергнуть
гипотезуН0»,
т. е. считать, что теоретическое
распределение с функцией распределения
F(x)
не согласуется с выборочными данными»;
если
,
то принимается решение «не отвергать
гипотезуН0»,
т. е. «нет существенных оснований считать,
что теоретическое распределение не
согласуется с выборочными данными».
Сравним критерий согласия А. Н. Колмогорова с критерием согласия хи-квадрат К. Пирсона.
1) Как и критерий хи-квадрат, критерий Колмогорова не может доказать (обосновать) согласованность теоретического распределения с выборочными данными, он только может в некоторых случаях отвергнуть Н0 или не найти для этого оснований.
2) Так же, как и в
предыдущем случае, необходимо критическую
вероятность задавать до того, как найдена
вероятность
.
3) И на этот раз применение критерия связано с асимптотическим значением вероятности превышения наблюденного значения критерия, поэтому необходимо, чтобы n было достаточно большим (практически - несколько сотен).
4) И этот критерий достаточно прост в применении.
5) В отличие от
критерия хи-квадрат, критерий Колмогорова
можно применять только если гипотетическая
теоретическая функция распределения
F(x)
полностью
известна заранее из каких-то внешних,
например, физических соображений, т. е.
когда известен не только вид функции
распределения, но и все ее параметры.
Такая ситуация редко встречается на
практике. Обычно из теоретических
соображений известен только общий вид
теоретической функции распределения,
а ее параметры приходится оценивать по
выборочным данным. При применении
критерия хи-квадрат это обстоятельство
учитывается уменьшением числа степеней
свободы на число оцененных параметров.
Критерий Колмогорова такого согласования
не предусматривает. Если все же применять
этот критерий в тех случаях, когда
параметры теоретического распределения
оцениваются по выборочным данным,
критерий дает заведомо завышенные
значения вероятности
;
поэтому возникает риск принятьН0
в ситуации, когда предполагаемое
теоретическое распределение плохо
согласуется с выборочными данными.