
4. Критерий согласия Колмогорова.
Пусть
– выборка из неизвестного распределения
,
и основная гипотеза
заключается в том, что:
:
.
Требуется составить критерий проверки
гипотезы
.
Если функция
является непрерывной и возрастающей
функцией, тогда в качестве критерия
может быть использовать критерий
согласия Колмогорова, статистика
которого
имеет
вид:
,
где
– эмпирическая функция распределения.
Если гипотеза
не верна, то есть
,
тогда точная верхняя грань
не стремится к нулю с ростом
,
а стремится к некоторому конечному
числу, которое затем умножается на
.
Отсюда, статистика
неограниченно возрастает с ростом
,
поэтому в критическую область
гипотезы
следует отнести «большие» значения
статистики
:
,
где
– пороговое значение, определяемое
распределением статистики
для случая когда гипотеза верна, объемом
выборки
и уровнем значимости
.
При сравнительно небольших объемах
выборки (
)
распределение статистики
известно точно, при больших объемах
выборки (
)
для функции распределения известно
приближенное выражение, основанное на
сходимости функции распределения
к известной функции (теорема Колмогорова).
Прежде всего, покажем, что статистика
неограниченно возрастает в том случае,
если гипотеза
не верна.
Утверждение 6.20.
Пусть
– выборка из распределения
и основная гипотеза
заключается в том, что
.
Если гипотеза
не верна, тогда последовательность (по
)
случайных величин
:
,
является не ограниченной по вероятности.
Доказательство:
Пусть
и
произвольно выбранные числа, покажем,
что найдется
такое, что для всех
:
.
Если гипотеза
не верна, то найдется хотя бы одно число
такое, что
,
и следовательно число
.
Заметим, что при всех элементарных
событиях
:
.
Значение эмпирической функции
распределения
при каждом
сходится по вероятности к значению
,
отсюда, для
и
найдется
такое, что для всех
:
.
Пусть для всех
события
образованы теми элементарными событиями
,
при которых
:
,
.
Если
и
,
тогда,
.
Пусть номер
,
тогда для каждого
и всех
:
Отсюда следует, что при
:
,
тогда при
,
.
Таким образом, для произвольных
и
найден номер
такой, что для всех
:
.
Утверждение доказано.
Для вычисления порогового значения
требуется определить функцию распределения
статистики
в том случае, когда гипотеза
верна. Покажем, что если гипотеза
верна и функция
непрерывна и возрастает, тогда
распределение
вовсе не зависит от
.
Действительно, если
верна, тогда
и статистика
имеет вид:
Поскольку
непрерывна
и возрастает, то существует обратная
функция
для
(
),
тогда,
.
Эмпирическую функцию распределения
можно представить как сумму:
,
.
Отсюда,
Поскольку
возрастает, то из
следует, что
,
поэтому если
,
то
или
,
если же
,
тогда
или
.
Отсюда следует, что:
.
Пусть случайные величины
,
тогда:
,
где
– эмпирическая функция распределения
выборки
.
Таким образом,
.
Заметим, что случайные величины
имеют равномерное распределение
,
поскольку
непрерывная и возрастающая функция
(тема 5 пункт 6),
поэтому
– эмпирическая функция распределения
для выборки из равномерного распределения
независимо от того какова функция
,
отсюда распределение статистики:
зависит только от
и не зависит от
.
При сравнительно небольших
распределение
может быть вычислено, и значения сведены
в таблицы для различных
.
При больших
используется приближенное вычисление
функции распределения
,
основанное на теореме Колмогорова.
Теорема(Колмогоров)
Пусть
– выборка из распределения
,
– эмпирическая функция распределения
выборки
и статистика
:
.
Если
– непрерывная функция, тогда для любого
фиксированного
:
.
Без доказательства.
Из теоремы Колмогорова следует, что
если гипотеза
верна, тогда уровень значимости
:
,
,
где
известная функция, так что значение
вычисляется численным методом.
|
|