3. Метод порядковых статистик.
Утверждение 4.8.
Пусть – выборка из распределения , тогда функция распределения -ой порядковой статистики :
Доказательство:
Выберем произвольным образом и зафиксируем значение , определим на основе выборки вектор бинарных случайных величин :
.
Случайные величины независимы в совокупности (поскольку случайные величины независимы в совокупности) и имеют одинаковое распределение (поскольку случайные величины имеют одинаковую функцию распределения) :
,
.
Пусть – -ая порядковая статистика, по определению функция распределения :
.
Порядковая статистика меньше величины тогда и только тогда, когда среди величин выборки () величин меньше и величин не меньше , то есть тогда и только тогда, когда в векторе бинарных случайных величин величин равны 1 и величин равны 0, что эквивалентно тому, что случайная величина больше или равна . Поскольку все независимы и одинаково распределены, то случайная величина имеет распределение Бернулли с параметрами и , тогда:
(4.13) |
Заметим, что полученное равенство справедливо для любого , поскольку величина была выбрана произвольным образом.
При из (4.13) получим:
.
При из (4.13) получим:
.
Утверждение доказано.
Утверждение 4.9
Пусть выполнены условия утверждения 4.8 и функция распределения дифференцируема при всех и , тогда плотность вероятности -ой порядковой статистики :
,
где – плотность вероятности.
Доказательство:
Действительно, для того, чтобы получить выражение для плотности вероятности достаточно продифференцировать функцию распределения :
При получим:
.
При получим:
.
При получим (для краткости опускаем аргумент функций):
.
Утверждение доказано.
Порядковые статистики используются для построения оценок квантилей распределений и параметров.
Определение 4.10.
Пусть – функция распределения, -квантиль (квантиль уровня ) функции распределения есть число такое, что:
.
(если существует несколько значений , удовлетворяющих условию , то в качестве -квантили принимают наименьшее из этих значений).
Если распределение, соответствующее имеет название, то обычно говорят, например, «квантиль уровня нормального распределения с параметрами 0 и 1» или «квантиль уровня распределения хи-квадрат с степенями свободы».
Предположим, что функция распределения зависит от неизвестного параметра , тогда -квантиль является функцией параметра и является неизвестной величиной. Для построения оценки -квантили функцию распределения заменяют эмпирической функцией распределения .
Определение 4.11.
Пусть – эмпирическая функция распределения выборки и – реализация выборки , число называется выборочной -квантилью, если:
.
Поскольку реализации эмпирической функции распределения являются кусочно-постоянными функциями, то для (где – целое число, ) существует бесконечно много значений , удовлетворяющих условию , а для , вообще говоря, нет ни одного значения , удовлетворяющего условию . В таком случае в качестве оценки -квантили используют порядковую статистику «наиболее близкую» к выборочной -квантили , для этого, как нетрудно убедиться, достаточно положить (где – целая часть числа). Таким образом, в качестве оценки -квантили следует взять величину:
.
Теорема 4.12. (Крамер)
Пусть – выборка из распределения , – -квантиль распределения и в некоторой окрестности точки плотность вероятности непрерывно дифференцируема и положительна, , тогда статистика имеет асимптотически нормальное распределение:
, при .
Следствие
При выполнении условий теоремы 4.12 статистика является состоятельной оценкой -квантиля , поскольку математическое ожидание и дисперсия при .
Пусть функция распределения зависит от неизвестного параметра , для построения оценки величины с помощью порядковых статистик достаточно выразить величину через квантили функции распределения :
.
Использование вместо квантилей , …, их оценок, полученных с помощью порядковых статистик, , …, , приводит к статистике:
,
которая используется в качестве оценки .
При некоторых условиях статистики являются состоятельными оценками квантилей , то есть имеет место сходимость по вероятности при , если функция непрерывна в точке , тогда по свойству сходимости по вероятности статистика сходится по вероятности к величине :
, при ,
тогда по определению статистика является состоятельной оценкой .
Оценки, полученные методом порядковых статистик, как правило, имеют дисперсию больше, чем дисперсии оценок, полученные другими методами. Тем не менее, оценки, полученные методом порядковых статистик, могут обладать дополнительными положительными свойствами, например, устойчивостью к «засорению» выборки («засорение» выборки означает наличие в выборке ошибочных значений, полученных в результате неверного измерения и т.п.)
|
|