
3. Метод порядковых статистик.
Утверждение 4.8.
Пусть
– выборка из распределения
,
тогда функция распределения
-ой
порядковой статистики
:
Доказательство:
Выберем произвольным образом и зафиксируем
значение
,
определим на основе выборки
вектор бинарных случайных величин
:
.
Случайные величины
независимы в совокупности (поскольку
случайные величины
независимы в совокупности) и имеют
одинаковое распределение
(поскольку случайные величины
имеют одинаковую функцию распределения)
:
,
.
Пусть
–
-ая
порядковая статистика, по определению
функция распределения
:
.
Порядковая статистика
меньше величины
тогда и только тогда, когда среди величин
выборки
(
)
величин меньше
и
величин не меньше
,
то есть тогда и только тогда, когда в
векторе бинарных случайных величин
величин равны 1 и
величин равны 0, что эквивалентно тому,
что случайная величина
больше или равна
.
Поскольку все
независимы и одинаково распределены,
то случайная величина
имеет распределение Бернулли с параметрами
и
,
тогда:
|
(4.13) |
Заметим, что полученное равенство
справедливо для любого
,
поскольку величина
была выбрана произвольным образом.
При
из (4.13) получим:
.
При
из (4.13) получим:
.
Утверждение доказано.
Утверждение 4.9
Пусть выполнены условия утверждения
4.8 и функция распределения
дифференцируема при всех
и
,
тогда плотность вероятности
-ой
порядковой статистики
:
,
где
– плотность вероятности.
Доказательство:
Действительно, для того, чтобы получить
выражение для плотности вероятности
достаточно продифференцировать функцию
распределения
:
При
получим:
.
При
получим:
.
При
получим (для краткости опускаем аргумент
функций):
.
Утверждение доказано.
Порядковые статистики используются для построения оценок квантилей распределений и параметров.
Определение 4.10.
Пусть
– функция распределения,
-квантиль
(квантиль уровня
)
функции распределения
есть число
такое, что:
.
(если существует несколько значений
,
удовлетворяющих условию
,
то в качестве
-квантили
принимают наименьшее из этих значений).
Если распределение, соответствующее
имеет название, то обычно говорят,
например, «квантиль уровня
нормального распределения с параметрами
0 и 1» или «квантиль уровня
распределения хи-квадрат с
степенями свободы».
Предположим, что функция распределения
зависит от неизвестного параметра
,
тогда
-квантиль
является функцией параметра
и является неизвестной величиной. Для
построения оценки
-квантили
функцию распределения
заменяют эмпирической функцией
распределения
.
Определение 4.11.
Пусть
– эмпирическая функция распределения
выборки
и
– реализация выборки
,
число
называется выборочной
-квантилью,
если:
.
Поскольку реализации эмпирической
функции распределения являются
кусочно-постоянными функциями, то для
(где
– целое число,
)
существует бесконечно много значений
,
удовлетворяющих условию
,
а для
,
вообще говоря, нет ни одного значения
,
удовлетворяющего условию
.
В таком случае в качестве оценки
-квантили
используют порядковую статистику
«наиболее близкую» к выборочной
-квантили
,
для этого, как нетрудно убедиться,
достаточно положить
(где
– целая часть числа). Таким образом, в
качестве оценки
-квантили
следует взять величину:
.
Теорема 4.12. (Крамер)
Пусть
– выборка из распределения
,
–
-квантиль
распределения
и в некоторой окрестности точки
плотность вероятности
непрерывно дифференцируема и положительна,
,
тогда статистика
имеет асимптотически нормальное
распределение:
,
при
.
Следствие
При выполнении условий теоремы 4.12
статистика
является состоятельной оценкой
-квантиля
,
поскольку математическое ожидание
и дисперсия
при
.
Пусть функция распределения
зависит от неизвестного параметра
,
для построения оценки величины
с помощью порядковых статистик достаточно
выразить величину
через квантили функции распределения
:
.
Использование вместо квантилей
,
…,
их оценок, полученных с помощью порядковых
статистик,
,
…,
,
приводит к статистике:
,
которая используется в качестве оценки
.
При некоторых условиях статистики
являются состоятельными оценками
квантилей
,
то есть имеет место сходимость по
вероятности
при
,
если функция
непрерывна в точке
,
тогда по свойству сходимости по
вероятности статистика
сходится по вероятности к величине
:
,
при
,
тогда по определению статистика
является состоятельной оценкой
.
Оценки, полученные методом порядковых статистик, как правило, имеют дисперсию больше, чем дисперсии оценок, полученные другими методами. Тем не менее, оценки, полученные методом порядковых статистик, могут обладать дополнительными положительными свойствами, например, устойчивостью к «засорению» выборки («засорение» выборки означает наличие в выборке ошибочных значений, полученных в результате неверного измерения и т.п.)
|
|