Эффективность оценок. Неравенство Рао-Фреше-Крамера
Для одних и тех же параметров распределения существует бесконечно много различных несмещенных и состоятельных оценок. Поэтому важной задачей является сравнение их между собой и поиск наилучшей среди них. Естественным критерием такого поиска является дисперсия, как мера разброса значений случайной величины вокруг его среднего значения, и наилучшей оценкой является оценка с минимальной дисперсией. Однако для смещенной оценки дисперсия служит мерой близости не к оцениваемому параметру , а к математическому ожиданию этой же оценки . Поэтому естественно искать наилучшие оценки с наименьшей дисперсией только среди несмещенных оценок.
Получая ту или иную оценку, мы должны иметь возможность определить, обладает ли она минимальной дисперсией из всех возможных, или нет. С этой целью вводится понятие эффективности оценки и используется неравенство Рао-Фреше-Крамера.
Информацией Фишера о неизвестном параметре , содержащейся в одном из независимых наблюдений случайной величины , называется величина
,
где в качестве берется либо плотность в точке x (для непрерывных случайных величин), либо вероятность принять значение x (для дискретных случайных величин). Говорят, что величина определяет количество информации Фишера.
Теорема Рао-Фреше-Крамера).
Пусть задана несмещенная оценка , построенная по выборке х1,x2,…,xn, а функция плотности f(x,) удовлетворяет следующим условиям регулярности:
1) область Gn={x: f(x,)>0} не зависит от параметра ;
2) в тождествах
и
допустимо дифференцирование по под знаком интеграла;
3) информация Фишера I() конечна и положительна.
Тогда выполняется неравенство (Рао-Фреше-Крамера):
.
Доказательство. Пусть – несмещенная оценка параметра , т.е.
,
где Х = (х1,x2,…,xn) и f(X,) - плотность распределения, так что .
Дифференцируя по равенства (7.4.1) и (7.4.2), получим
и .
Умножим второе равенство на и вычтем его из первого
По условию на множестве Gn плотность f(X,) > 0, поэтому можно записать, что .
Подставим полученное выражение в равенство (7.4.3) и используя неравенство Коши-Буняковского находим
или
Учитывая независимость и одинаковый закон распределения наблюдений x1,x2,…,xn, можно записать, что
Подставляя это выражение в последнее неравенство, окончательно получаем утверждение теоремы D .
Замечание 1. Теорема верна и в дискретном случае, если в условии 2) заменить интегралы на суммы (по всем возможным значениям случайной величины).
Замечание 2. Если оценка является линейной функцией выборочного среднего, т.е. , то первое тождество из условия 2) эквивалентно более простому: .
Замечание 3. Информацию Фишера можно также представить в виде:
и .
Обозначим правую часть неравенства Рао-Фреше-Крамера через n=1/nI(). Эта величина является нижней гранью всех возможных дисперсий оценок.
Эффективностью несмещенной оценки называется отношение минимально возможного значения дисперсии оценки в классе всех несмещенных оценок параметра к дисперсии рассматриваемой оценки:
.
Из определения следует, что эффективность любой несмещенной оценки удовлетворяет неравенству 0 1, и чем ближе она к единице, тем лучше оценка.
Несмещенная оценка называется эффективной, если =1.
Асимптотической эффективностью оценки называется предел , если он существует. Оценку называют асимптотически эффективной, если =1.
Кроме того, для асимптотически нормальных оценок понятие асимптотической эффективности иногда трактуется более широко. А именно, для асимптотически нормальной оценки при n, полагают .
Задача Доказать, что выборочное среднее является эффективной оценкой математического ожидания нормального распределения, когда дисперсия известна.
Решение. Выпишем функцию плотности для нормального распределения:
Прологарифмировав ее, получим: , при этом производная будет равна
Отсюда найдем информацию Фишера:
Получаем значение . С другой стороны, , так что .
Таким образом, оценка является эффективной. Из доказанного следует, что чем больше дисперсия нормальной случайной величины, тем меньше информации о значении математического ожидания этой величины заключено в одном наблюдении.
Задача. Доказать, что относительная частота успеха в качестве оценки неизвестной вероятности θ в схеме Бернулли является эффективной оценкой.
Решение. Оценкой неизвестной вероятности является относительная частота успеха , где хi – успех (1) или неудача (0) в i-ом испытании. Эта оценка несмещенная, так как Дисперсия оценки имеет вид
.
Найдем информацию Фишера, причем в данном случае наблюдаемая величина принимает всего два значения: 0 и 1 с вероятностями P(0;)=1 и Р(1;)=.
Таким образом, .
Задача. Пусть выборка x1, x2, ..., xn произведена из генеральной совокупности с равномерным распределением на отрезке [0, ]. Проверить на эффективность оценку для неизвестного параметра .
Решение. Функция распределения Fmax(x) максимума xmax задается формулой:
на отрезке 0х. Отсюда получаем
.
Значит, оценка несмещенная. Найдем дисперсию этой оценки:
Видно, что дисперсия оценки при n убывает как . Такая оценка оказалась лучше эффективной, поскольку дисперсия эффективной оценки имеет порядок убывания только . Разгадка парадокса в том, что для данного семейства распределений не выполнены условия теоремы Рао-Фреше-Крамера. А именно, область значений случайной величины зависит от параметра . Подобные оценки называют сверхэффективными.