
3.2 Теория оценивания.
Естественно наше стремление получить такие оценки, которые были бы оптимальными как в смысле преобразования информации, имеющейся в выборке, так и в смысле их близости к тем параметрам или числовым характеристикам, которые они, собственно, оценивают. При этом необходимо подчеркнуть, что слово оценка в статистической литературе на русском языке имеет два значения. Во-первых, это формула, по которой элементы выборки преобразуются в конечный результат, а, во-вторых – это числовое значение самого результата. Во избежание возможного недопонимания контекста вместо термина оценка в первом смысле мы будем употреблять выражение оценивающая функция (ОФ) [11]. В такой ситуации ОФ является СВ, определяемой элементами выборки (функция случайного вектора), а просто оценка – одно из возможных значений этой СВ или элемент спектра ОФ.
3.2.1 Требования, предъявляемые к ОФ.
Пусть a – некоторый параметр ГС X, для которого необходимо построить ОФ ã в виде функции выборки:
ã = f(x1, x2, …, xn). (191)
Оптимальность ОФ конкретно определяется рядом требований, предъявляемых к ней. Выделим из этого ряда три наиболее употребляемые и практически ценные.
1. Состоятельность. ОФ должна сходится по вероятности к оцениваемому параметру:
P(|ã
-
a|
<
)
вер.
1, (192)
т.е. при неограниченном увеличении объема выборки оценка будет все теснее и теснее приближаться к параметру, совершая случайные колебания по обе стороны от него. При этом, вполне возможно, хотя со всё убывающей вероятностью, что очередное колебание окажется по модулю больше предыдущего, в результате чего модуль уклонения оценки от параметра превысит величину . Теорема Чебышёва, например, (см.2.4.2) как раз и доказывает состоятельность СА, являющегося ОФ МО.
2. Несмещённость. Математическое ожидание ОФ должно равняться оцениваемому параметру:
= a, (193)
т.е. формула ОФ не должна иметь систематического искажения, из-за которого она теоретически не будет равна параметру.
В ходе доказательства вышеупомянутой теоремы Чебышёва было показано, хотя явно об этом вопрос не стоял, что СА является несмещенной ОФ МО.
Состоятельность и несмещенность ОФ являются независимыми требованиями и дополняют друг друга. Оба они сформулированы на уровне числовых характеристик, более высоком, чем уровень распределений (см.2.5). Например, средина размаха (см.3.1.2)
xср. = (xmin + xmax) / 2,
так же является несмещённой ОФ МО, как и СА для любого распределения, имеющего конечное среднее, хотя она явно не состоятельна. Очевидно, что для выбора предпочтительной ОФ из двух или нескольких несмещённых ОФ необходимо выдвинуть дополнительное требование.
3. Минимальность дисперсии (МД). ОФ называется МД-оценкой, если в классе несмещённых ОФ некоторого параметра она обладает минимально возможной дисперсией, т.е.
D()
=
min. (194)
Это требование обычно выдвигается в виде условия при решении задачи построения ОФ, обладающей указанным свойством. Минимальность дисперсии так же является требованием на уровне числовых характеристик и не связана с конкретным распределением.
Иногда, можно встретить требование (194) в качестве условия эффективности ОФ. Однако это не корректное смешение формы требования и его аналитического содержания. Эффективность ОФ устанавливается с использованием неравенства Рао-Крамера [13] на уровне распределения и является более глубоким и мощным требованием. Всякая эффективная ОФ является МД-оценкой, но не наоборот. Например, для выборки из нормальной ГС, СА – эффективная МД-оценка МО.
Задача 3.1. Построить линейную, несмещённую МД-оценку МО по данным x1, x2,…, xn простой, т.е. некоррелированной и равноточной, выборки, полученной по наблюдениям одной и той же величины X.
Дано: 1) результаты наблюдений: x1, x2,…, xn – простая выборка;
2) теоретические
посылки:
xi
X,
где X
– ГС (вероятностно-статистическая
модель технологии наблюдений); E(xi)
= E(X)
= X
– следствие того, что измеряется одна
и та же величина без постоянной ошибки;
=
2
> 0 –
следствие равноточности наблюдений;
Kij
= 0 для
всех i
≠ j
– следствие некоррелированности
элементов выборки. Все следствия
записаны, исходя из принципа статистической
копии; a
= E(X)
– оцениваемый параметр;
= a
– требование несмещённости ОФ;
=
min
– требование, которому должна удовлетворять
МД-оценка.
Построить:
Линейную ОФ ã
=
=
,т.е.
найти такие ci,
которые обеспечат искомой ОФ: её
несмещённость и минимальность дисперсии.
Решение: Посмотрим, как трансформируются общие требования, предъявляемые к ОФ, для конкретных условий задачи.
1.Несмещенность.
=
=
=
E(X)*
=
E(X)
=
1. (195)
2.Минимальность дисперсии (МД-оценивание).
=
=
=
2
=
min. (196)
Теперь задача построения линейной несмещённой МД-оценки сводится к нахождению таких коэффициентов ci, которые удовлетворяли бы условиям (195) и (196) одновременно. Это задача на нахождение условного экстремума функции многих переменных по методу Лагранжа. Для её решения составим функцию Лагранжа:
φ
= 2–
2 (
-
1) = min. (197)
Необходимым условием существования экстремума такой функции является равенство нулю её частных производных по искомым аргументам:
∂φ
/ ∂ci
= 22
*ci
– 2
= 0
ci
=
/ 2.
(198)
Неопределенный множитель Лагранжа найдем из условия (195):
=
/2
= n
*
/ 2
= 1
= 2
/ n.
Итак, равные коэффициенты линейной несмещенной МД-оценки МО
ci = 1 / n.
Они действительно доставят функции (197) минимум, так как её производная меняет знак в окрестности точки минимума с минуса на плюс:
22 *(1 / (n+1) – 1 / n) < 0,
22 *(1 / (n–1) – 1 / n) > 0.
Сама ОФ принимает уже хорошо известный нам вид СА:
=
=
(
)
/ n
=
.
Теорема Чебышёва (2.4.2) и данный пример показывают, что СА – это состоятельная и несмещенная МД-оценка МО для любого закона распределения, имеющего конечное МО. Для нормального закона, как это отмечалось выше, она будет ещё и эффективной ОФ.