- •Глава III. Теория оценивания
- •§6. Точечные оценки параметров и их свойства
- •6.1. Понятие точечных оценок
- •6.2. Основные свойства точечных оценок
- •Оценка параметра θ называется несмещенной, если ее математическое ожидание равно оцениваемому параметру при любом объеме выборки, т.Е. . В противном случае, оценка называется смещенной.
- •6.3. Точечные оценки характеристик генеральной совокупности
- •§7. Интервальное оценивание параметров.
- •7.1. Понятие интервальных оценок
- •7.3. Доверительный интервал для генеральной средней
- •Задачи для самостоятельного решения
6.2. Основные свойства точечных оценок
Оценка является хорошим приближением для параметра, если она несмещенная, состоятельная и эффективная.
Оценка параметра θ называется несмещенной, если ее математическое ожидание равно оцениваемому параметру при любом объеме выборки, т.Е. . В противном случае, оценка называется смещенной.
Соблюдение
требования несмещенности оценки
гарантирует от получения систематических
ошибок. Это следует из того, что при
значения
оценки по выборкам будут в среднем
завышать истинное значение параметра
θ.
Если же
,
значения оценок в среднем занижают
значение этого параметра.
Предположим теперь, что для некоторого параметра найдены две оценки, причем обе несмещенные. Какую оценку выбрать? Выбирают ту, у которой дисперсия меньше. Если не придерживаться этого правила и выбрать оценку с большой дисперсией, т.е. с большим разбросом значений вокруг математического ожидания, то по данным одной выборки может быть получено значение оценки достаточно далекое от своего математического ожидания, а, следовательно, и от истинного значения параметра. Принимая такую оценку за приближенное значение параметра, получим результат далекий от истины.
Несмещенная оценка параметра θ называется эффективной, если среди всех возможных несмещенных оценок, найденных по выборкам объема n, она имеет наименьшую дисперсию.
В качестве оценок параметров желательно использовать несмещенные и эффективные оценки, что не всегда возможно на практике. Часто для упрощения расчетов используют незначительно смещенные оценки или оценки, у которых дисперсия чуть больше, чем у эффективной оценки. Таким образом, свойства несмещенности и эффективности не являются обязательными для хороших оценок на практике. Однако есть еще одно свойство, которым в первую очередь должна обладать хорошая оценка – это свойство состоятельности.
Оценка параметра θ называется состоятельной, если она сходится по вероятности к оцениваемому параметру при неограниченном увеличении объема выборки, т.е. для любого ε >0 выполняется равенство:
.
Последнее
равенство при малых значениях ε
означает, что чем больше объем выборки,
тем точнее оценка
характеризует параметр θ,
что полностью согласуется с законом
больших чисел. Поэтому на практике
используются только состоятельные
оценки, для которых практически
достоверно, что при больших значениях
n
выполнено почти точное равенство
.
6.3. Точечные оценки характеристик генеральной совокупности
Множество всех значений признака Х и множество выборочных значений можно рассматривать как совокупности статистических данных (генеральную и выборочную). Поэтому для них полностью применим все результаты предыдущей главы, в частности для этих совокупностей могут быть найдены соответствующие числовые характеристики, а именно средняя арифметическая, дисперсия, среднее квадратическое отклонение, мода и т.д. Если будет рассматриваться числовая характеристика признака Х, то к ее названию будем добавлять слово «генеральная», например, «генеральная дисперсия». Если числовая характеристика относиться к выборке, то добавлять будем слово «выборочная», например, «выборочная дисперсия». Названия «генеральная средняя» и «выборочная средняя» будут определять среднюю арифметическую значений признака Х и выборочных значений соответственно.
Как было отмечено ранее, признак Х можно считать случайной величиной. Тогда математическое ожидание будет совпадать с генеральной средней, дисперсия с генеральной дисперсией, а вероятность случайного события с соответствующей генеральной частостью (или долей).
Введем следующие обозначения:
– генеральная
средняя;
– выборочная средняя;
– генеральная
дисперсия;
– выборочная дисперсия;
– генеральное
средне-
– выборочное
средне-
квадратическое отклонение; квадратическое отклонение.
Для нахождения оценок неизвестных характеристик генеральной совокупности существует несколько методов: метод моментов, метод максимального правдоподобия, метод наименьших квадратов. Представим без доказательства оценки характеристик генеральной совокупности, которые были найдены с помощью указанных методов.
Точечная оценка генеральной средней.
Рассмотрим генеральную совокупность с признаком Х. Закон распределения признака известен, а параметр – генеральная средняя – неизвестен. Предположим, что из генеральной совокупности извлечены k повторных или бесповторных собственно-случайных выборок объема n:
.
Введем в рассмотрение случайные величины Х1, Х2, …, Хn, значениями которых являются
для
Х1:
для
Х2:
……………………………..
для
Хn:
.
Можно показать, что если случайные величины Х1, Х2, …, Хn независимы, то каждая из них имеет математическое ожидание и дисперсию равными соответственно генеральной средней и генеральной дисперсии признака Х, т.е.
(6.1)
и
(6.2)
Для
каждой j-ой
выборки можно найти свою выборочную
среднюю
,
где j
= 1, 2, …, k.
Пусть
- это случайная величина, значения
которой равны значениям выборочных
средних. Нетрудно понять, что для
рассмотренных случайных величин имеет
место формула
,
(6.3)
а
для реализаций этих величин, т.е. выборок,
справедлива формула
,
где j
= 1, 2, …, k.
Найдем числовые характеристики случайной величины , используя свойства математического ожидания, дисперсии и формулы (6.1) – (6.3). Получим
.
Итак,
(6.4)
(6.5)
и отсюда
(6.6)
Формулы (6.4) - (6.6) верны в том случае, когда величины Х1, Х2, …, Хn независимы. Свойство независимости этих величин будет выполнено, если выборки – повторные.
Формула (6.4) указывает на то, что выборочная средняя является несмещенной оценкой генеральной средней. Состоятельность этой оценки непосредственно следует из теоремы Чебышева. Таким образом, справедлива
Теорема 6.1. Выборочная средняя повторной собственно-случайной выборки является несмещенной и состоятельной оценкой генеральной средней , при этом выполнено равенство .
Если выборки – бесповторные, то величины Х1, Х2, …, Хn будут зависимыми. Однако и в этом случае выборочная средняя будет несмещенной и состоятельной оценкой, но равенство (6.5) выполняться не будет.
Выборочная средняя будет также и эффективной оценкой генеральной средней, если признак Х распределен по нормальному закону.
Точечная оценка генеральной дисперсии.
Пусть имеется генеральная совокупность с признаком Х. Закон распределения признака известен, а значение генеральной дисперсии неизвестно. Предположим, что из генеральной совокупности извлечена повторная или бесповторная собственно-случайная выборка объема n. Тогда справедлива
Теорема 6.2. Выборочная дисперсия повторной и бесповторной собственно-случайной выборки является смещенной и состоятельной оценкой генеральной дисперсии .
Таким
образом, свойство несмещенности для
выборочной дисперсии не выполняется.
Можно доказать, что
.
Так как
,
то выборочная дисперсия, полученная по
разным выборкам одного и того же объема,
в среднем занижает генеральную дисперсию.
Для того, чтобы этого занижения не было
нужно несколько подправить выборочную
дисперсию, умножив ее на величину
.
В результате получим новую выборочную
характеристику
,
называемую исправленной выборочной
дисперсией.
Теорема 6.3. Исправленная выборочная дисперсия s2 является несмещенной и состоятельной оценкой для генеральной дисперсии .
Свойство эффективности для выборочной и исправленной выборочной дисперсий не выполняется даже в том случае, когда признак Х распределен по нормальному закону.
Существует
оценка
генеральной
дисперсии, которая является эффективной.
Однако, очевидно, что для ее нахождения
требуется знание генеральной средней,
что в большинстве случаев при применении
выборочного метода невозможно.
Все рассмотренные выше точечные оценки являются лишь приближенным значением неизвестного параметра θ. Если для выборок большого объема эти оценки могут давать неплохие приближения, то для малых выборок, даже при условии, что оценка несмещенная, состоятельная и эффективная, она может существенно отличаться от истинного значения параметра.
Для получения более точных и надежных результатов используют интервальные оценки.
