
- •Тема: Статистические оценки параметров распределения
- •Понятие оценки.
- •Классификация точечных оценок.
- •Методы нахождения точечных оценок.
- •Интервальные оценки.
- •Вероятность попадания нормально распределённой случайной величины в заданный интервал.
- •Доверительный интервал для математического ожидания нормально распределённой генеральной совокупности при известной дисперсии.
- •Распределение хи-квадрат.
- •Распределение Стьюдента.
- •Доверительный интервал для математического ожидания нормально распределённой генеральной совокупности при неизвестной дисперсии.
- •Доверительный интервал для дисперсии нормально распределённой генеральной совокупности.
Тема: Статистические оценки параметров распределения
-
Понятие оценки.
Такие распределения,
как биноминальное, показательное,
нормальное, являются семействами
распределений, зависящими от одного
или нескольких параметров. Например,
показательное распределение с плотностью
вероятности
,
,
зависит от одного параметра
,
нормальное распределение
– от двух параметров
и
.
Из условий исследуемой задачи, как
правило, ясно, о каком семействе
распределений идёт речь. Однако остаются
неизвестными конкретные значения
параметров этого распределения, входящие
в выражения интересующих нас характеристик
распределения. Поэтому необходимо знать
хотя бы приближённое значение (оценки)
этих величин.
Пусть закон
распределения генеральной совокупности
определён с точностью до значений
входящих в его распределение параметров
,
часть из которых может быть известна.
Одной из задач математической статистики
является нахождение оценок неизвестных
параметров по выборке наблюдений
из генеральной совокупности. Оценка
неизвестных параметров заключается в
построении функции
от случайной выборки, такой, что значение
этой функции приближённо равно
оценивающему неизвестному параметру
.
Функция
называется статистикой
или
оценкой параметра
.
Например, выборочное среднее
и медиана
могут служить оценкой среднего значения
всей генеральной совокупности, выборочная
дисперсия
– дисперсии
этой совокупности.
Существует два
вида оценок – точечные и интервальные.
Точечная оценка
параметра
определяется одним числом
.
При малом числе наблюдений эти оценки
могут приводить к грубым ошибкам. Чтобы
избежать их, используют интервальные
оценки,
которые определяются двумя числами
и
– границами интервала, в котором с
заданной вероятностью заключена
оцениваемая величина
.
-
Классификация точечных оценок.
Для данного
неизвестного параметра совокупности
может существовать несколько статистик,
вполне подходящих для того, чтобы служить
оценками. Например, выборочное среднее
,
мода
и медиана
могут показаться вполне пригодными для
оценивания среднего значения всей
генеральной совокупности. Для выбора
«наилучших» оценок необходимо определить
их свойства: несмещённость, эффективность
и состоятельность.
Оценка
параметра
называется несмещённой
(без систематических ошибок),
если математическое ожидание оценки
совпадает с истинным значением
:
.
(2.1)
Ели равенство
(2.1) не имеет места; то оценка
называется смещённой
(с систематическими ошибками).
Это смещение может быть связано с
ошибками измерения, счёта или неслучайным
характером выборки. Систематические
ошибки приводят к завышению или занижению
оценки.
Пример 2.1.
Пусть
– случайные величины с м.о.
,
.
Для их среднего арифметического
,
согласно теоремы 5.2 (Тема: Первичная
обработка выборок),
.
Таким образом,
является несмещённой оценкой величины
.
Пример2.2.
Пусть
– взаимно независимые с.в. с м.о.
и дисперсией
,
.
Выберем в качестве оценки дисперсии
генеральной совокупности выборочную
дисперсию
.
Преобразуем её:
.
Итак,
.
(2.2)
В силу независимости
с.в.
и теоремы 5.2 (Тема: Первичная обработка
выборок) имеем
.
Таким образом,
.
(2.3)
Итак, выборочная
дисперсия
является смещённой оценкой дисперсии
.
Умножив равенство
(2.3) на
,
получим
.
Отсюда следует, что несмещённой оценкой
дисперсии
является статистика
.
Таким образом,
модифицированная выборочная дисперсия
является
несмещённой оценкой дисперсии
.
▲
Для некоторых задач математической статистики может существовать несколько несмещённых оценок. Обычно предпочтение отдают той, которая обладает наименьшим рассеянием (дисперсией).
Несмещённая оценка
параметра
,
обладающая минимальной дисперсией
среди всех несмещённых оценок для
,
называемая эффективной.
Пусть
– минимальная дисперсия, а
– дисперсия любой другой несмещённой
оценки
параметра
.
Тогда по определению эффективность
оценки
равна
.
Ясно, что
.
Часто оценка
становится эффективной с увеличением
объёма
выборки. Предельная эффективность
оценки при
называется асимптотической
эффективностью.
Если асимптотическая эффективность
равна единице, оценка называется
асимптотически
эффективной.
В примере 2.2
показано, что модифицированная выборочная
дисперсия
является эффективной оценкой дисперсии
взаимно независимых с.в. с одинаковыми
м.о. и дисперсией. Из равенства (2.3)
следует, что выборочная дисперсия
является асимптотически эффективной
оценкой дисперсии
таких с.в. с одинаковыми м.о. и дисперсией.
Замечание.
Если оценка
смещённая, то малость её дисперсии ещё
не говорит о малости её погрешности.
Взяв, например, в качестве оценки
параметра
некоторое число
,
получим оценку даже с нулевой дисперсией.
Однако в этом случае ошибка (погрешность)
может быть сколь угодно большой.
Оценка
называется состоятельной
или
асимптотически состоятельной,
если с увеличением объёма выборки
оценка сходится по вероятности к точному
значению параметра
,
т.е. для любого
.
(2.4)
Состоятельность
оценки
параметра
означает, что с ростом
объёма выборки качество оценки
улучшается.
Пример 2.3.
В схеме испытаний Бернулли частота
появления события в каждом отдельном
испытании является состоятельной
оценкой вероятности
появления события в одном испытании.
Это следует из теоремы Бернулли.
Пример 2.4.
Согласно теореме Чебышева, среднее
арифметическое
является состоятельной оценкой среднего
арифметического
математических ожиданий
с.в.
с равномерно ограниченными дисперсиями.