- •Тема: Статистические оценки параметров распределения
- •Понятие оценки.
- •Классификация точечных оценок.
- •Методы нахождения точечных оценок.
- •Интервальные оценки.
- •Вероятность попадания нормально распределённой случайной величины в заданный интервал.
- •Доверительный интервал для математического ожидания нормально распределённой генеральной совокупности при известной дисперсии.
- •Распределение хи-квадрат.
- •Распределение Стьюдента.
- •Доверительный интервал для математического ожидания нормально распределённой генеральной совокупности при неизвестной дисперсии.
- •Доверительный интервал для дисперсии нормально распределённой генеральной совокупности.
Тема: Статистические оценки параметров распределения
-
Понятие оценки.
Такие распределения, как биноминальное, показательное, нормальное, являются семействами распределений, зависящими от одного или нескольких параметров. Например, показательное распределение с плотностью вероятности , , зависит от одного параметра , нормальное распределение – от двух параметров и . Из условий исследуемой задачи, как правило, ясно, о каком семействе распределений идёт речь. Однако остаются неизвестными конкретные значения параметров этого распределения, входящие в выражения интересующих нас характеристик распределения. Поэтому необходимо знать хотя бы приближённое значение (оценки) этих величин.
Пусть закон распределения генеральной совокупности определён с точностью до значений входящих в его распределение параметров , часть из которых может быть известна. Одной из задач математической статистики является нахождение оценок неизвестных параметров по выборке наблюдений из генеральной совокупности. Оценка неизвестных параметров заключается в построении функции от случайной выборки, такой, что значение этой функции приближённо равно оценивающему неизвестному параметру . Функция называется статистикой или оценкой параметра . Например, выборочное среднее и медиана могут служить оценкой среднего значения всей генеральной совокупности, выборочная дисперсия – дисперсии этой совокупности.
Существует два вида оценок – точечные и интервальные. Точечная оценка параметра определяется одним числом . При малом числе наблюдений эти оценки могут приводить к грубым ошибкам. Чтобы избежать их, используют интервальные оценки, которые определяются двумя числами и – границами интервала, в котором с заданной вероятностью заключена оцениваемая величина .
-
Классификация точечных оценок.
Для данного неизвестного параметра совокупности может существовать несколько статистик, вполне подходящих для того, чтобы служить оценками. Например, выборочное среднее , мода и медиана могут показаться вполне пригодными для оценивания среднего значения всей генеральной совокупности. Для выбора «наилучших» оценок необходимо определить их свойства: несмещённость, эффективность и состоятельность.
Оценка параметра называется несмещённой (без систематических ошибок), если математическое ожидание оценки совпадает с истинным значением :
. (2.1)
Ели равенство (2.1) не имеет места; то оценка называется смещённой (с систематическими ошибками). Это смещение может быть связано с ошибками измерения, счёта или неслучайным характером выборки. Систематические ошибки приводят к завышению или занижению оценки.
Пример 2.1. Пусть – случайные величины с м.о. , . Для их среднего арифметического , согласно теоремы 5.2 (Тема: Первичная обработка выборок), . Таким образом, является несмещённой оценкой величины .
Пример2.2. Пусть – взаимно независимые с.в. с м.о. и дисперсией , . Выберем в качестве оценки дисперсии генеральной совокупности выборочную дисперсию . Преобразуем её:
.
Итак,
. (2.2)
В силу независимости с.в. и теоремы 5.2 (Тема: Первичная обработка выборок) имеем
.
Таким образом,
. (2.3)
Итак, выборочная дисперсия является смещённой оценкой дисперсии .
Умножив равенство (2.3) на , получим . Отсюда следует, что несмещённой оценкой дисперсии является статистика .
Таким образом, модифицированная выборочная дисперсия является несмещённой оценкой дисперсии . ▲
Для некоторых задач математической статистики может существовать несколько несмещённых оценок. Обычно предпочтение отдают той, которая обладает наименьшим рассеянием (дисперсией).
Несмещённая оценка параметра , обладающая минимальной дисперсией среди всех несмещённых оценок для , называемая эффективной.
Пусть – минимальная дисперсия, а – дисперсия любой другой несмещённой оценки параметра . Тогда по определению эффективность оценки равна . Ясно, что .
Часто оценка становится эффективной с увеличением объёма выборки. Предельная эффективность оценки при называется асимптотической эффективностью. Если асимптотическая эффективность равна единице, оценка называется асимптотически эффективной.
В примере 2.2 показано, что модифицированная выборочная дисперсия является эффективной оценкой дисперсии взаимно независимых с.в. с одинаковыми м.о. и дисперсией. Из равенства (2.3) следует, что выборочная дисперсия является асимптотически эффективной оценкой дисперсии таких с.в. с одинаковыми м.о. и дисперсией.
Замечание. Если оценка смещённая, то малость её дисперсии ещё не говорит о малости её погрешности. Взяв, например, в качестве оценки параметра некоторое число , получим оценку даже с нулевой дисперсией. Однако в этом случае ошибка (погрешность) может быть сколь угодно большой.
Оценка называется состоятельной или асимптотически состоятельной, если с увеличением объёма выборки оценка сходится по вероятности к точному значению параметра , т.е. для любого
. (2.4)
Состоятельность оценки параметра означает, что с ростом объёма выборки качество оценки улучшается.
Пример 2.3. В схеме испытаний Бернулли частота появления события в каждом отдельном испытании является состоятельной оценкой вероятности появления события в одном испытании. Это следует из теоремы Бернулли.
Пример 2.4. Согласно теореме Чебышева, среднее арифметическое является состоятельной оценкой среднего арифметического математических ожиданий с.в. с равномерно ограниченными дисперсиями.