- •Лекция 15
- •Статистическое оценивание параметров распределения
- •Виды оценок
- •Классификация точечных оценок
- •Точечные оценки математического ожидания и дисперсии
- •Методы получения оценок параметров распределения
- •Интервальные оценки параметров
- •Интервальные оценки математического ожидания и дисперсии нормальных случайных величин
Интервальные оценки параметров
Точность точечных оценок характеризуется их дисперсией. При этом отсутствуют сведения о том, насколько близки полученные оценки истинным значениям параметров. В ряде задач требуется не только найти для параметра подходящее численное значение, но и оценить его точность и надежность. Необходимо узнать, к каким ошибкам может привести замена параметра его точечной оценкой и с какой степенью уверенности следует ожидать, что эти ошибки не выйдут за известные пределы.
Такие задачи особенно актуальны при малом числе опытов , когда точечная оценка в значительной степени случайна и приближенная замена на может привести к значительным ошибкам.
Более полный и надежный способ оценивания параметров распределений заключается в определении не единственного точечного значения, а интервала, который с заданной вероятностью накрывает истинное значение оцениваемого параметра.
Пусть по результатам опытов получена несмещенная оценка параметра . Необходимо оценить возможную ошибку. Выбирается некоторая достаточно большая вероятность (например ), такая, что событие с этой вероятностью можно считать практически достоверным событием, и находится такое значение , для которого
. (8.15)
В этом случае диапазон практически возможных значений ошибки, возникающей при замене на , будет, а большие по абсолютной величине ошибки будут появляться лишь с малой вероятностью .
Выражение (8.15) означает, что с вероятностью неизвестное значение параметра попадет в интервал
. (8.16)
Вероятность называется доверительной вероятностью, а интервал , накрывающий с вероятностью истинное значение параметра, называется доверительным интервалом. Заметим, что неправильно говорить, что значение параметра лежит внутри доверительного интервала с вероятностью . Используемая формулировка (накрывает) означает, что хотя оцениваемый параметр и неизвестен, но он имеет постоянное значение и, следовательно, не имеет разброса, поскольку это не случайная величина.
Задача определения доверительного интервала может быть решена только тогда, когда удается найти закон распределения случайной величины . В общем случае этот закон зависит от закона распределения случайной величины и, следовательно, и от его неизвестных параметров (в частности, и от самого оцениваемого параметра). Однако иногда удается перейти при получении оценки к таким функциям опытных данных, закон распределения которых зависит только от величины и закона распределения случайной величины и не зависит от неизвестных параметров.
Пусть проведено независимых испытаний над случайной величиной , числовые характеристики которой – математическое ожидание и дисперсия – неизвестны. Для этих параметров получены точечные оценки:
; . (8.17)
Требуется найти доверительный интервал , соответствующий доверительной вероятности , для математического ожидания случайной величины .
Так как случайная величина представляет собой сумму независимых и одинаково распределенных случайных величин , то согласно центральной предельной теореме при достаточно больших (на практике порядка 1020) ее закон распределения близок к нормальному. Таким образом получаем, что случайная величина распределена по нормальному закону с математическим ожиданием и дисперсией (см. (7.3–7.4)). Если величина дисперсии неизвестна, то в качестве ее оценки можно использовать . В этом случае найдем такое , для которого
.
При использовании формулы (4.37) получаем
,
где – среднее квадратичное отклонение оценки .
Из уравнения
находим значение :
, (8.18)
где – функция, обратная , – квантиль порядка стандартного нормального распределения.
Таким образом, приближенно решена задача построения доверительного интервала в виде
,
где определяется формулой (8.18).
Чтобы избежать при вычислении обратного интерполирования в таблицах функции , обычно составляется небольшая таблица, в которой приводятся значения квантилей в зависимости от наиболее часто используемых значений доверительной вероятности (табл. 8.4).
Таблица 8.4 |
|
0,9 |
1,643 |
0,95 |
1,960 |
0,99 |
2,576 |
0,9973 |
3,000 |
0,999 |
3,290 |
С использованием величины доверительный интервал будет иметь вид
.