
- •Точечное и интервальное оценивание
- •Введение
- •Вопрос 1. Статистические оценки
- •Свойства оценок
- •Вопрос 2. Оценка генеральной средней по выборочной средней
- •Вопрос 3. Оценка генеральной дисперсии по исправленной выборочной
- •Вопрос 4. Доверительные интервалы. Точность оценки. Надежность
- •Доверительные интервалы для оценки числовых характеристик нормального распределения
Вопрос 3. Оценка генеральной дисперсии по исправленной выборочной
Пусть в результате независимых наблюдений над количественным признаком Х из генеральной совокупности извлечена выборка объема n:
,
где
.
Пусть генеральная дисперсия DГ неизвестна и требуется найти ее оценку по данным выборки.
Если за оценку DГ принять выборочную дисперсию DВ, то эта оценка будет приводить к систематическим ошибкам, давая заниженное значение генеральной дисперсии. Объясняется это тем, что DВ является смещенной оценкой DГ, так как
.
Легко «исправить» выборочную дисперсию
DВ так, чтобы М(DВ)
было равно DГ.
Достаточно для этого умножить DВ
на дробь
сделав это, получим
исправленную дисперсию:
Исправленная дисперсия s2 является несмещенной оценкой генеральной дисперсии DГ, так как
Замечание
При достаточно больших значениях n объема выборки DВ и s2 различаются незначительно. На практике исправленной дисперсией s2 пользуются в том случае, если
n < 30.
Вопрос 4. Доверительные интервалы. Точность оценки. Надежность
О.4.1. Оценка, которая определяется одним числом, называется точечной.
Рассмотренные ранее оценки , DВ и s2 являются точечными.
При выборке малого объема точечная оценка может значительно отличаться от оцениваемого параметра, то есть приводить к грубым ошибкам. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.
О.4.2. Оценка параметра называется интервальной, если она определяется двумя числами – концами интервала, который покрывает параметр .
Пусть * - оценка неизвестного параметра ( - постоянное число, хотя может быть и СВ).
Оценка * тем точнее определяет параметр , чем меньше | – *|. Другими словами, если > 0 и
,
(2)
то чем меньше , тем точнее оценка *.
Число называется точностью оценки *.
Так как * - СВ, то и разность | – *| - СВ. Поэтому неравенство (2) при заданном может выполняться только с некоторой вероятностью.
О.4.3. Надежностью (доверительной вероятностью) оценки * параметра для заданного > 0 называется вероятность , с которой осуществляется неравенство (2).
Замечание
Обычно задается надежность и определяется точность .
Пусть
.
Так как
,
то получим неравенство:
,
то есть вероятность того, что интервал (*–; *+) заключает в себе (покрывает) неизвестный параметр , равна .
О.4.4.Доверительным интервалом называется интервал (*–; *+), который покрывает неизвестный параметр с заданной надежностью .
Замечание
Границы доверительного интервала (*–; *+) находятся по выборке и поэтому являются СВ в отличие от оцениваемого параметра - величины неслучайной, поэтому правильнее говорить о том, что доверительный интервал «покрывает», а не «содержит» значение .
Метод доверительных интервалов разработал американский статистик Ю. Нейман на основе идей английского статистика Р. Фишера.