
- •Выборочные характеристики
- •Статистическое оценивание Статистические оценки параметров распределения. Состоятельность и несмещенность статистических оценок
- •Надежность и доверительный интервал
- •Определение доверительных интервалов Доверительный интервал для математического ожидания нормального распределения при известной дисперсии
- •Доверительный интервал для математического ожидания нормального распределения при неизвестной дисперсии
- •Доверительный интервал для оценки среднего квадратического отклонения нормального распределения
- •Проверка статистических гипотез
- •Статистический критерий
- •Критическая область. Область принятия гипотезы. Критические точки
- •Критерий согласия Пирсона о виде распределения
Надежность и доверительный интервал
До сих пор мы рассматривали точечные оценки, т.е. такие оценки, которые определяются одним числом. При выборке малого объема точечная оценка может значительно отличаться от оцениваемого параметра, что приводит к грубым ошибкам. В связи с этим при небольшом объеме выборки пользуются интервальными оценками.
Интервальной
называют оценку, определяющуюся двумя
числами – концами интервала. Пусть
найденная по данным выборки статистическая
характеристика
служит оценкой неизвестного параметра
.
Очевидно,
тем точнее
определяет параметр
,
чем меньше абсолютная величина разности
.
Другими словами, если
и
,
то чем меньше ,
тем точнее оценка. Таким образом,
положительное число
характеризует точность оценки.
Статистические методы не позволяют утверждать, что оценка удовлетворяет неравенству , можно говорить лишь о вероятности, с которой это неравенство осуществляется.
Надежностью (доверительной вероятностью) оценки по называют вероятность , с которой осуществляется неравенство . Обычно надежность оценки задается заранее, причем, в качестве берут число, близкое к единице – как правило, 0,95; 0,99 или 0,999.
Пусть вероятность того, что равна :
.
Заменим неравенство
равносильным ему двойным неравенством
.
Это соотношение
следует понимать так: вероятность того,
что интервал
заключает в себе (покрывает) неизвестный
параметр ,
равна
.
Таким образом, доверительным называют интервал , который покрывает неизвестный параметр с заданной надежностью .
Определение доверительных интервалов Доверительный интервал для математического ожидания нормального распределения при известной дисперсии
Пусть
количественный признак X
генеральной совокупности распределен
нормально, причем среднее квадратическое
отклонение
этого распределения известно. Требуется
оценить неизвестное математическое
ожидание a
по выборочному среднему
.
Найдем доверительные интервалы,
покрывающие параметр a
с надежностью
.
Будем
рассматривать выборочное среднее
,
как случайную
величину
(т.к.
меняется
от выборки к выборке), и выборочные
значения
,
как одинаково распределенные независимые
случайные величины
(эти числа также меняются от выборки к
выборке). Другими словами, математическое
ожидание каждой из этих величин равно
a
и среднее квадратическое отклонение –
.
Так как случайная величина X
распределена нормально, то и выборочное
среднее
также распределено нормально. Параметры
распределения
равны:
.
Потребуем,
чтобы выполнялось соотношение
,
где
– заданная надежность.
Используем
формулу
.
Заменим
X
на
и
на
и получим:
,
где
.
Выразив
из последнего равенства
,
получим:
.
Так как вероятность P задана и равна , окончательно имеем:
.
Смысл
полученного соотношения – с надежностью
можно утверждать, что доверительный
интервал
покрывает
неизвестный параметр a,
причем точность оценки равна
.
Таким
образом, задача решена. Число
определяется из равенства
;
по таблице функции Лапласа находят
аргумент
,
которому соответствует значение функции
Лапласа, равное
.
Следует
отметить два момента: 1) при возрастании
объема
выборки n
число
убывает и, следовательно, точность
оценки увеличивается, 2) увеличение
надежности
оценки
приводит к увеличению
(так как функция Лапласа – возрастающая
функция) и, следовательно, к возрастанию
,
то есть увеличение надежности оценки
влечет за собой уменьшение ее точности.
Если
требуется оценить математическое
ожидание с наперед заданной точностью
и надежностью
,
то минимальный объем выборки, который
обеспечит эту точность, находят по
формуле
,
следующей из равенства
.