- •3. Точечные оценки неизвестных параметров
- •3.1. Определение и свойства точечной оценки
- •3.2. Точечная оценка математического ожидания
- •3.3. Точечные оценки дисперсии
- •3.4. Точечная оценка вероятности события
- •3.5. Метод максимального правдоподобия
- •3.6. Вычисление точечных оценок в Excel
- •4. Интервальные оценки неизвестных параметров
- •4.1. Некоторые распределения выборочных характеристик
- •4.2. Понятие интервальной оценки параметра случайной величины
- •4.3. Интервальные оценки математического ожидания нормального распределения
- •4.4. Интервальные оценки дисперсии нормального распределения
- •4.5. Интервальная оценка вероятности события
- •4.6. Вычисление границ доверительных интервалов в Excel
4.2. Понятие интервальной оценки параметра случайной величины
Вычисляя на основании результатов
наблюдений точечную оценку
неизвестного
параметра
,
мы понимаем, что величина
является (в силу своей случайности) лишь
приближенным значением параметра
.
При большом числе наблюдений точность
приближения бывает достаточной для
практических выводов в силу несмещенности,
состоятельности и эффективности
"хороших" оценок. Для выборок малого
объема точечные оценки могут значительно
отличаться от оцениваемого параметра
и вопрос о точности получаемых оценок
становится очень важным. В математической
статистике он решается введением
интервальных оценок.
Интервальной оценкой для параметра
называется такой интервал
со
случайными границами, что
.
(4.7)
Вероятность
называется надежностью интервальной
оценки или доверительной
вероятностью, случайные величины
–
доверительными границами, а сам
интервал
иногда
называют доверительным интервалом.
Центром этого интервала является
значение точечной оценки
.
Надежность принято выбирать равной 0.95, 0.99. Тогда событие, состоящее в том, что интервал покроет параметр , будет практически достоверным.
Общая теория построения интервальных оценок заключается в определении случайной величины, зависящей от оцениваемого параметра. Зная распределение этой случайной величины, находят соответствующие доверительные границы и сам доверительный интервал с требуемой точностью. Посмотрим, как эта идея реализуется для различных параметров.
4.3. Интервальные оценки математического ожидания нормального распределения
Пусть генеральная совокупность Х
распределена по нормальному закону
,
причем параметр
известен, а параметр
требуется оценить с надежностью
.
По теореме о распределении выборочных
характеристик случайная величина
распределена по закону
.
На рис. 4.3 изображен график функции
плотности этой случайной величины, т.е.
кривая
.
Выберем число
так, что заштрихованная площадь равна
,
т.е.
.
(4.8)
х
р(х)
Рис. 4.3. К построению доверительных интервалов
Это значение легко находится с
использованием интегральной функции
Лапласа
.
Действительно,
.
(4.9)
Значение , удовлетворяющее нелинейному уравнению
,
(4.10)
находится по табл. П1.
Так как > 0,
то события
и
эквивалентны, а значит, их вероятности
равны:
.
(4.11)
Таким образом, для параметра
мы построили доверительный интервал
(интервальную оценку), левая граница
которого
,
правая –
,
а точность –
.
Центр этого интервала находится в точке
с координатой
,
а длина интервала
.
Если объем выборки неограниченно
возрастает, то интервал стягивается в
одну точку
,
которая является состоятельной и
несмещенной оценкой для параметра
.
♦ Пример 4.1. По выборке объема
п = 9 найдено среднее значение
.
Считая, что генеральная совокупность
распределена по нормальному закону
с
,
определить интервальную оценку для
математического ожидания с надежностью
.
Решение. Используя табл. П1, находим, что
при
.
Тогда
и доверительный интервал (4.11) имеет
границы
.
Таким образом, с вероятностью 0.95 можно
быть уверенным в том, что интервал
(4.12)
накроет параметр
или, другими словами, с вероятностью
0.95 значение
дает значение параметра а с точностью
=
1.31.
Заметим, что эта трактовка неверна,
если вместо случайной величины
использовать вычисленное по конкретной
выборке значение
=
1.5. Тогда границы интервала (0.19, 2.81) будут
не случайными и возможны два случая:
точка а лежит внутри этого интервала, тогда
Р(0.19 < а < 2.81) = 1;
точка а не лежит внутри (0.19, 2.81), тогда
Р(0.19 < а < 2.81) = 0.
Поэтому только для интервала (4.12) со случайными границами можно утверждать, что
.
☻
Определим теперь интервальную оценку
для неизвестной генеральной средней
нормально распределенной генеральной
совокупности Х в том случае, когда
генеральная дисперсия
неизвестна, т.е. построим доверительный
интервал для параметра
,
если параметр
неизвестен.
В отличие от предыдущего случая, вместо
случайной величины
,
распределенной по закону
,
рассмотрим случайную величину
,
которая согласно следствию из теоремы
4.1 распределена по закону Стьюдента
.
При заданном значении
,
пользуясь табл. П2, вычислим значение
из условия
,
(4.13)
где
– надежность интервальной оценки.
Заметим, что в табл. П2
означает не число степеней свободы, а
объем выборки. Число степеней свободы
будет равно
.
Замена случайной величины на случайную величину вызвана тем, что закон распределения последней случайной величины известен и в ее запись не входит неизвестный в данном случае параметр . Из условия (4.13) получаем
.
Таким образом, интервальная оценка надежности для неизвестной генеральной средней а имеет границы
.
Выразим границы интервала через
исправленную дисперсию
.
Так как
,
то
.
Поэтому
.
Значит, границы доверительного интервала можно записать как
,
(4.14)
а точность интервальной оценки определить соотношением
.
(4.15)
Как и в предыдущем случае, центр интервала
находится в точке
,
но длина интервала
является случайной величиной, принимающей
тем меньшие значения, чем больше значение
п. Это объясняется тем, что наличие
большей информации
о генеральной совокупности Х
позволяет сузить интервал.
♦ Пример 4.2. По выборке объема п
= 9 из нормально распределенной генеральной
совокупности найдены значения
и
.
Построить интервальную оценку для
математического ожидания с надежностью
.
Решение. Пользуясь табл. П2, находим
величину
.
Тогда точность
определяется соотношением (см. (4.15)):
,
а интервальная оценка имеет границы
,
которые зависят от двух случайных
величин:
и
S. Подставляя вместо
S ее вычисленное
значение s = 2, получаем
интервал
.
Сравнивая эту оценку с интервальной
оценкой примера 4.1 (см. (4.12)), видим,
что замена неизвестной величины
вычисляемой величиной s
приводит к уменьшению точности
интервальной оценки и увеличению длины
доверительного интервала. Подставив
вместо случайной величины
ее конкретное значение
,
получаем конкретное значение границ
(0, 3). ☻
