Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Конспект лекций по курсу Теор осн иссл стат Выб...doc
Скачиваний:
7
Добавлен:
01.05.2025
Размер:
1.37 Mб
Скачать

5.2. Доверительные оценки параметров распределения

Статистику ,вычисленную на основе выборки объема n, называют точечной оценкой параметра θ. Реализация оценки может существенно отличаться от истинного значения θ. Следовательно, необходимо знать — к каким ошибкам приводит замена θ на и с какой степенью уверенности можно ожидать, что эти ошибки не выйдут за известные пределы. Такие задачи особенно актуальны при малом числе наблюдений, когда точечная оценка в значительной мере случайна и приближенная замена θ на может привести к серьезной ошибке δ

.

Величина δ характеризует степень точности оценки .

Рассмотрим выборку х1,...,хn объема п из генеральной совокупности, закон распределения которой задается плотностью распределения f(x,θ), где значение θ неизвестно. Пусть 1,...,хn) –оценка θ и - плотность вероятности этой оценки. Вычислим по выборке значение и укажем для параметра θ такие два предела α12 , чтобы истинное значение θ с некоторой вероятностью р лежало в заданных пределах, т.е. параметры α12 определяют область

Р =р,

в которой с наперед заданной вероятностью можно найти значение θ. Определение границ этой области повышает информативность точечной оценки.

Существуют два метода решения поставленной задачи: классический (или байесовский метод) и метод доверительных интервалов, предложенный Нейманом. Рассмотрим оба метода.

Классический метод применим в тех случаях, когда неизвестный параметр θ является случайной величиной, имеющей априорное распределение ω(θ). Случаи такого рода встречаются в статистике массового производства, где θ обозначает некоторую неизвестную

характеристику большой партии произведенных товаров, которую требуется оценить по небольшой выборке. Отдельная партия товаров рассматривается как индивидуум, извлеченный из совокупности аналогичных партий товаров, и значения параметра θ

испытывают случайные колебания, вызываемые изменениями производственного процесса и качества сырья.

Функция g(θ) является частной плотностью вероятности для θ в совместном распределении величии θ и , а g( ,θ) является условной плотностью вероятности для

при заданном значении θ. Обратно , условной плотностью вероятности для θ при заданном значении будет, согласно формуле

,

справедливо соотношение

Это соотношение выражает теорему Байеса. Поэтому величина

представляет собой условную вероятность события при заданном значении

и называется апостериорной вероятностью события , в отличие от априорной вероятности этого события, равной

Апостериорная вероятность допускает частотную интерпретацию, которая заключается в следующем.

Рассмотрим последовательность большого количества независимых испытаний, каждое из которых заключается в извлечении партии товаров из совокупности всех партий и затем в извлечении выборки в п значениях из выбранной партии. По выборке вычисляем оценку и далее, предполагаем, что можно исследовать все товары в полной партии, так что θ можно определить непосредственно. Таким образом, результатом каждого испытания будет пара значений величин θ и . Из множества всех испытаний выберем последовательность, образованную из тех случаев, в которых значение принадлежит к некоторой малой окрестности заранее заданного значения . Частота события , в этой последовательности будет определена с точностью, обусловленной случайными колебаниями.

Если имеются основания считать θ случайной величиной с известным распределением вероятностей, применение приведенного выше метода приводит к точным вероятностным утверждениям о значении θ , соответствующем заданной выборке. Однако в практических задачах параметр θ является просто неизвестной величиной. В этом случае поставленную задачу решают с помощью метода доверительных интервалов, предложенного Нейманом.

Погрешность определения оценки можно характеризовать параметром .

Величина , как и , есть случайная величина, имеющая то же распределение , что и (с точностью до смещения). Выберем интервал , в котором с достаточно близкой к единице вероятностью будет заключаться величина :

(1)

где - величина, близкая к нулю. Это означает, что в большинстве выборок (доля которых составляет 1- ) ошибка выборок попадает в данный интервал, и лишь в относительно малом числе выборок (доля которых равна ) ошибка выйдет за пределы интервала . Поскольку произведена одна выборка, то с вероятностью 1- можно полагать, что , попадает в данный интервал, и наоборот, практически невозможен (т.е. с вероятностью ), ее выход за границы интервала. Равенство (1) запишем в виде

и введем следующие определения. Интервал получил название доверительного интервала, а числа , называются доверительными границами, P=l- - доверительной вероятностью, - уровнем значимости.

Отметим, что границы доверительного интервала случайны, а оцениваемый параметр θ не случаен. Поэтому 1- - это вероятность того, что интервал со случайными границами включает постоянный параметр θ. Доверительный интервал дополняет точечную оценку интервальной оценкой параметра θ.

Общим в определении этих оценок является использование информации одной и той же выборки. Отличие состоит в том, что для точечной оценки необходимо знать лишь выборочную функцию, а для построения доверительного интервала необходимо знать закон распределения оценки . Допустим, что плотность распределения симметрична

относительно Е[ ]. Тогда доверительный интервал симметричен относительно Е[ ]. В этом случае уравнение (17) принимает вид

.

Чем шире доверительный интервал, тем больше величина Р. Величина е называется предельной ошибкой выборки и характеризует ее точность. При заданном уровне значимости параметр зависит от свойств генерального распределения и от объема выборки п.

С интервальной оценкой связано решение задач трех типов:

-определение доверительной вероятности по заданному доверительному интервалу и объему выборки;

-определение доверительного интервала по заданной доверительной вероятности Р и объему выборки п;

-определение необходимого объема выборки n по заданным доверительной вероятности и доверительному интервалу.

Перейдем к вопросу о нахождении доверительных границ . Если известен закон распределения оценки , то задача нахождения доверительного интервала решается просто: достаточно найти такое е, для которого

(это случай симметричного интервала).

Затруднение состоит в том, что закон распределения оценки зависит от закона распределения величины х и, следовательно, от его неизвестных параметров.

Существует два способа построения интервальной оценки: приближенный и точный.

Приближенный способ заключается в том, что неизвестные параметры генеральной совокупности, от которых зависит распределение , заменяются на их точечные оценки, полученные на основе выборки. При сравнительно большом объеме выборки (n>20) этот способ дает удовлетворительные результаты.

Для точного нахождения доверительных интервалов необходимо знать вид закона распределения величины х, тогда как для применения приближенных методов это не обязательно.

Рассмотрим точный метод построения доверительных интервалов. Любой доверительный интервал находят из условия, выражающего вероятность выполнения соответствующего неравенства, в которое входит оценка . Закон распределения сценки зависит от неизвестных параметров величины х. Суть точного метода построения доверительного интервала заключается в переходе от случайной величины к другой функции наблюдаемых значений , закон распределения которой не зависит от неизвестных параметров, а зависит только от числа опытов n и от вида закона распределения величины X.