Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Гмурман.doc
Скачиваний:
6
Добавлен:
01.03.2025
Размер:
4.92 Mб
Скачать

§ 14. Точность оценки, доверительная вероятность (надежность). Доверительный интервал

Точечной называют оценку, которая определяется ддм числом. Все оценки, рассмотренные выше,— тОчечные. При выборке малого объема точечная оценка может значительно отличаться от оцениваемого параметра,

е. приводить к грубым-ошибкам. По этой причине при небольшом объеме выборки следует пользоваться интер­вальными оценками.

Интервальной называют оценку, которая определяется двумя числами — концами интервала. Интервальные оценки позволяют установить точность и надежность оценок (смысл этих понятий выясняется ниже).

Пусть найденная по данным выборки статистическая характеристика в* служит оценкой неизвестного пара­метра G. Будем считать в ^постоянным числом (в может быть и случайной величиной). Ясно, что в* тем точнее определяет параметр в, чем меньше абсолютная величина разности |в—в* |. Другими словами, если б>0 и |в—О* | < б, то чем меньше б, тем оценка точнее. Таким образом, положительное число б характеризует точность оценки.

Однако статистические методы не позволяют катего­рически утверждать, что оценка в* удовлетворяет нера­венству |0— 0*|<б; можно лишь говорить о вероят­ности у, с которой это неравенство осуществляется.

Надежностью (доверительной вероятностью) оценки в по в* называют вероятность у, с которой осуществ­ляется неравенство |0—в* | < б. Обычно надежность оценки задается наперед, причем в качестве у берут число, близкое к единице. Наиболее часто задают надеж­ность, равную 0,95; 0,99 и 0,999.

Пусть вероятность того, что |0 — 6*|<б, равна v!

Р[\в—в* | < 6] = у.

Заменив неравенство 10—0* | < б равносильным ему двой­ным неравенством —б <©—©*< б, или 0*—б<0< <в*4-б, имеем

соотношение следует понимать так: вероятность того, интервал (0* — б, 0* + б) заключает в себе (покры-ает) неизвестный параметр 0, равна у.

213

Доверительным называют интервал (в* — б, в* 4-6) который покрывает неизвестный параметр с заданной надежностью у.

Замечание. Интервал (в* — 6, в* + б) имеет случайны» концы (их называют доверительными границами). Действительно в разных выборках получаются различные значения в*. Следов^ тельно, от выборки к выборке будут изменяться и концы доверь! тельного интервала, т. е. доверительные границы сами являются случайными величинами — функциями от xt, x2, ...,хп.

Так как случайной величиной является не оцениваемый пара, метр в, а доверительный интервал, то более правильно говорить не о вероятности попадания в в доверительный интервал, а о вероят-ности того, что доверительный интервал покроет 0.

Метод доверительных интервалов разработал амери­канский статистик Ю. Нейман, исходя из идей англий­ского статистика Р. Фишера.

§15. Доверительные интервалы для оценки математического ожидания нормального распределения при известном о

Пусть количественный признак X генеральной совокупности распределен нормально, причем среднее квадратическое отклонение о этого распределения известно. Требуется оценить неизвестное математическое ожидание а по выборочной средней х. Поставим своей задачей найти доверительные интервалы, покрывающие параметр а с надежностью у.

Будем рассматривать выборочную среднюю х как слу­чайную величину X изменяется от выборки к выборке)

и выборочные значения признака хг, хг хп—как

одинаково распределенные независимые случайные вели­чины Хх, Х2, . . ., Хп (эти числа также изменяются от выборки к выборке). Другими словами, математическое ожидание каждой из этих величин равно а и среднее квадратическое отклонение — о.

Примем без доказательства, что если случайная вели­чина X распределена нормально, то выборочная средняя И, найденная по независимым наблюдениям, также раС' пределена нормально. Параметры распределения X такова' (см. гл. VIII, § 9):

М(Х) = а,

214

Потребуем, чтобы выполнялось соотношение Р(\Х—а\ <6) = Т>

где V — заданная надежность.

Пользуясь формулой (см. гл. XII, § 6)

Р(|Х—а|<б) = 2Ф(б/о),

заменив X на X и о на а(Х) = ст/К"л, получим /> (| Х — а | < б) = 2Ф (б |/п/а ) = 2Ф (О,

где t=*bV"nfa.

Найдя из последнего равенства б = tal\^n , можем на­писать

Приняв во внимание, что вероятность Р задана и равна у, окончательно имеем (чтобы получить рабочую

формулу, выборочную среднюю вновь обозначим через х) Р (x—ta/Vn' <a<x + talVH) = 2Ф (t) = y.

Смысл полученного соотношения таков: с надежностью у можно утверждать, что доверительный интервал ta\\fn , x-\-to\Vn ) покрывает неизвестный параметр а; точность оценки б = tojy п.

Итак, поставленная выше задача полностью решена. Укажем еще, что число / определяется из равенства 2Ф (/) = у, или Ф (t) = у/2; по таблице функции Лапласа (см. приложение 2) находят аргумент /, которому соот­ветствует значение функции Лапласа, равное у/2.

Замечание 1. Оценку | х а \ < to/ Y^n называют классиче­ской. Из формулы 8 = to/ У^я, определяющей точность классической оценки, можно сделать следующие выводы:

  1. при возрастании объема выборки п число 6 убывает и, следо­ вательно, точность оценки увеличивается;

  2. увеличение надежности оценки у = 2Ф(/) приводит к увеличе­ нию t (t) — возрастающая функция), следовательно, и к возраста­ нию 6; другими словами, увеличение надежности классической оценки влечет за собой уменьшение ее точности.

Пример. Случайная величина X имеет нормальное распределение с Известным средним квадратическим отклонением а = 3. Найти дове­ рительные интервалы для оценки неизвестного математического ожи- Дэния а по выборочным средним х, если объем выборки л = 36 и аДана надежность оценки у = 0,95. '

215

Решение. Найдем t. Из соотношения 2Ф(*) = 0>95 получим Ч> (/) — 0,475. По таблице приложения 2 находим / = 1,96. Найдем точность оценки:

б = to/ Уп = (1,96 • 3)/ У~Ш> = 0,98.

Доверительный интервал таков: (х—0,98; T-f-0,98). Например, если * = 4,1, то доверительный интервал имеет следующие доверительные Границы:

Г— 0,98 = 4,1 — 0,98 = 3,12; 7+ 0,98 = 4,1+ 0,98 = 5,08.

Таким образом, значения неизвестного параметра а, согласую. Щиесяс данными выборки, удовлетворяют неравенству 3,12 < а < 5,08. Подчеркнем, что было бы ошибочным написать Р (3,12 <5,08) = 0,95. Действительно, так как а— постоянная величина, то либо она заклю­чена в найденном интервале (тогда событие 3,12 < а < 5,08 досто­верно и его вероятность равна единице), либо в нем не заключена (в этом случае событие 3,12 < а < 5,08 невозможно и его вероят­ность равна нулю). Другими словами, доверительную вероятность не следует связывать с оцениваемым параметром; она связана лишь с границами доверительного интервала, которые, как уже было ука­зано, изменяются от выборки к выборке.

Поясним смысл, который имеет заданная надежность. Надеж­ность 7 = 0,95 указывает, что если произведено достаточно большое число выборок, то 95% из них определяет такие доверительные интер­валы, в которых параметр действительно заключен; лишь в 5% слу­чаев он может выйти за границы доверительного интервала.

Замечание 2. Если требуется оценить математическое ожида­ние с наперед заданной точностью б и надежностью у, то минималь­ный объем выборки, который обеспечит эту точность, находят по формуле

п = (следствие равенства S~ta/У~п).