Интервальные оценки
Любая точечная оценка является функцией выборки, то есть является случайной величиной, а при каждой реализации выборки эта функция определяет единственное значение оценки, принимаемое за приближаемое значение оцениваемой характеристики.
При этом надо принимать во внимание, что в каждом конкретном случае значение оценки может отличаться от значения параметра, поэтому желательно было бы знать и возможную погрешность, возникающую при использовании предлагаемой оценки, например, указывая такой интервал (или область в случае векторного (неодномерного) параметра), внутри которого с высокой (т. е. близкой к 1) вероятностью находится истинное значение оцениваемого параметра. При таком подходе говорят об интервальном или доверительном оценивании. Основная цель при
этом состоит в том, чтобы при заданном доверительном уровне, построить
кратчайший интервал, обеспечивающий наиболее точную локализацию оцениваемой характеристики.
То есть, в некоторых случаях оказывается более важным установить не конкретное число – кандидата на значение неизвестного параметра (точечное оценивание), а указать интервал, в котором с некоторой вероятностью находится искомое неизвестное значение параметра.
Границы этого интервала, называемого доверительным, строятся по выборке, то есть являются оценками (интервальными) данного параметра.
Итак, мы хотим найти такие статистики (Х1… ,Хn (верхняя доверительная граница) и (Х1… ,Хn ) (нижняя доверительная граница), чтобы с вероятностью α выполнялось равенство
P (Х1… ,Хn ) ≤ θ ≤ (Х1… ,Хn ) = α, то есть с заданной вероятностью значение параметра попадало бы в полученный интервал.
Замечание 24.12. Α в разных источниках называется коэффициентом доверия, уровнем доверия, доверительной вероятностью, надежностью.
Замечание 24.13. Иногда задача формулируется немного по-другому: требуют выполнения с вероятностью α неравенства
P ( (Х1… ,Хn ) ≤ θ ≤ (Х1… ,Хn )≥ α, то есть вероятность попасть в интервал для параметра должна быть не меньше α
Сначала задается доверительная вероятность. Обычно ее выбирают равной 0.95, 0.99 или 0.999. Тогда вероятность того, что интересующий нас параметр попал в интервал ( , ) достаточно высока. Число ( + )/ 2 – середина доверительного интервала – будет давать значение параметра θ с точностью ( - )/ 2, которая представляет собой половину длины доверительного интервала.
Таким образом, границы доверительного интервала будут зависеть не только от самих наблюдений, но и от их числа n и заданной доверительной вероятности α.
Определение 24.11
Таким образом, доверительным (для оценки параметра θ, отвечающим доверительной вероятности α) называется такой интервал, который с наперед заданной вероятностью содержит оцениваемый параметр. Границы его θ* и θ* будут зависеть от α и от числа наблюдений n
Замечание 24.14. Как и в случае точечных оценок, получаемые оценки (границы интервала) тем ближе к параметру с тем большей вероятностью, чем больше объем выборки (Напомним, что все характеристики качества оценок рассматриваются при n→∞)
Пример 24.9. Пусть θ – среднее значение предела прочности некоторого материала, которое оценивают независимо друг от друга в каждой из N различных лабораторий по результатам n независимых испытаний. Иначе говоря, среднее значение предела прочности в каждой лаборатории оценивают по собственным экспериментальным данным, представленным выборкой объема n, и в каждой лаборатории получают свои значения верхней и нижней границ α-доверительного интервала
Возможны случаи, когда α-доверительный интервал для параметра θ не накрывает его истинного значения. Если М – число таких случаев, то при больших значениях N должно выполняться приближенное равенство α =(N – M)/N. Таким образом, если опыт – получение выборки объема n в лаборатории, то уровень доверия α – доля тех опытов ( при их многократном независимом повторении), в каждом из которых α-доверительный интервал накрывает истинное значение оцениваемого параметра.
Напоминание. Оценка (Х1… ,Хn ) называется асимптотически нормальной с дисперсией Δ2, если
( – ) сходится при n →∞ по распределению к стандартному нормальному закону (нормальное распределение при нулевом математическом ожидании и дисперсии, равной 1)
Асимптотически нормальными являются выборочное среднее, дисперсия, моменты
Замечание 24.15.
Построение доверительного интервала основано на определении функции распределения и ее важнейшем свойстве функции распределения: вероятность того, что случайная величина примет значение из промежутка (х1; х2) равна приращению функции распределения на этом промежутке. P(x1 Х < x2) = F(x2) – F(x1)
Кроме того напомним, что FХ (α) = P(Х < α). В частности, если некоторая величина имеет стандартное нормальное распределение с функцией распределения N(x), P(x1 Х < x2) = N(x2) – N(x1) и NХ (α) = P(Х < α), где
,
а
- функция Лапласа
Доверительные интервалы для неизвестного математического ожидания m=E(X) при известной дисперсии σ2= DX
Согласно свойству
асимптотической нормальности выборочного
среднего
имеем
,
то есть приблизительно равна функции
распределения нормального закона.
Тогда для любого z>0
эквивалентно
где
функция распределения нормального
закона
выражается через
функцию Лапласа
Получим ввиду нечетности функции Лапласа
Поскольку, как уже говорилось (Лекция 19) для функции Лапласа существуют таблицы, можно взять в качестве z zα – ее квантиль порядка α .
Доверительные интервалы для неизвестного математического ожидания m=E(X) при неизвестной дисперсии σ2= DX
Проведя аналогичные
рассуждения, можно воспользоваться
последней формулой, взяв в качестве σ
корень из выборочной дисперсии
,
где
Тогда мы получим аналогичное приближение
и аналогичный интервал
Замечание 24.16
В построениях мы использовали свойство асимптотической нормальности, то есть допущение n→∞. На практике это означает требование большого размера выборки.
Если мы будем рассматривать исходную случайную величину с нормальным законом распределения, тогда можно построить доверительный интервал с вероятностью, ровно равной α, поскольку тут нет необходимости в асимптотических формулах и имеет место «удобное» нормальное распределение. Соответственно, n может быть относительно небольшим.
положим
В случае, если рассматривается выборка из нормального закона, для построения доверительных интервалов используется Лемма (Теорема) Фишера:
Пусть Х1,
Х2,…..Хn
— независимая выборка из генеральной
совокупности с нормальным законом
распределения. Пусть
—
выборочное среднее, а
—
несмещённая выборочная дисперсия.
Тогда
1. и независимы
Замечание 24.17. Часто приходится слышать, что «независимые величины – это величины, не имеющие ничего общего». Это убедительный контрпример для подобного заблуждения: выборочное среднее и дисперсия не просто «имеют что-то общее», а вторая выражается через первое.
2.
имеет стандартное нормальное распределение
. Позволяет оценить неизвестное
математическое ожидание a
при известной дисперсии и наоборот,
неизвестную дисперсию σ по известному
математическому ожиданию a.
Случай,
аналогичный предыдущему. Подобрав по
заданному α такое d,
что P(
–
a
< d)
=
α, получим
=
α
Задача. Пусть имеется генеральная совокупность с некоторой характеристикой, распределенной по нормальному закону с дисперсией, равной 6,25. Произведена выборка объема n = 27 и получено средневыборочное значение характеристики = 12. Найти доверительный интервал, покрывающий неизвестное математическое ожидание исследуемой характеристики генеральной совокупности с доверительной вероятностью α =0,99.
Решение.
Сначала по таблице для функции Лапласа
найдем значение t
из
равенства
(t)
= α
/ 2
= 0,495.
По полученному значению
t
=
2,58 определим точность оценки (или
половину длины доверительного интервала)
d:
d=
t /
=
2,52,58 /
1,24. Отсюда получаем искомый доверительный
интервал: (10,76; 13,24).
3.
то есть имеет распределение «хи-квадрат»
с n-1
степенью свободы. Позволяет оценить
неизвестную дисперсию при неизвестном
математическом ожидании
Задача. Будем считать, что шум в кабинах вертолетов одного и того же типа при работающих в определенном режиме двигателях — случайная величина, распределенная по нормальному закону. Было случайным образом выбрано 20 вертолетов, и произведены замеры уровня шума (в децибелах) в каждом из них. Исправленная выборочная дисперсия измерений оказалась равной 22,5. Найти доверительный интервал, накрывающий неизвестное стандартное отклонение величины шума в кабинах вертолетов данного типа с доверительной вероятностью 98%.
Решение. По числу степеней свободы, равному 19, и по вероятности (1 – 0,98)/2 = 0,01 находим из таблицы распределения 2 величину 22 = 36,2. Аналогичным образом при вероятности (1 + 0,98)/2 = 0,99 получаем 12 = 7,63. Используя формулу для доверительного интервала, получаем искомый доверительный интервал: (3,44; 7,49).
4.
~
tn-1
, то есть имеет распределение Стьюдента
с n-1
степенью свободы. Позволяет оценить
неизвестное математическое ожидание
при неизвестной дисперсии. (s
– выборочная дисперсия), используя
свойство функции распределения закона
Стьюдента t(-x)
= 1 – t(x)
Задача. На контрольных испытаниях 20-ти электроламп средняя продолжительность их работы оказалась равной 2000 часов при среднем квадратическом отклонении (рассчитанном как корень квадратный из исправленной выборочной дисперсии), равном 11-ти часам. Известно, что продолжительность работы лампы является нормально распределенной случайной величиной. Определить с доверительной вероятностью 0,95 доверительный интервал для математического ожидания этой случайной величины.
Решение.
Величина 1 – α
в
данном случае равна 0,05. По таблице
распределения Стьюдента, при числе
степеней свободы, равном 19, находим: tα
= 2,093. Вычислим теперь точность оценки:
2,093121/
= 56,6. Отсюда получаем искомый доверительный
интервал:
(1943,4; 2056,6).
