Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Російська версія книги з теорії ймовірності.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
4.16 Mб
Скачать

§ 4.3. Доверительные интервалы для параметров нормального распределения

1. Надежность. Доверительные интервалы. Пусть — оцениваемый параметр,

— его оценка, составленная из . Если известно, что оценка является несмещенной и состоятельной, то по данным выборки вычисляют значение и считают его приближением истинного значения . При этом среднее квадратичное отклонение (если его вообще вычисляют) оценивает порядок ошибки. Такие оценки называются точечными.

Например, в предыдущем параграфе речь шла о точечных оценках генеральной средней и генеральной дисперсии. В общем случае, когда о распределении признака X ничего неизвестно, это уже немало. Если же о распределении имеется какая-либо информация, то можно сделать больше.

Здесь речь будет идти об оценке параметров а к о случайной величины,

имеющей нормальное распределение. Это очень важный случай. Например (см. § 2.7), результат измерения имеет нормальное распределение. В этом случае становится возможным применять так называемое интервальное оценивание, к изложению которого мы и переходим.

Пусть >0 некоторое число если неравенство выполняется < , т.е < < , что можно записать в виде - < < + , то говорят, что интервал( - , + ) покрывает параметр . Однако невозможно указать оценку 0л такую, чтобы событие { < } было достоверным, поэтому мы будем говорить о вероятности этого события.

Число называется точностью оценки . Определение. Надежностью (доверительной вероятностью) оценки параметра для заданного > 0 называется вероятность у того, что интервал ( - , + ) покроет параметр т.е.

γ=P{Θn-δ<Θ>Θn+δ}=P{|Θn-Θ|<δ}

Заметим, что после того, как по данным выборки вычислена оценка Θn , событие {|Θn-Θ|<δ}становится или достоверным, или невозможным, так как интервал ( - < < + ) или покрывает Θ, или нет. Но дело в том, что параметр Θ нам неизвестен. Поэтому мы называем надежностью γ уже вычисленной оценки Θn , вероятность того, что интервал ( - < < + ) найденный для произвольной выборки, покроет Θ. Если мы сделаем_много

выборок объема n и для каждой из них построим интервал ( - < < + ) , то доля тех выборок, чьи интервалы покроют Θ, равна у. Иными словами, у есть мера нашего доверия вычисленной оценке 9. Ясно, что, чем меньше число 8, тем меньше надежность γ.

Определение. Доверительным интервалом называется найденный по данным выборки интервал ( - < < + ), который покрывает параметр Θ с заданной надежностью γ.

Надежность у обычно принимают равной 0,95 или 0,99, или 0,999. Конечно, нельзя категорически утверждать, что найденный доверительный интервал покрывает параметр Θ. Но в этом можно быть уверенным на 95% при γ =0,95, на 99% при γ =0,99 и т.д. Это значит, что если сделать много выборок, то для 95% из них (если, например, γ =0,95) вычисленные доверительные интервалы действительно покроют Θ.

2. Доверительный интервал для математического ожидания при известном σ. В некоторых случаях среднее квадратичное отклонение а ошибки измерения (а вместе с нею и самого измерения) бывает известно. Например, если измерения осуществляются одним и тем же прибором при одних и тех же условиях.

Итак, пусть случайная величина X распределена нормально с параметрами а и σ, причем σ известно. Построим доверительный интервал, покрывающий неизвестный параметр а с заданной надежностью γ. Данные выборки есть реализации случайных величин Х1, Х2, ..., Хn, имеющих нормальное распределение с параметрами а и σ (§ 4.2, п. 1). Оказывается, что и выборочная средняя случайная величина X = 1/n(Х1 + Х2 +... + Хn) тоже имеет нормальное распределение (это мы примем без доказательства). При этом (см. § 4.2, пп. 2, 3)

М(Х) = а; σ (Х) = σ/√n

Потребуем, чтобы выполнялось соотношение Р( | X - а | < δ) = γ, где γ — заданная надежность. Пользуясь формулой (2.27) (§ 2.7, п. 2), получим

Р( | X - а | < δ) =2Ф(σ/√n/σ) , или

Р( | X - а | < δ) =2Ф(t), где

t = σ/√n/σ (4.15)

Найдя из равенства (4.15) δ = t σ/√n, можем написать

Р( | X - а | < t σ/√n) =2Ф(t),

Так как Р задана и равна у, то окончательно имеем (для получения рабочей формулы выборочную среднюю заменяем на xB):

P=( xB- t σ/√n<a<xB+ t σ/√n)=2Ф(t)= γ

Смысл полученного соотношения таков: с надежностью γ можно утверждать, что доверительный интервал ( xB- t σ/√n;xB+ t σ/√n) покрывает неизвестный параметр а; точность оценки δ = t σ/√n . Здесь число tопределяется из равенства Ф(t) = γ/2 [оно следует из 2Ф(t)= γ] по таблице приложения 3.

Как уже упоминалось, надежность у обычно принимают равной или 0,95 или 0,99, или 0,999.

Пример. Признак X распределен в генеральной совокупности нормально с известным σ = 0,40. Найдем по данным выборки доверительный интервал для а с надежностью γ = 0,99, если n = 20, xB = 6,34.

Для Ф(t) = γ/2 = 0,99/2 = 0,495 находим по таблице приложения 3 t=2,58. Следовательно, δ = 2,58*0,40/√20= 0,23. Границы доверительного интервала 6,34-0,23 = 6,11 и 6,34 + 0,23 = 6,57. Итак, доверительный интервал (6,11; 6,57) покрывает а с надежностью 0,99.