
- •Оглавление
- •Предисловие
- •Задачи математической статистики
- •Генеральная и выборочная совокупности
- •Статистическое распределение выборки
- •Графическое изображение статистического распределения выборки
- •Эмпирическая функция распределения
- •Числовые характеристики статистического распределения выборки
- •Точечные оценки параметров распределения
- •Свойства статистических оценок
- •Доверительные интервалы
- •Доверительный интервал для математического ожидания нормально распределенной генеральной совокупности при известном среднем квадратическом отклонении
- •Доверительный интервал для математического ожидания нормально распределенной генеральной совокупности при неизвестном среднем квадратическом отклонении
- •Понятие о проверке статистических гипотез о законе распределения генеральной совокупности
- •Корреляционная зависимость. Выборочный коэффициент корреляции. Линейная корреляция. Выборочное линейное уравнение регрессии
- •Сборник задач по курсу «Теория вероятностей и математическая статистика»
- •Примерный список вопросов для подготовки к зачету
- •Список литературы (обязательной и дополнительной) Основная литература
- •Дополнительная литература
- •Справочные издания
- •Интернет-ресурсы
- •Электронные издания
- •Словарь терминов
Доверительные интервалы
Пусть по данным выборки { x1, x2, … , xn } с.в. Х объема n , используя некоторую статистику
tn = f (x1, x2, … , xn) ,
получили
статистическую оценку tn
параметра t
всей случайной
величины Х
(т.е. всей генеральной совокупности).
Если статистика обладает хорошими
свойствами (из перечисленных выше), то
мы вправе ожидать, что tn
≈ t.
Но хотелось бы дополнительно понять
степень приближения. Насколько отличается
tn
от t,
т.е. чему равно отклонение |
tn−t|
? Возьмем, например, какое-нибудь маленькое
число δ > 0
(0.1, 0.01
и т.п.) . Можно ли утверждать, что
| tn−t|
< δ,
т.е. истинный параметр
t
содержится в интервале (tn−
δ, tn+
δ) ? Поскольку
оценка tn
является значением соответствующей
случайной
величины Tn
(т.е. зависит от выборки), то статистические
методы дают вероятностный ответ на этот
вопрос, т.е. позволяют определить
вероятность γ, с которой это неравенство
выполняется. Пусть
tn
–полученная статистическая оценка
параметра t
. Интервал вида (tn−
δ, tn+
δ)
называется
интервальной
оценкой параметра t
с доверительной вероятностью (или
надежностью) γ,
если с вероятностью γ этот интервал
«покрывает» этот параметр ( t(tn−
δ, tn+
δ)
), т.е. выполняется: Р(|
Tn−t|<
δ)=
γ. Доверительную вероятность обычно
берут на уровне 0.9, 0.95, 0.99 и т.п. . Число
α=1− γ
называется
уровнем
значимости
интервальной оценки, оно показывает
вероятность того, что параметр t
выйдет за доверительный интервал: Р(|
Tn−t|>
δ)=
α.
Доверительный интервал строится по следующей схеме. Сначала задается требуемый уровень значимости γ, по которому и подбирается число δ из условия, чтобы выполнялось Р(| Tn−t|< δ)= γ.
Конечно, нельзя утверждать, что найденный доверительный интервал обязательно покроет искомый параметр t. Но в этом можно быть уверенными на 95% при γ=0.95 и на 99% при γ=0.99 . Это значит, что если сделать много выборок (в идеале бесконечно много), то в 95% случаев (при γ=0.95) вычисленные доверительные интервалы действительно покроют параметр t.
Доверительный интервал для математического ожидания нормально распределенной генеральной совокупности при известном среднем квадратическом отклонении
Если речь идет, например, об измерении каких-нибудь величин одним прибором, то часто среднее квадратическое отклонение σ (ошибка измерения) бывает известна и не меняется от измерения к измерению.
Пусть с.в. Х распределена нормально с параметрами М(Х)=а и σ(Х)= σ, причем σ известно, а а нет. Требуется построить доверительный интервал для математического ожидания, покрывающий параметр а с заданной надежностью (т.е. доверительной вероятностью) γ . Пусть сделана выборка { x1, x2, … , xn } с.в. Х объема n и по ней вычислено выборочное среднее
.
Как уже говорилось,
полученная выборка есть реализация
системы независимых случайных величин
X1,
X2,
… , Xn
, каждая из которых тоже имеет нормальное
распределение с теми же параметрами а
и σ
. При этом вычисленное выше выборочное
среднее
есть
реализация соответствующей случайной
величины
.
Можно (но не так
просто) доказать, что с.в.
,
определенная этой формулой, тоже
распределена по нормальному закону.
Используя свойства математического
ожидания и дисперсии, легко найти
параметры этого распределения:
.
Для построения
доверительного интервала с заданной
надежностью γ
найдем такое δ,
чтобы выполнялось неравенство
.
Для любой с.в.Х,
распределенной по нормальному закону,
ранее была выведена формула
,
гдеФ(х)
– функция Лапласа. Применяя ее для
нашего случая
с полученными выше выражениями для
математического ожидания и среднего
квадратического отклонения, получим
Поэтому искомое
δ
должно удовлетворять уравнению
. Обозначим черезt
такое число, что
(такое число ищется из таблицы функции
Лапласа). Тогдаδ
должно удовлетворять уравнению
,
откуда
.
Таким образом, мы получили, что
доверительный интервал
покрывает неизвестный
параметр а
с доверительной вероятностью γ
, где
− найденное по выборке выборочное
среднее, а значение параметраt
определяется из равенства
по таблице значений функции Лапласа.
Пример.
Генеральная совокупность некоторого
признака Х
распределена нормально с известным
средним квадратическим отклонением
σ=0.4 .
Для определения среднего значения
признака Х
была сделана выборка объема n=20,
по которой вычислено выборочное среднее
.
Найти доверительный интервал для
математического ожиданияа
признака Х
с надежностью γ=0.99
.
Решение. Для
находим по таблице функции Лапласа
соответствующее значение параметраt=2.58
. Тогда по выписанной выше формуле с
вероятностью γ=0.99
среднее значение а
признака Х
заключено в интервале
.
Пример.
Генеральная совокупность некоторого
признака Х
распределена нормально с известным
средним квадратическим отклонением
σ=3 .
Для определения среднего значения
признака Х
была сделана выборка объема n=36,
по которой вычислено выборочное среднее
.
Найти доверительный интервал для
математического ожиданияа
признака Х
с надежностью γ=0.95
.
Ответ: 3.12<a<5.08 .