
- •Введение
- •Задания
- •Предварительные понятия и определения
- •Выборка
- •Проверка гипотез
- •Точечное оценивание
- •Доверительное оценивание.
- •Вероятностные модели
- •Первичный статистический анализ
- •Задание 1. Выборочные характеристики.
- •Задание 2. Гистограмма выборки.
- •Задание 3. Эмпирическая функция распределения.
- •Проверка гипотезы о типе распределения
- •Задание 4. Критерий согласия хи-квадрат.
- •Проверка гипотезы однородности
- •Задание 5. Одновыборочный критерий Стьюдента.
- •Задание 6. Критерий знаков.
- •Задание 7. Двухвыборочный критерий Стьюдента.
- •Задание 8. Критерий Вилкоксона.
- •Задание 9. Критерий Фишера. Критерий сравнения дисперсий.
- •Задание 10. Критерий однородности хи-квадрат.
- •Интервальные оценки
- •Задание.
- •Задание 11. Построить интервальную оценку для среднего значения нормального распределения.
- •Задание 12.
- •Задание 13. Построить интервальную оценку для вероятности успеха
- •Доказательство корректности метода II.
- •Исследование зависимости между двумя характеристиками
- •Задание 14. Проверить независимость двух характеристик по критерию сопряженности хи-квадрат
- •Задания 15-16. Проверить независимость двух характеристик по критерию Стьюдента. Построить линии регрессии.
-
Интервальные оценки
Теоретические основы.
Пусть
– случайная выборка, распределение
которой F(x)
зависит от некоторого неизвестного
параметра
.
Интервал
с границами
,
зависящими от выборочных данных,
называется
(1-)-доверительным
интервалом
для параметра
,
если
-
.
(*)
Статистика
называется
верхней
(1-)-доверительной
границей
для параметра
,
если
.
Статистика
называется
нижней
(1-)-доверительной
границей
для параметра
,
если
.
Интерпретация.
Смысл
этих определений легко понять, если
вспомнить, что индекс
,
стоящий у знака вероятности
,
указывает на истинное значение
неизвестного параметра. Поэтому формула
(*), например, означает, что с большой
вероятностью доверительный интервал
накроет
истинное значение оцениваемого
параметра. На практике обычно
делается несколько вольный вывод,
что с большой долей вероятности следует
ожидать значение оцениваемого
параметра, принадлежащее интервалу
.
В таком утверждении “скрытно”
присутствует предположение о случайности
изменения параметра
от эксперимента к эксперименту. В
действительности, оцениваемый
параметр не случаен, а имеет некоторое
фиксированное неизвестное значение.
Точность и надежность интервала.
Величина
Q
= (1-)·100%
называется надежностью
интервала
и выбирается обычно в пределах
от 90% до 99% (стандартное значение –
95%). На первый взгляд кажется, что чем
выше значение надежности, тем лучше
будет построенный интервал. Однако
здесь надо учитывать, что чем больше
величина Q,
тем шире получится доверительный
интервал (в пределе при
он будет совпадать с
),
то есть уменьшится его точность. Задача
построения доверительного интервала
с заданной точностью и надежностью
может быть решена только при достаточно
большом объеме выборки.
Двухсторонний интервал через доверительные границы.
Для
построения (1-)-доверительного
интервала
можно построить отдельно верхнюю
и нижнюю
границы с надежностью (1-/2)·100%.
Связь с задачей проверки гипотез.
Пусть
– некое (1-)-доверительное
множество. Тогда критерий, отвергающий
гипотезу, если
полностью попадает в область альтернативы,
будет иметь уровень .
Так, при альтернативе
гипотезу следует отвергать,
если нижняя
граница
.
Если же ошибочно принимать гипотезу,
когда доверительное множество полностью
попадает в область гипотезы
(например, верхняя граница
),
то такой критерий будет иметь вовсе
“неприемлемый” уровень 1-,
вместо ожидаемого уровня .
Обратно,
рассмотрим задачу проверки простой
гипотезы
о параметре
распределения наблюдаемой
случайной величины. Пусть
– критическая область уровня
(область, где гипотеза отвергается).
Тогда множество B(x(n))
тех значений параметра
,
при которых гипотеза
принимается, –
,
образует
(1-)-доверительное
множество. Множество
определяет
-
нижнюю границу, если альтернатива имеет вид
;
-
верхнюю границу, если альтернатива имеет вид
;
-
двухсторонний интервал, для альтернативы вида
.