
- •Статистическое оценивание параметров распределения и построение
- •Основные понятия, используемые при оценивании.
- •[Править] Точечное оценивание
- •[Править] Состоятельность, несмещенность и эффективность оценок.
- •[Править] Наилучшие асимптотически нормальные оценки.
- •[Править] Доверительное оценивание.
- •[Править] Доверительное оценивание для дискретных распределений.
- •[Править] Основные понятия, используемые при проверке гипотез.
- •[Править] Параметрические и непараметрические гипотезы.
- •Доверительные интервалы
- •8.1 Понятие доверительного интервала
- •8.2 Вероятностные распределения, связанные с нормальным
- •Распределение Стьюдента
- •8.3 Теорема Фишера для нормальных выборок
- •8.4 Доверительное оценивание параметров нормальных выборок
- •Доверительный интервал для среднего при известной дисперсии
- •Доверительный интервал для дисперсии при известном среднем
- •Доверительный интервал для дисперсии при неизвестном среднем
- •Доверительный интервал для среднего при неизвестной дисперсии
- •Лабораторная работа №12. Основы теории оценивания
- •Лабораторная работа №13. Изучение методов оценки параметров распределений
[Править] Параметрические и непараметрические гипотезы.
Статистические
гипотезы бывают параметрические и
непараметрические. Предположение,
которое касается неизвестного значения
параметра распределения, входящего в
некоторое параметрическое семейство
распределений, называется параметрической
гипотезой (напомним, что параметр может
быть и многомерным). Предположение, при
котором вид распределения неизвестен
(то есть не предполагается, что оно
входит в некоторое параметрическое
семейство распределений), называется
непараметрической гипотезой. Таким
образом, если распределение F(x)
результатов наблюдений в выборке
согласно принятой вероятностной модели
входит в некоторое параметрическое
семейство,
то естьF(x) =F(x;θ0)
при некотором θ0Θ, то рассматриваемая
гипотеза — параметрическая, в противном
случае — непараметрическая.
Если и H0иH1— параметрические гипотезы, то задача проверки статистической гипотезы — параметрическая. Если хотя бы одна из гипотезH0иH1— непараметрическая, то задача проверки статистической гипотезы — непараметрическая. Другими словами, если вероятностная модель ситуации — параметрическая, то есть полностью описывается в терминах того или иного параметрического семейства распределений вероятностей, то и задача проверки статистической гипотезы — параметрическая. Если же вероятностная модель ситуации — непараметрическая, то есть ее нельзя полностью описать в терминах какого-либо параметрического семейства распределений вероятностей, то и задача проверки статистической гипотезы — непараметрическая. В примерах 11-13, 16, 17, 20-22 даны постановки параметрических задач проверки гипотез, а в примерах 14, 15, 18, 19, 23-25 — непараметрических. Непараметрические задачи делятся на два класса: в одном из них речь идет о проверке утверждений, касающихся функций распределения (примеры 14, 15, 18, 19, 25), во втором — о проверке утверждений, касающихся характеристик распределений (примеры 23, 24).
Статистическая гипотеза называется простой, если она однозначно задает распределение результатов наблюдений, вошедших в выборку. В противном случае статистическая гипотеза называется сложной. Гипотеза 2 из приведенного выше списка, нулевые гипотезы в примерах 11, 12, 14, 20, нулевая и альтернативная гипотезы в примере 21 — простые, все остальные упомянутые выше гипотезы — сложные.
Доверительные интервалы
Оценки параметров позволяют по выборке вычислить некоторые значения, которые ``приближают'' неизвестные параметры. Существует другой подход к тому, чтобы извлечь информацию о неизвестных параметрах. Он состоит в том, чтобы, основываясь на данных наблюдений, определить границы, в которых с заданной степенью достоверности лежит неизвестный параметр.
8.1 Понятие доверительного интервала
Будем считать, что
независимая выборка
взята
из распределения, зависящего от скалярного
параметра
.
Будем обозначать через
распределение
вероятностей, соответствующее значению
неизвестного
параметра.
Определение
-доверительным
интерваломназывается интервал вида
где
такой,
что
Число
называютдоверительной
вероятностью.
Другими словами,
доверительный интервал обладает тем
свойством, что, во-первых, его границы
вычисляются исключительно по выборке
(и, следовательно, не зависят от
неизвестного параметра), и, во-вторых,
он накрывает неизвестный параметр с
вероятностью .
Значение доверительной
вероятности
выбирается
заранее, этот выбор определяется
конкретными практическими приложениями.
Смысл величины
--
вероятность допустимой ошибки. Часто
берут значения
и т.п.
Ниже мы приводим один изметодов
построениядоверительных интервалов.
Он состоит из трех этапов.
Выбираем функцию
, зависящую от выборки и от неизвестного параметра, такую, что ее функция распределения
не зависит
от неизвестного параметра
.
Выбираем два числа
и
таким образом, чтобы
. Подбираем
и
, удовлетворяющие условиям
(41)
Таким образом,
(42)
причем
и
не зависят от
.
Решим двойное неравенство
относительно
. В том случае, когда его решением является интервал, обозначим его левый и правый концы через
и
соответственно. Естественно, они зависят от выборки:
,
. В силу (42)
Следовательно,
--
искомый
-доверительный
интервал.
Замечание 8.1
Описанная процедура,
разумеется, не является универсальной.
Во-первых, вопрос о выборе функции решается в каждом конкретном случае и
по этому поводу нет общих рекомендаций.
Во-вторых, совершенно не гарантировано,
что решением неравенства в п. 3 будет
интервал конечной длины. Вместе с тем,
во многих важных случаях изложенный
выше метод приводит к хорошим доверительным
интервалам. Например, оправдано применение
такого метода в случае, когда при каждойфиксированнойвыборке
функция
является
строго монотонной и непрерывной по
переменной
.
Замечание 8.2
В силу неоднозначности
выбора функции
и
чисел
и
,
можно заключить, что
-доверительный
интервалнеединственен.
Пример 8.1
Пусть
--
независимая выборка из равномерного
распределения в отрезке
с
неизвестным параметром
:
Пусть задана
доверительная вероятность .
Построим доверительный интервал для
.
Рассмотрим функцию
. Вычислим ее функцию распределения:
Таким образом,
и, следовательно, не зависит от
.
Зафиксируем
так, чтобы
. Тогда
и
удовлетворяют (41).
Решая неравенство
, получаем
-доверительный интервал для
:
(43)
Очевидно, что
следует отдавать предпочтение тем
-доверительным
интервалам, у которых длина короче.
Упражнение 8.1
Показать, что при
математическое
ожидание длины доверительного
интервала (43)
стремится к нулю.