
- •Вариационные ряды и их характеристики
- •1. Вариационный ряд.
- •Точечное оценивание
- •Состоятельность
- •Несмещенность и асимптотическая несмещенность
- •Сравнение оценок и эффективность
- •Достаточные статистики
- •Доверительные интервалы
- •Проверка статистических гипотез
- •Методика проверки статистических гипотез
- •Альтернативная методика на основе достигаемого уровня значимости
- •Типы критической области
- •Ошибки первого и второго рода
- •Свойства статистических критериев
- •Типы статистических гипотез
- •Типы статистических критериев
- •Критерии согласия
- •Критерии сдвига
- •Критерии нормальности
- •Критерии однородности
- •Критерии симметричности
- •Критерии тренда, стационарности и случайности
Достаточные статистики
Основная статья: Достаточная статистика
Статистика
назвается достаточной для
параметра
,
если условное распределение выборки
при
условии того, что
,
не зависит от параметра
для
всех
.
Важность
понятия достаточной статистики
обуславливается следующим утверждением.
Если
-
достаточная статистика, а
-
несмещенная оценка параметра
,
тогда условное
математическое ожидание
является
также несмещенной оценкой параметра
,
причем ее дисперсия меньше или равна
дисперсии исходной оценки
.
Напомним, что условное математическое ожидание есть случайная величина, являющаяся функцией от . Таким образом, в классе несмещенных оценок достаточно рассматривать только такие, которые являются функциями от достаточной статистики (при условии, что такая существует для данной задачи).
(Несмещенная) эффективная оценка параметра всегда является достаточной статистикой.
Можно
сказать, что достаточная статистика
содержит в себе всю информацию об
оцениваемом параметре, которая содержится
в выборке
.
Доверительные интервалы
Другим типом оценок статистических параметров являются доверительные интервалы.
Доверительный интервал - это случайный интервал, построенный по выборке (верхняя и нижняя границы этого интервала должны быть статистиками), который содержит (накрывает) истинное значение параметра с вероятностью, не меньшей заданного значения.
Доверительные интервалы используются, когда нам нужны надежные границы, в которые попадает значение оцениваемого параметра.
Часто вместе с точечной оценкой параметра строят доверительный интервал, середина которого равна этой оценке. Его ширина является наглядной характеристикой того, насколько точна может быть данная точечная оценка.
Иногда бывает наоборот: естественным образом строится некоторый доверительный интервал, а в качестве точечной оценки параметра рассматривают его середину.
Проверка статистических гипотез
(Перенаправлено с Статистический тест)
|
Проверка статистической гипотезы (testing statistical hypotheses) — это процесс принятия решения о том, противоречит ли рассматриваемая статистическая гипотеза наблюдаемой выборке данных.
Статистический тест или статистический критерий — строгое математическое правило, по которому принимается или отвергается статистическая гипотеза.
Методика проверки статистических гипотез
Пусть
задана случайная выборка
—
последовательность
объектов
из множества
.
Предполагается, что на множестве
существует
некоторая неизвестная вероятностная
мера
.
Методика состоит в следующем.
Формулируется нулевая гипотеза
о распределении вероятностей на множестве . Гипотеза формулируется исходя из требований прикладной задачи. Чаще всего рассматриваются две гипотезы — основная или нулевая и альтернативная
. Иногда альтернатива не формулируется в явном виде; тогда предполагается, что означает «не ». Иногда рассматривается сразу несколько альтернатив. В математической статистике хорошо изучено несколько десятков «наиболее часто встречающихся» типов гипотез, и известны ещё сотни специальных вариантов и разновидностей. Примеры приводятся ниже.
Задаётся некоторая статистика (функция выборки)
, для которой в условиях справедливости гипотезы выводится функция распределения
и/или плотность распределения
. Вопрос о том, какую статистику надо взять для проверки той или иной гипотезы, часто не имеет однозначного ответа. Есть целый ряд требований, которым должна удовлетворять «хорошая» статистика
. Вывод функции распределения при заданных и является строгой математической задачей, которая решается методами теории вероятностей; в справочниках приводятся готовые формулы для ; в статистических пакетах имеются готовые вычислительные процедуры.
Фиксируется уровень значимости — допустимая для данной задачи вероятность ошибки первого рода, то есть того, что гипотеза на самом деле верна, но будет отвергнута процедурой проверки. Это должно быть достаточно малое число
. На практике часто полагают
.
На множестве допустимых значений статистики выделяется критическое множество
наименее вероятных значений статистики , такое, что
. Вычисление границ критического множества как функции от уровня значимости
является строгой математической задачей, которая в большинстве практических случаев имеет готовое простое решение.
Собственно статистический тест (статистический критерий) заключается в проверке условия:
если
, то делается вывод «данные противоречат нулевой гипотезе при уровне значимости ». Гипотеза отвергается.
если
, то делается вывод «данные не противоречат нулевой гипотезе при уровне значимости ». Гипотеза принимается.
Итак, статистический критерий определяется статистикой и критическим множеством , которое зависит от уровня значимости .
Замечание. Если данные не противоречат нулевой гипотезе, это ещё не значит, что гипотеза верна. Тому есть две причины.
По мере увеличения длины выборки нулевая гипотеза может сначала приниматься, но потом выявятся более тонкие несоответствия данных гипотезе, и она будет отвергнута. То есть многое зависит от объёма данных; если данных не хватает, можно принять даже самую неправдоподобную гипотезу.
Выбранная статистика может отражать не всю информацию, содержащуюся в гипотезе . В таком случае увеличивается вероятность ошибки второго рода — нулевая гипотеза может быть принята, хотя на самом деле она не верна. Допустим, например, что = «распределение нормально»;
= «коэффициент асимметрии»; тогда выборка с любым симметричным распределением будет признана нормальной. Чтобы избегать таких ошибок, следует пользоваться более мощными критериями.