- •Проверка статистических гипотез
- •Статистические гипотезы
- •1. Простые и сложные гипотезы и их проверка
- •2. Критерий согласия Пирсона
- •Поведение , когда гипотезаверна.
- •Поведение , когда гипотезаневерна.
- •Критерий проверки.
- •Границы применимости критерия на практике.
- •3. Критерий согласия для сложных гипотез
- •4. О критериях согласия Колмогорова и Смирнова
- •5. Проверка нормальности при помощи вероятностной бумаги
- •Статистические критерии.
- •[Править] Уровень значимости и мощность.
- •[Править] Состоятельность и несмещенность критериев.
- •[Править] Некоторые типовые задачи прикладной статистики [править] Статистические данные и прикладная статистика
- •[Править] Статистический анализ точности и стабильности технологических процессов и качества продукции
- •[Править] Задачи одномерной статистики (статистики случайных величин)
- •[Править] Непараметрическое оценивание математического ожидания.
- •[Править] Непараметрическое оценивание функции распределения.
- •[Править] Таблица 1
- •[Править] Проблема исключения промахов.
- •[Править] Многомерный статистический анализ
- •[Править] Корреляция и регрессия.
- •[Править] Дисперсионный анализ.
- •[Править] Методы классификации.
- •[Править] Дискриминантный анализ.
- •[Править] Кластер-анализ.
- •[Править] Задачи группировки.
- •[Править] Снижение размерности.
- •[Править] Статистика случайных процессов и временных рядов
- •[Править] Статистика объектов нечисловой природы
- •Лабораторная работа №14. Изучение критериев Колмогорова и омега-квадрат
- •Лабораторная работа №15. Изучение критерия хи-квадрат Пирсона
[Править] Непараметрическое оценивание математического ожидания.
В непараметрической постановке оценивают либо характеристики случайной величины (математическое ожидание, дисперсию, коэффициент вариации), либо ее функцию распределения, плотность и т. п. Так, в силу закона больших чисел выборочное среднее арифметическое является состоятельной оценкой математического ожиданияM(X) (при любой функции распределенияF(x) результатов наблюдений, для которой математическое ожидание существует). С помощью центральной предельной теоремы определяют асимптотические доверительные границы
.
где γ — доверительная вероятность, — квантиль порядкастандартного нормального распределенияN(0;1) с нулевым математическим ожиданием и единичной дисперсией,— выборочное среднее арифметическое,s— выборочное среднее квадратическое отклонение. Термин «асимптотические доверительные границы» означает, что вероятности
,
стремятся к ,и γ соответственно при, но, вообще говоря, не равны этим значениям при конечныхn. Практически асимптотические доверительные границы дают достаточную точность приnпорядка 10.
[Править] Непараметрическое оценивание функции распределения.
Второй пример непараметрического оценивания — оценивание функции распределения. По теореме Гливенко эмпирическая функция распределения Fn(x) является состоятельной оценкой функции распределенияF(x). ЕслиF(x) — непрерывная функция, то на основе теоремы Колмогорова доверительные границы для функции распределенияF(x) задают в виде
,
где k(γ,n) — квантиль порядка γ распределения статистики Колмогорова при объеме выборкиn(напомним, что распределение этой статистики не зависит отF(x)).
Правила определения оценок и доверительных границ в параметрическом случае строятся на основе параметрического семейства распределений F(x;θ). При обработке реальных данных возникает вопрос — соответствуют ли эти данные принятой вероятностной модели? Т. е. статистической гипотезе о том, что результаты наблюдений имеют функцию распределения из семействапри некотором θ = θ0Такие гипотезы называют гипотезами согласия, а критерии их проверки — критериями согласия.
Если истинное значение параметра θ = θ0известно, функция распределенияF(x;θ0) непрерывна, то для проверки гипотезы согласия часто применяют критерий Колмогорова, основанный на статистике
,
где Fn(x) — эмпирическая функция распределения.
Если истинное значение параметра θ0неизвестно, например, при проверке гипотезы о нормальности распределения результатов наблюдения (то есть при проверке принадлежности этого распределения к семейству нормальных распределений), то иногда используют статистику
,
Она отличается от статистики Колмогорова Dnтем, что вместо истинного значения параметра θ0подставлена его оценка θ*.
Распределение статистики Dn(θ*) сильно отличается от распределения статистикиDn. В качестве примера рассмотрим проверку нормальности, когда, а. Для этого случая квантили распределений статистикDnиDn(θ*) приведены в табл. 1 (см., например,[18]). Таким образом, квантили отличаются примерно в 1,5 раза.
[Править] Таблица 1
Квантили статистик Dn и Dn(θ * ) при проверке нормальности | |||||
p |
0,85 |
0,90 |
0,95 |
0,975 |
0,99 |
Квантили порядка p для Dn |
1,138 |
1,224 |
1,358 |
1,480 |
1,626 |
Квантили порядка p для Dn(θ * ) |
0,775 |
0,819 |
0,895 |
0,955 |
1,035 |