
- •Глава 2. Основы математической статистики
- •2.1 Случайная выборка и ее описание
- •2.2. Статистическое оценивание
- •2.2.1. Точечное статистическое оценивание
- •2.2.2 Интервальное статистическое оценивание
- •2.2.2.1 Доверительный интервал для математического ожидания нормально распределенной случайной величины с известной дисперсией
- •2.2.2.2 Доверительный интервал для математического ожидания нормально распределенной случайной величины с неизвестной дисперсией
- •2.2.2.3 Доверительный интервал для неизвестной дисперсии нормально распределенной случайной величины (при неизвестном математическом ожидании)
- •2.2.2.4 Доверительный интервал для неизвестного параметра p биномиального распределения
- •2.2.2.5 Доверительный интервал для неизвестного параметра пуассоновского распределения
- •2.2.2.6 Приближенный доверительный интервал для неизвестного коэффициента корреляции двумерного нормального распределения
- •2.3. Статистическая проверка гипотез
- •2.3.1. Логика проверки статистических гипотез
- •2.3.2. Проверка гипотез о математических ожиданиях
- •2.3.2.1 Проверка гипотезы о равенстве заданному числу математического ожидания нормально распределенной случайной величины с известной дисперсией
- •2.3.2.2 Проверка гипотезы о равенстве заданному числу математического ожидания нормально распределенной случайной величины с неизвестной дисперсией (одновыборочный t-критерий)
- •2.3.2.3 Проверка гипотезы о равенстве математических ожиданий двух нормально распределенных случайных величин (двухвыборочный t-критерий)
- •2.3.3 Проверка гипотез о дисперсиях
- •2.3.3.1 Проверка гипотезы о равенстве заданному числу дисперсии нормально распределенной случайной величины (одновыборочный 2-критерий)
- •2.3.3.2 Проверка гипотезы о равенстве дисперсий двух независимых нормально распределенных случайных величин (двухвыборочный f-критерий)
- •2.3.4 Сравнение параметров двух биномиальных распределений
- •2.3.5 Сравнение параметров двух пуассоновских распределений
- •2.3.6 Проверка гипотезы о равенстве нулю коэффициента корреляции
- •2.3.7 Критерии согласия
- •2.3.8 Непараметрические критерии
- •2.3.8.1 Одновыборочные непараметрические критерии
- •2.3.8.2 Проверка гипотезы об отсутствии сдвига
- •2.3.8.3 Критерии однородности
- •2.3.8.4 Проверка гипотезы о независимости
2.3. Статистическая проверка гипотез
Пусть
- случайная
выборка значений случайной величины
,
имеющей некоторое полностью или частично
неизвестное распределение
.
В предыдущем разделе рассматривались
методы получения оценок параметров или
характеристик этого неизвестного
распределения. Однако часто нас интересуют
не столько конкретные количественные
оценки, сколько правильность или
ошибочность некоторых утверждений,
относящихся к распределению наблюдаемой
случайной величины. Например, является
ли это распределение нормальным или
нет? Или, равно математическое ожидание
заданному значению или нет? Если кроме
выборки
имеется
выборка
значений
другой случайной величины
,
то можно поставить вопрос о том, равны
или нет математические ожидания случайных
величин
и
?
Если имеется выборка
двумерной случайной величины
,
то может возникнуть вопрос о том, равен
нулю или нет коэффициент корреляции
между
и
?
2.3.1. Логика проверки статистических гипотез
Решению
задач проверки гипотез о генеральном
распределении по выборке из этого
распределения посвящен специальный
раздел математической статистики -
проверка
статистических гипотез.
Логика проверки гипотез в математической
статистике (она напоминает логику
доказательства от противного) состоит
в следующем. Вначале предполагается,
что проверяемая гипотеза (ее принято
называть нулевой
гипотезой и
обозначать
)
верна. В предположении, что
верна,
ищется распределение вероятностей
некоторой функции
от значений выборки, называемой
статистикой
критерия
(правило проверки гипотезы принято
называть критерием),
и в области значений этой статистики
выделяется некоторая область
,
называемая критической
областью,
такая, что вероятность
попадания
выборочного значения статистики
в
эту область не превосходит заданного
малого значения
,
называемого уровнем
значимости критерия (обычно
полагают
равным
0,05
или 0,01).
Если для данной конкретной выборки
попадает
в критическую область
,
то гипотеза
отвергается
(говорят – «отвергается на уровне
значимости
»),
поскольку вероятность этого события,
если в
действительности верна
,
мала. Если же
не попадает в критическую область
,
то говорят, что «гипотеза
не
отвергается
на уровне значимости
»
(или – «полученные данные не дают
оснований отвергнуть гипотезу
на уровне значимости
»).
Очевидно,
однако, что можно разными способами
задать статистику критерия
,
а для заданной статистики можно разными
способами выбрать критическую область
,
удовлетворяющую условию
.
Поэтому следует выбирать
и
в некотором смысле наилучшими из
возможных, а именно такими, чтобы
полученный критерий был наиболее
мощным.
Для
определения понятия мощности
критерия
введем понятие альтернативной
гипотезы
,
т.е. гипотезы, которая выполняется, если
не выполняется нулевая гипотеза
.
Тогда в терминах правильности или
ошибочности принятия
и
можно
указать четыре потенциально возможных
результата применения критерия к
выборке, как следующие
|
Принята гипотеза |
||
|
|
||
Верна гипотеза |
|
|
- вероятность ошибочно принять , когда верна (ошибка 1-го рода, уровень значимости) |
|
- вероятность ошибочно принять , когда верна (ошибка 2-го рода) |
- вероятность правильно принять , когда верна (мощность критерия) |
Как мы видим, мощность критерия - это вероятность принятия при применении данного критерия альтернативной гипотезы при условии, что она верна. Очевидно, что при фиксированной ошибке 1-го рода (ее мы задаем сами, и она не зависит от свойств критерия) критерий будет тем лучше, чем больше его мощность (т.е. чем меньше ошибка 2-го рода).
Проиллюстрируем основные понятия рассмотренной методологии на простом примере проверки гипотезы о равенстве математического ожидания нормально распределенной случайной величины с известной дисперсией заданному числу (с точки зрения практического применения этот пример несколько искусственен, поскольку дисперсия наблюдаемой случайной величины обычно неизвестна).