- •1 Основные понятия
- •2.2.2 Проверка гипотезы о значении генеральной средней при неизвестной дисперсии
- •2.2.3 Проверка гипотезы о значении дисперсии генеральной совокупности
- •2.2.6 Проверка гипотезы относительно доли признака (о вероятности "р" биномиального распределения)
- •2.3 Критерии согласия
- •2.3.1 Критерий согласия х2 Пирсона
- •2.3.2 Критерий Колмогорова-Смирнова
- •2.3.3 Критерий w2 (критерий Мизеса)
Статистическая проверка гипотез
1 Основные понятия
Данные выборочных обследований являются основой для принятия одного из нескольких альтернативных решений о свойствах и параметрах генеральной совокупности. При этом любое суждение о генеральной совокупности, сделанное на основе выборочных наблюдений, не может рассматриваться как достоверное утверждение, а лишь как предположительное в силу неполноты информации на основе выборки.
Определение 1 Предположение о свойствах и параметрах генеральной совокупности будем называть статистической гипотезой.
Определение 2 Подлежащую проверке гипотезу будем называть основной или нулевой и обозначать Н0.
Гипотезы разделяют на простые и сложные.
Определение 3 Гипотеза называется простой, если она однозначно характеризует параметр или свойство генеральной совокупности (Н0: ; или Н0: - генеральная совокупность распределена по нормальному закону). В противном случае гипотеза называется сложной.
Определение 4 Конкурирующей (альтернативной) гипотезой (Н1) будем называть гипотезу противоположную нулевой.
Проверка статистической гипотезы заключается в том, чтобы установить не противоречат ли данные выборочных наблюдений выдвинутой гипотезе. С этой целью производится количественная оценка степени достоверности предлагаемой гипотезы, которая осуществляется с помощью специально построенного статистического критерия.
Определение 5 Статистическим критерием называют однозначно определенное правило, устанавливающее условия, при которых про проверяемую гипотезу (Н0) можно либо утверждать, что данные не согласуются с ней (противоречат ей) и тогда гипотеза Н0 отклоняется, либо утверждать, что данные с ней согласуются и гипотеза Н0 не отклоняется (не противоречит выборочным данным).
Основу критерия составляет специально построенная характеристика (статистика) , точное или приближенное распределение которой известно. Все множество возможных значений статистики будем разбивать на два непересекающихся подмножества (области): критическую область Ω0 (область отклонения гипотезы) и область принятия решений (гипотезы).
На основе введенных понятий можно сформулировать основной принцип проверки гипотезы Н0: если наблюденные значения статистики критерия попадают в критическую область, то гипотезу отвергают, а если в область принятия решения, то гипотезу не отвергают. В общем случае статистика - многомерная случайная величина и соответствующие области, упомянутые выше, являются областями многомерными, но мы ограничимся пока, скалярным критерием. В этом случае критическая область и область принятия решения – интервалы или их объединения. Точки, разделяющие критическую область и область принятия решения, будем называть критическими. Нам следует научиться строить критические точки и критическую область. В основе такого построения положен принцип практической невозможности маловероятных событий: зададимся достаточно малой величиной " ", называемой уровнем значимости критерия и определим критическую область (обозначим Ω0), как множество таких значений , вероятность попадания которых в Ω0 равнялась бы " ", то есть:
(1)
Если полученное, по данным выборки, значение , то это служит основанием для отклонения гипотезы Н0. Если же , то делаем вывод, что данные выборки не противоречат гипотезе Н0 и она не отклоняется. Как бы не была мала вероятность " ", событие является только маловероятным, но не является невозможным, поэтому не исключено, что при верной Н0 значение может оказаться в критической области и т.д. Рассмотрим ситуации:
гипотеза Н0 верна и ее не отвергают согласно критерию;
гипотеза Н0 не верна и ее отвергают согласно критерию;
гипотеза Н0 верна, но ее отвергают согласно критерию (говорят по ошибке первого рода);
гипотеза Н0 не верна, но ее принимают согласно критерию (говорят об ошибке второго рода).
Из определения ошибки первого рода и определения критической области следует, что вероятность совершить ошибку первого рода равна уровню значимости "α", что иногда и берут за определение уровня значимости. Очевидно, что с уменьшением "α" уменьшается критическая область и, стало быть, менее вероятным представляется допустить ошибку первого рода. В частности, при гипотеза Н0 всегда принимается, т.к. вся область допустимых значений - область принятия решения (гипотезы). Однако, с уменьшением "α" и, стало быть, критической области увеличивается вероятность принятия неверной гипотезы, т.к. увеличивается вероятность попадания в область принятия решения. Обозначим "β" вероятность допустить ошибку второго рода: принять Н0, когда она не верна. Важной характеристикой статистического критерия является так называемая мощность критерия.
Определение 6 Мощностью статистического критерия будем называть вероятность того, что нулевая гипотеза (Н0) будет отвергнута, если верна конкурирующая гипотеза (Н1), то есть вероятность не совершить ошибку второго рода.
Введенные понятия позволяют сформулировать естественные требования к статистическому критерию, используемому для построения критической области и области принятия решения. Пусть - вероятность попадания статистики критерия в критическую область, если верна гипотеза Н0 - вероятность совершить ошибку первого рода, а - вероятность не совершить ошибку второго рода, тогда естественно требовать:
(2)
из чего следует, что критическая область выбирается так, чтобы вероятность попадания в нее была бы минимальной, если верна нулевая гипотеза Н0, и максимальной, если верна альтернативная гипотеза.
В зависимости от возможных значений статистики критерия и от вида конкурирующей гипотезы Н1 различают правостороннюю, левостороннюю и двустороннюю критические области.
Критические точки (точки, разделяющие критическую область и область принятия решения) при заданном уровне значимости "α" находят из уравнений:
для правосторонней критической области (см. рис. 2.1)
; (3)
θкр
Рисунок 1 График плотности распределения статистики и выделение правосторонней критической области (II) и области принятия решения (I).
Интервал для левосторонней критической области (см. рис. 2.2)
; (4)
Рисунок 2 График плотности распределения статистики и ведения левосторонней критической области (II) и области принятия решения (I).
Интервал для двусторонней критической области (см. рис. 2.1)
где (5)
fθ*(u)
u
θкр1
Рисунок 3 График плотности распределения статистики и областей: критической – II; принятия решений – I.
Определив в каждом случае границы критической области, проверяем гипотезу Н0, предварительно вычислив по выборочным данным . Если попадает в критическую область, то с вероятностью α совершить ошибку первого рода гипотезу Н0 отвергают, иначе делают вывод, что гипотеза не противоречит выборочным данным.
В рассмотренной общей логической схеме проверки гипотезы следует лишь уточнить;
критическая статистика строится во многом исходя из тех же соображений, что и при построении статистик для нахождения доверительного интервала, то есть ее закон распределения не должен (по возможности) зависеть от параметров распределения генеральной совокупности
она должна определять меру расхождения выборочных данных с высказанной (проверяемой) гипотезой Н0.
Построение статистического критерия производят по-разному, в частности используя принцип отношения правдоподобия. Правдоподобность имеющихся наблюдений х1,…,хn (в отношении проверяемой и альтернативной гипотез) дает нам сопоставление соответствующих функций правдоподобия, либо их отношения
,
либо
,
где и - значения функции правдоподобия наблюдений х1,…,хn, вычисленные в предположении справедливости соответственно гипотез Н1 и Н0. Очевидно, чем правдоподобнее наблюдения в условиях гипотезы Н0, тем больше и тем меньше .
P.S. Здесь и - векторы параметров закона распределения генеральной совокупности в условиях разных гипотез.
Если - плотность распределения статистики при условиях справедливости Н0, то построение критерия проверки Н0 с заданным уровнем значимости α сводится к нахождению 100α%-ой точки распределения и сравнения с .
Ниже рассмотрены задачи на проверку гипотез, в которых критические статистики получены иным способом, но могут быть построены на основе принципа отношения правдоподобия.
2. Проверка гипотез о параметрах нормально распределенных генеральных совокупностей
2.2.1 Проверка гипотезы о значении генеральной средней при известной дисперсии
Пусть х1,…,хn выборка объема "n" из генеральной совокупности распределенной нормально с неизвестным математическом ожиданием "а" и известной дисперсией . Пусть - выборочная средняя, являющаяся оценкой математического ожидания (генеральной средней). Пусть а0 и а1 – предполагаемые значения генеральной средней. Выдвигаем гипотезу Н0: а=а0 и альтернативную ей Н1: а=а1. Воспользуемся статистикой
,
которая при условии справедливости Н0 .
Если а1>а0, то строим правостороннюю критическую область (находим tкр)
, , , ;
где - интегральная функция Лапласа. Сравнив с , примем гипотезу Н0 при и отвергнем в противном случае.
Если а1<а0,то границу левосторонней критической области находим:
, , ,
;
при Н0 не отвергаем.
Если а1 не задается и альтернативная гипотеза Н1 заключается в следующем – Н1: , то строится двусторонняя критическая область
, , ;
, , ;
при гипотеза Н0 не отвергается.