
- •Лабораторная работа № 4. Проверка статистических гипотез Понятие статистической гипотезы
- •Гипотеза о среднем значении нормального распределения при известном σ
- •Гипотеза о среднем значении нормального распределения при неизвестном σ
- •Гипотеза о дисперсии нормального распределения
- •Гипотеза о равенстве двух средних значений
- •Гипотеза о равенстве двух дисперсий
- •Примеры решения задач
- •По формуле вычислим значение статистики
- •По формуле вычислим значение статистики
- •Значение статистики
- •Значение статистики
- •Варианты заданий
Лабораторная работа № 4. Проверка статистических гипотез Понятие статистической гипотезы
Статистической гипотезой называют любое утверждение о виде или свойствах распределения наблюдаемых в эксперименте случайных величин. Например, случайная величина Х имеет распределение Пуассона, случайная величина с нормальным распределением имеет среднее значение μ=5 или μ≠5 и т. д. Статистические гипотезы проверяются статистическими методами.
Гипотезы о неизвестном параметре θ распределения бывают простые и сложные; простая гипотеза утверждает, что параметр θ имеет одно конкретное значение (θ=θ0), а сложная гипотеза утверждает, что параметр θ имеет значение из совокупности значений (θ < θ 0, θ > θ 0, θ ≠ θ 0).
Проверяемую гипотезу называют основной и обозначают Н0. Обычно вырабатывают еще и альтернативную гипотезу Н1, отрицающую или исключающую основную гипотезу Н0. Таким образом, в результате проверки можно принимать только одну из гипотез Н0 или Н1 отвергая в это же время другую.
Гипотезу проверяют на основании выборки, полученной из генеральной совокупности. Из-за случайности выборки в результате проверки могут возникать ошибки и приниматься неправильные решения. В принципе возможны ошибки первого и второго рода. Ошибка первого рода имеет место тогда, когда отвергается правильная гипотеза Н0. При ошибке второго рода принимается неправильная гипотеза H0.
Таким образом, по одним выборкам принимается правильное решение, а по другим – неправильное. Решение принимается по значению некоторой функции выборки, называемой статистикой или статистической характеристикой. Множество значений этой статистики можно разделить на два непересекающихся подмножества:
подмножество значений статистики, при которых гипотеза Н0 принимается (не отклоняется), называют областью принятия гипотезы (допустимой областью);
подмножество значений статистики, при которых гипотеза Н0 отвергается (отклоняется) и принимается гипотеза Н1, называют критической областью.
При проверке гипотез разумно уменьшить вероятности принятия неправильных решений. Допустимая вероятность ошибки первого рода обозначается через α и называется уровнем значимости. Значение α обычно мало. Но уменьшение вероятности ошибки первого рода обычно вызывает увеличение вероятности ошибки второго рода (β).
Статистика выбирается так, чтобы вероятности α и β были бы минимальными. Проверяемая гипотеза Н0 в настоящем пособии предполагается всегда простой, так что распределение статистики при правильной гипотезе Н0 известно. Методы выбора наилучшей статистики здесь не рассматриваются.
Для определения критической области статистики используют уровень значимости α и учитывают вид альтернативной гипотезы Н1.
Основная гипотеза Н0 о значении неизвестного параметра распределения выглядит так:
Н0:θ=θ0.
Альтернативная гипотеза Н1 может при этом иметь следующий вид:
Н1:θ<θ0, H1:θ>θ0 или Н1:θ≠θ0.
Соответственно можно получить левостороннюю, правостороннюю или двустороннюю критические области (рис. 1). Граничные точки критических областей определяют по таблицам распределения статистики.
а) б) в)
Рис. 1. Критические области:
а – левосторонняя; б – правосторонняя; в - двусторонняя
Проверка статистической гипотезы состоит из следующих этапов:
определение гипотез Н0 и Н1;
выбор статистики и задание уровня значимости α;
определение по таблицам, по уровню значимости α и по альтернативной гипотезе Н1 критической области;
вычисление по выборке значения статистики;
сравнение значения статистики с критической областью;
принятие решения: если значение статистики не входит в критическую область, то принимается гипотеза Н0 и отвергается гипотеза Н1, а если входит в критическую область, то отвергается гипотеза Н0 и принимается гипотеза Н1.
Иногда целесообразно перед определением
альтернативной гипотезы Н1
выполнить этап 4), где для получения
значения статистики нужно вычислить
несмещенные оценки параметров генеральной
совокупности. Например, если проверяется
гипотеза Н0:
μ≠5 и несмещенная оценка среднего
значения
,
то имеют смысл только следующие
альтернативные гипотезы H1:
μ >5 или H1:
μ =5.
Результаты проверки статистической гипотезы нужно интерпретировать так: если приняли гипотезу Н1, то можно считать ее доказанной, а если приняли гипотезу Н0, то признали, что гипотеза Н0 не противоречит результатам наблюдений. Однако этим свойством наряду с Н0 могут обладать и другие гипотезы. Например, если мы принимаем гипотезу H0: μ =5, то может случиться, что по данной выборке можно принять и другие гипотезы, например, H0: μ =5,5 или H0: μ =4 и т.д. Вопрос о том, как найти среди них наилучшую гипотезу, в данном пособии не рассматривается. Следует помнить, что, принимая гипотезу Н0, следует проводить еще дополнительные исследования.