Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лабораторная работа4.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
1.83 Mб
Скачать

Лабораторная работа № 4. Проверка статистических гипотез Понятие статистической гипотезы

Статистической гипотезой называют любое утверждение о виде или свойствах распределения наблюдаемых в эксперименте случайных величин. Например, случайная величина Х имеет распределение Пуассона, случайная величина с нормальным распределением имеет среднее значение μ=5 или μ≠5 и т. д. Статистические гипотезы проверяются статистическими методами.

Гипотезы о неизвестном параметре θ распределения бывают простые и сложные; простая гипотеза утверждает, что параметр θ имеет одно конкретное значение (θ=θ0), а сложная гипотеза утверждает, что параметр θ имеет значение из совокупности значений (θ < θ 0, θ > θ 0, θ ≠ θ 0).

Проверяемую гипотезу называют основной и обозначают Н0. Обычно вырабатывают еще и альтернативную гипотезу Н1, отрицающую или исключающую основную гипотезу Н0. Таким образом, в результате проверки можно принимать только одну из гипотез Н0 или Н1 отвергая в это же время другую.

Гипотезу проверяют на основании выборки, полученной из генеральной совокупности. Из-за случайности выборки в результате проверки могут возникать ошибки и приниматься неправильные решения. В принципе возможны ошибки первого и второго рода. Ошибка первого рода имеет место тогда, когда отвергается правильная гипотеза Н0. При ошибке второго рода принимается неправильная гипотеза H0.

Таким образом, по одним выборкам принимается правильное решение, а по другим – неправильное. Решение принимается по значению некоторой функции выборки, называемой статистикой или статистической характеристикой. Множество значений этой статистики можно разделить на два непересекающихся подмножества:

  • подмножество значений статистики, при которых гипотеза Н0 принимается (не отклоняется), называют областью принятия гипотезы (допустимой областью);

  • подмножество значений статистики, при которых гипотеза Н0 отвергается (отклоняется) и принимается гипотеза Н1, называют критической областью.

При проверке гипотез разумно уменьшить вероятности принятия неправильных решений. Допустимая вероятность ошибки первого рода обозначается через α и называется уровнем значимости. Значение α обычно мало. Но уменьшение вероятности ошибки первого рода обычно вызывает увеличение вероятности ошибки второго рода (β).

Статистика выбирается так, чтобы вероятности α и β были бы минимальными. Проверяемая гипотеза Н0 в настоящем пособии предполагается всегда простой, так что распределение статистики при правильной гипотезе Н0 известно. Методы выбора наилучшей статистики здесь не рассматриваются.

Для определения критической области статистики используют уровень значимости α и учитывают вид альтернативной гипотезы Н1.

Основная гипотеза Н0 о значении неизвестного параметра распределения выглядит так:

Н0:θ=θ0.

Альтернативная гипотеза Н1 может при этом иметь следующий вид:

Н1:θ<θ0, H1:θ>θ0 или Н1:θ≠θ0.

Соответственно можно получить левостороннюю, правостороннюю или двустороннюю критические области (рис. 1). Граничные точки критических областей определяют по таблицам распределения статистики.

а) б) в)

Рис. 1. Критические области:

а – левосторонняя; б – правосторонняя; в - двусторонняя

Проверка статистической гипотезы состоит из следующих этапов:

  1. определение гипотез Н0 и Н1;

  2. выбор статистики и задание уровня значимости α;

  3. определение по таблицам, по уровню значимости α и по альтернативной гипотезе Н1 критической области;

  4. вычисление по выборке значения статистики;

  5. сравнение значения статистики с критической областью;

  6. принятие решения: если значение статистики не входит в критическую область, то принимается гипотеза Н0 и отвергается гипотеза Н1, а если входит в критическую область, то отвергается гипотеза Н0 и принимается гипотеза Н1.

Иногда целесообразно перед определением альтернативной гипотезы Н1 выполнить этап 4), где для получения значения статистики нужно вычислить несмещенные оценки параметров генеральной совокупности. Например, если проверяется гипотеза Н0: μ≠5 и несмещенная оценка среднего значения , то имеют смысл только следующие альтернативные гипотезы H1: μ >5 или H1: μ =5.

Результаты проверки статистической гипотезы нужно интерпретировать так: если приняли гипотезу Н1, то можно считать ее доказанной, а если приняли гипотезу Н0, то признали, что гипотеза Н0 не противоречит результатам наблюдений. Однако этим свойством наряду с Н0 могут обладать и другие гипотезы. Например, если мы принимаем гипотезу H0: μ =5, то может случиться, что по данной выборке можно принять и другие гипотезы, например, H0: μ =5,5 или H0: μ =4 и т.д. Вопрос о том, как найти среди них наилучшую гипотезу, в данном пособии не рассматривается. Следует помнить, что, принимая гипотезу Н0, следует проводить еще дополнительные исследования.