Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Prakticheskaya_2_Stat_analiz.doc
Скачиваний:
1
Добавлен:
01.05.2025
Размер:
1.08 Mб
Скачать

§ 1.4. Статистическая проверка гипотез

На практике часто приходится проверять различные предположения о законах и параметрах распределения, характеризующих конкретное массовое явление, на основании наблюдений, испытаний и т.п. Проверка гипотез на основе выборочных статистических данных называется статистической проверкой гипотез.

Одну из гипотез принимают в качестве основной, или нулевой гипотезы H0 , а другую – в качестве конкурирующей, или альтернативной гипотезы H1. Гипотезу называют статистической , если она содержит предположение о виде неизвестного распределения или о значениях параметров известного распределения. Простой называют гипотезу, содержащую только одно предположение. Сложной называют гипотезу, состоящую из конечного или бесконечного числа простых гипотез. Например, предположение о том, что математическое ожидание нормального распределения m = 3 при известном σ, является простой гипотезой; а при неизвестном σсложной гипотезой.

При проверке предположений на основе статистических данных практически невозможно делать безошибочные выводы. Ошибки могут быть двух видов. Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза. Ошибка второго рода состоит в том, что будет принята неправильная гипотеза, т.е. отвергается конкурирующая гипотеза, когда она верна. Обычно статистические проверки гипотез выполняются многократно, а частота ошибок при этом связана с их вероятностью. Однако необходимо найти такой способ проверки гипотез, который обеспечит наименьшую из всех возможных вероятность ошибок даже при однократной проверке гипотезы.

Для проверки нулевой гипотезы H0 используют специально подобранную случайную величину K, точное или приближенное распределение которой известно. Эту случайную величину называют статистическим критерием. Наблюдаемым значением Kнабл называется значение критерия, вычисленное по выборке.

После выбора определенного критерия множество всех его возможных значений разбивают на два непересекающихся подмножества: одно из них содержит значения критерия, при которых H0 отвергается, а другое – при которых гипотеза H0 принимается. Критической областью называется совокупность значений критерия, при которых нулевая гипотеза H0 отвергается. Областью принятия гипотезы называют совокупность значений критерия, при которых нулевая гипотеза H0 принимается. Основной принцип проверки статистических гипотез: если наблюдаемое значение критерия Kнабл принадлежит критической области, гипотезу H0 отвергают; если Kнабл принадлежит области принятия гипотезы, гипотезу H0 принимают.

Поскольку критерий K – одномерная случайная величина, все ее значения принадлежат некоторому интервалу. Следовательно, критическая область и область принятия гипотезы – тоже интервалы. Критическими точками (границами) kкр называют точки, отделяющие критическую область от области принятия гипотезы. Критические точки находят по таблицам. Критическую область называют правосторонней, если она определяется неравенством K > kкр ; левосторонней, если она определяется неравенством K < kкр ; двусторонней, если она определяется неравенством │K│> kкр в случае симметричной критической области или двумя неравенствами: K < k1, K > k2 ( k1 < k2 ).

Отыскание критических областей сводится к нахождению соответствующих критических точек. Для этого задаются достаточно малой вероятностью – уровнем значимости α, а исходят из требования: при условии справедливости нулевой гипотезы H0 вероятность того, что критерий K примет значение из критической области, равна α . Если наблюдаемое значение критерия попадает в критическую область, то это можно объяснить тем, что гипотеза H0 ложна и, следовательно, должна быть отвергнута. Однако может оказаться, что значение критерия попало в критическую область по другим причинам ( например, малый объем выборки, недостатки методики эксперимента и др.). В этом случае имеет место ошибка первого рода – отвергается правильная гипотеза. Вероятность этой ошибки равна уровню значимости α Если значение критерия попадает в область принятия гипотезы, она принимается. Однако это не означает, что она справедлива, а только то, что данные наблюдений согласуются с гипотезой, и нет оснований ее отвергать.

Мощностью критерия называется вероятность попадания значения критерия в критическую область при условии, что справедлива альтернативная гипотеза H1. Если вероятность ошибки второго рода (принимается неправильная гипотеза) равна β, то мощность критерия равна 1-β . Таким образом, чем больше мощность критерия, тем меньше вероятность ошибки второго рода. Если уровень значимости уже выбран, то критическую область следует строить так, чтобы мощность критерия была максимальной. Единственный способ одновременно уменьшить вероятность ошибок первого и второго рода – увеличить объем выборки.

Общая схема проверки гипотез.

  • Исходя из экономических соображений и содержания проблемы, формулируют нулевую гипотезу H0 .

  • Задаются величиной уровня значимости критерия α, т.е. вероятностью отвергнуть правильную гипотезу H0 . Чем более правдоподобна гипотеза, тем меньше должно быть α : 0,05; 0,01; 0,005 и меньше. При наличии столь же правдоподобной альтернативной гипотезы H1 уровень значимости следует выбирать равным вероятности ошибки второго рода (отвергнуть альтернативную гипотезу, когда она верна).

  • Выбирают некоторую функцию – статистику ψ, зависящую от результатов наблюдений x1,x2, … , xn , и находят законы ее распределения Fψ(x) при обеих гипотезах H0 и H1. Это самый сложный этап с математической точки зрения.

  • С помощью закона распределения Fψ(x) на основе выбранного уровня значимости α область возможных значений статистики разбивают на области неправдоподобно малых и больших значений статистики ψ и область правдоподобных значений ψ.

  • Вычисляют значение статистики ψ по статистическим данным выборки. Выясняют, в какую область попадает значение ψ(x1,x2, … , xn ) и принимают решение: если величина ψ попадает в область правдоподобия гипотезы H0, то считают, что статистические данные не противоречат гипотезе H0 и она принимается. Этому выводу всегда соответствуют вероятности ошибок α и β . Причем α = β , если две гипотезы априори одинаково правдоподобны.

В качестве статистик используют:

U или Z для нормально распределенных случайных величин;

F или V2 для распределения по закону Фишера – Снедекора;

T для распределения Стьюдента;

χ2 для распределения по закону χ2 ( «хи квадрат» ).

Проверку статистических данных на наличие «выбросов» осуществляют при большом объеме выборки с помощью статистики

S = ( x* - ) / σ

В качестве нулевой гипотезы H0 выдвигается предположение: x* выброс. Значение Sкр определяется по таблице в зависимости от значений параметров: уровня значимости α и объема выборки n . Если Sнабл > Sкр , гипотеза H0 принимается, т.е. x* – выброс. В противном случае гипотеза H0 отвергается.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]