Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Maket_MS.doc
Скачиваний:
586
Добавлен:
01.05.2015
Размер:
10.68 Mб
Скачать

1.5 Проверка статистических гипотез Опорный конспект

Статистической гипотезой называется любое предположение относительно генеральной совокупности. Гипотеза называется параметрической, если в ней содержится некоторое утверждение о параметрах распределения случайной величины (когда сам закон распределения считается известным), и непараметрическойв иных случаях.

Нулевой  (основной) гипотезой называется предпо-ложение, которого мы придерживаемся изначально, пока наблюдения не заставят нас признать обратное.

Альтернативной (конкурирующей) гипотезой называется ги­потеза, которая противоречит и которую мы принимаем, если отвергаем основную гипотезу.

Случайная величина К, построенная по наблюдениям для проверки нулевой гипотезы, называется статистикой критерия. В каждом конкретном случае статистику критерия подбирают, обычно из перечисленных ниже: U – нормальное распределение, – распределение хи-квадрат (Пирсона),t – распределение Стьюдента, F – распределение Фишера-Снедекора.

Схема построения критерия такова: все выборочное про­странство делится на две взаимодополняющие области: область S отклонения основной гипотезы и область S принятия этой гипотезы. Область S, при попадании в которую выборочной точки отвергается основная гипотеза, называется критической. При проверке гипотез могут быть ошибки двух родов.

Ошибка первого рода состоит в том, что основная гипотеза от­вергается, хотя на самом деле она верна. Вероятность ее обозна­чают обычно и называютуровнем значимости критерия.

Ошибка второго рода состоит в том, что основная гипотеза принимается, хотя на самом деле она неверна. Вероятность ее обозначают обычно .

Вычисленное по выборке значение критерия называют наблюдаемым значением Kнабл.

Критическими точками (границами) называют точки kкр, отделяющие критическую область от области принятия гипотезы. Критические области разделяются на правосторонние и левосторонние области. Правосторонняя область определяется неравенством , лево­сторонняя Это односторонние области. Существуют также и дву­сторонние области, определяемые неравенствами где (и критические точки). Например, для отыскания односторонней критической области необходимо найти критическую точку, исходя из условия: (для правосторонней области). Для каждого критерия, т.е. соответствующего распределения, обычно составлены таблицы, по которым находят

После того как критическая точка найдена, по данным выборки вычис­ляют наблюдаемое значение критерии. Если (для правосторонней области) нулевую гипотезу отвергают, если наоборот, то принимают

Проверка гипотезы о распределении. Критерий Пирсона. При проверке статистических гипотез о соответствии отдельных параметров закона распределения случайных величин предполагалось, что законы распределения этих величин известны. Однако при решении практических задач модель закона распределения в общем случае заранее неизвестна. Поэтому возникает необходимость выбора модели закона распределения, согласующейся с результатами выборочных наблюдений.

Пусть – выборка наблюдений случайной величины Х с неизвестной функцией распределения F(x). Проверяется гипотеза , утверждающая, что Х распределена по закону, имеющему функцию распределения F(x), равную функции , т.е. проверяется нулевая гипотеза . Критерии, с помощью которых проверяется нулевая гипотеза о неизвестном распределении, называютсякритериями согласия. Рассмотрим критерий согласия Пирсона (хи-квадрат распределения).

Схема проверки нулевой гипотезы :

1. По выборке строят вариационный ряд; он может быть как дискретным, так и интервальным. Рассмотрим для определенности дискретный вариационный ряд

...

...

2. По данным предыдущих исследований или по предварительным данным делают предположение (принимают гипотезу) о модели закона распределения случайной величины Х.

3. По выборочным данным проводят оценку параметров выбранной модели закона распределения. Предположим, что закон распределения имеет r параметров (например, биномиальный закон имеет один параметр p; нормальный – два параметра и т.д.).

4. Подставляя выборочные оценки значений параметров распределения, находят теоретические значения вероятностей

,

5. Рассчитывают теоретические частоты , где.

6. Рассчитывают значение критерия согласия Пирсона

.

Эта величина при стремится к распределениюсстепенями свободы,где число интервалов, r – число параметров предполагаемого распределения. В частности, если предполагаемое распределение нормально, то оценивается два параметра, поэтому число степеней свободы. . В дальнейшем для расчетов используют таблицы распределения.

7. Задаваясь уровнем значимости α, находят критическую область (она всегда правосторонняя) ; значениеопределяют из соотношения. Если численное значение попадает в интервал, то гипотезаотклоняется и принимается альтернативная гипотеза о том, что выбранная модель закона распределения не подтверждается выборочными данными, при этом допускается ошибка, вероятность которой равна.

Следует обратить внимание на то, что критерий согласия Пирсона можно использо­вать только в том случае, когда Поэтому тот интервал, для которого это условие не выполняется, объединяют с соседним и соответственно уменьшают число интервалов.

Критерий согласия Колмогорова.

Критерий согласия Колмогорова применяется для проверки гипотез только о непрерывных законах распределения. Мы проверяем гипотезу :против :.

Сущность Критерия Колмогорова состоит в том, что вводят в рассмотрение функцию

,

называемой статистикой Колмогорова.

Колмогоров доказал, что при закон распределения случайной величинынезависимо от вида распределения с.в.X стремится к закону распределения Колмогорова.

Существуют таблицы критических точек . Практически они используются уже при

Схема применения критерия Колмогорова следующая.

1. Строятся эмпирическая функция распределения Fn(x) и предполагаемая теоретическая функция распределения F(x).

2. Определяется мера расхождения между теоретическим и эмпирическим распределениями и вычисляется величина .

3. Если вычисленное значение окажется больше критического, определенного на уровне значимости , то нулевая гипотеза о том, что случайная величина X имеет заданный закон распределения, отвергается. Если , то считают, что гипотеза не противоречит опытным данным.

Критерий Колмогорова достаточно часто применяется на практике благодаря своей простоте. Однако в принципе его применение возможно лишь тогда, когда теоретическая функция распределения F(x) задана полностью. Но такой случай на практике встречаете весьма редко. Обычно из теоретических соображений известен лишь вид функции распределения, а ее параметры определяются по эмпирическим данным. Поэтому, если при неизвестных значениях параметров применить критерий Колмогорова, взяв за значения параметров их оценки, то есть риск в ряде случаев принять нулевую гипотезу о законе распределение случайной величины как правдоподобную, в то время как на самой деле она противоречит опытным данным.

В математической статистике используется также ранговые критерии однородности.

Ранговые критерии однородности выборок объемом основаны не на значениях признака, полученных в выборке, а на порядковых номерах (рангах) этих значений, расположенных в порядке возрастания (убывания) и полученных после упорядочивания объединенной выборки объемом .

В критерии Вилкоксона – Манна – Уитни для проверки нулевой гипотезы однородности двух выборок :против альтернативной :используется статистика

или (5.1)

где – сумма рангов наблюдений первой (второй) выборки, причем общая сумма рангов

(5.2)

Доказано, что если гипотеза верна, то при , и статистика

(5.3)

имеет стандартный нормальный закон . Поэтому гипотеза отвергается на уровне значимости (при ), если , где определяется по таблице 1 приложения.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]