
- •Математическая статистика в примерах и задачах
- •Рецензент
- •Оглавление
- •Предисловие
- •Модуль 1. Анализ вариационных рядов
- •1.1. Генеральная совокупность. Выборочный метод. Графическое и табличное представление данных Опорный конспект
- •Вопросы для самоконтроля
- •Образцы решения типовых задач
- •Задачи для самостоятельного решения
- •1.2. Выборочные числовые характеристики Опорный конспект
- •Вопросы для самоконтроля
- •Образцы решения типовых задач
- •Задачи для самостоятельного решения
- •1.3. Точечные оценки. Методы нахождения точечных оценок Опорный конспект
- •Вопросы для самоконтроля
- •Образцы решения типовых задач
- •Задачи для самостоятельного решения
- •1.4. Доверительные интервалы Опорный конспект
- •Вопросы для самоконтроля
- •Образцы решения типовых задач
- •Задачи для самостоятельного решения
- •1.5 Проверка статистических гипотез Опорный конспект
- •Вопросы для самоконтроля
- •Образцы решения типовых задач
- •Задачи для самостоятельного решения
- •Модуль 2. Линейная регрессия. Элементы корреляционного анализа
- •Вопросы для самоконтроля
- •Образцы решения типовых задач
- •Задачи для самостоятельного решения
- •Индивидуальные домашние задания.
- •Приложение
- •Литература
1.5 Проверка статистических гипотез Опорный конспект
Статистической гипотезой называется любое предположение относительно генеральной совокупности. Гипотеза называется параметрической, если в ней содержится некоторое утверждение о параметрах распределения случайной величины (когда сам закон распределения считается известным), и непараметрической – в иных случаях.
Нулевой (основной)
гипотезой
называется
предпо-ложение, которого
мы придерживаемся изначально, пока
наблюдения не заставят нас признать
обратное.
Альтернативной
(конкурирующей)
гипотезой
называется
гипотеза,
которая противоречит
и
которую мы принимаем, если отвергаем
основную гипотезу.
Случайная
величина К,
построенная
по наблюдениям для проверки
нулевой гипотезы, называется статистикой
критерия. В каждом
конкретном случае статистику критерия
подбирают, обычно из перечисленных
ниже: U
– нормальное распределение,
– распределение хи-квадрат (Пирсона),t
– распределение Стьюдента, F
– распределение Фишера-Снедекора.
Схема
построения критерия такова: все выборочное
пространство
делится на две взаимодополняющие
области: область S
отклонения
основной гипотезы
и область S
принятия
этой гипотезы.
Область S,
при
попадании в которую выборочной точки
отвергается основная гипотеза, называется
критической.
При
проверке гипотез могут быть ошибки двух
родов.
Ошибка
первого рода
состоит
в том, что основная гипотеза отвергается,
хотя на самом деле она верна. Вероятность
ее обозначают
обычно
и называютуровнем
значимости критерия.
Ошибка
второго рода
состоит
в том, что основная гипотеза принимается,
хотя на самом деле она неверна. Вероятность
ее обозначают
обычно
.
Вычисленное по выборке значение критерия называют наблюдаемым значением Kнабл.
Критическими
точками (границами)
называют
точки kкр,
отделяющие критическую область от
области принятия гипотезы. Критические
области разделяются на правосторонние
и левосторонние области. Правосторонняя
область
определяется неравенством ,
левосторонняя
Это
односторонние области. Существуют также
и двусторонние области, определяемые
неравенствами
где
(
и
–
критические
точки). Например, для отыскания
односторонней критической области
необходимо найти критическую точку,
исходя из условия:
(для правосторонней области). Для каждого
критерия, т.е. соответствующего
распределения, обычно составлены
таблицы, по которым находят
После
того как критическая точка найдена, по
данным выборки вычисляют
наблюдаемое
значение критерии. Если
(для правосторонней области) нулевую
гипотезу отвергают, если наоборот, то
принимают
Проверка гипотезы о распределении. Критерий Пирсона. При проверке статистических гипотез о соответствии отдельных параметров закона распределения случайных величин предполагалось, что законы распределения этих величин известны. Однако при решении практических задач модель закона распределения в общем случае заранее неизвестна. Поэтому возникает необходимость выбора модели закона распределения, согласующейся с результатами выборочных наблюдений.
Пусть
– выборка наблюдений
случайной величины Х
с неизвестной функцией распределения
F(x).
Проверяется гипотеза
,
утверждающая, что Х
распределена по закону, имеющему функцию
распределения F(x),
равную функции
,
т.е. проверяется нулевая гипотеза
.
Критерии, с помощью которых проверяется
нулевая гипотеза о неизвестном
распределении, называютсякритериями
согласия.
Рассмотрим критерий согласия Пирсона
(хи-квадрат
распределения).
Схема
проверки нулевой гипотезы
:
1. По
выборке строят вариационный
ряд; он может быть как дискретным, так
и интервальным. Рассмотрим для
определенности дискретный вариационный
ряд
|
|
|
... |
|
|
|
|
|
... |
|
|
2. По данным предыдущих исследований или по предварительным данным делают предположение (принимают гипотезу) о модели закона распределения случайной величины Х.
3. По
выборочным данным проводят оценку
параметров выбранной модели закона
распределения. Предположим, что закон
распределения имеет r
параметров (например, биномиальный
закон имеет один параметр p;
нормальный – два параметра и т.д.).
4. Подставляя выборочные оценки значений параметров распределения, находят теоретические значения вероятностей
,
5.
Рассчитывают теоретические частоты
,
где
.
6. Рассчитывают значение критерия согласия Пирсона
.
Эта
величина при
стремится к распределению
с
степенями свободы,где
– число
интервалов, r
– число параметров предполагаемого
распределения. В частности, если
предполагаемое распределение нормально,
то оценивается два параметра, поэтому
число степеней свободы.
.
В дальнейшем для расчетов используют
таблицы распределения
.
7. Задаваясь
уровнем значимости α, находят критическую
область (она всегда правосторонняя)
;
значение
определяют из соотношения
.
Если численное значение
попадает в интервал
,
то гипотеза
отклоняется и принимается альтернативная
гипотеза о том, что выбранная модель
закона распределения не подтверждается
выборочными данными, при этом допускается
ошибка, вероятность которой равна
.
Следует
обратить внимание на то, что критерий
согласия Пирсона можно использовать
только в том случае, когда
Поэтому
тот интервал, для которого это условие
не выполняется, объединяют с соседним
и соответственно уменьшают число
интервалов.
Критерий согласия Колмогорова.
Критерий
согласия Колмогорова применяется для
проверки гипотез только о непрерывных
законах распределения. Мы проверяем
гипотезу :
против
:
.
Сущность Критерия Колмогорова состоит в том, что вводят в рассмотрение функцию
,
называемой статистикой Колмогорова.
Колмогоров
доказал, что при
закон распределения случайной величины
независимо от вида распределения с.в.X
стремится
к закону
распределения Колмогорова.
Существуют
таблицы критических точек .
Практически они используются уже при
Схема применения критерия Колмогорова следующая.
1. Строятся эмпирическая функция распределения Fn(x) и предполагаемая теоретическая функция распределения F(x).
2. Определяется
мера расхождения между теоретическим
и эмпирическим
распределениями
и
вычисляется величина
.
3. Если
вычисленное значение
окажется
больше критического
,
определенного на уровне значимости
,
то нулевая гипотеза о
том, что случайная величина X
имеет
заданный закон распределения,
отвергается. Если
,
то
считают, что гипотеза
не
противоречит
опытным данным.
Критерий Колмогорова достаточно часто применяется на практике благодаря своей простоте. Однако в принципе его применение возможно лишь тогда, когда теоретическая функция распределения F(x) задана полностью. Но такой случай на практике встречаете весьма редко. Обычно из теоретических соображений известен лишь вид функции распределения, а ее параметры определяются по эмпирическим данным. Поэтому, если при неизвестных значениях параметров применить критерий Колмогорова, взяв за значения параметров их оценки, то есть риск в ряде случаев принять нулевую гипотезу о законе распределение случайной величины как правдоподобную, в то время как на самой деле она противоречит опытным данным.
В математической статистике используется также ранговые критерии однородности.
Ранговые
критерии
однородности выборок объемом
основаны не на
значениях признака, полученных в выборке,
а на порядковых номерах (рангах) этих
значений, расположенных в порядке
возрастания (убывания) и полученных
после упорядочивания объединенной
выборки объемом
.
В
критерии
Вилкоксона – Манна – Уитни для
проверки нулевой гипотезы однородности
двух выборок :
против альтернативной
:
используется
статистика
или
(5.1)
где
– сумма рангов
наблюдений первой (второй) выборки,
причем общая сумма рангов
(5.2)
Доказано,
что если гипотеза верна, то при
,
и
статистика
(5.3)
имеет
стандартный нормальный закон .
Поэтому гипотеза
отвергается на
уровне значимости
(при
),
если
,
где
определяется по
таблице 1 приложения.