- •Математическая статистика в примерах и задачах
- •Рецензент
- •Оглавление
- •Предисловие
- •Модуль 1. Анализ вариационных рядов
- •1.1. Генеральная совокупность. Выборочный метод. Графическое и табличное представление данных Опорный конспект
- •Вопросы для самоконтроля
- •Образцы решения типовых задач
- •Задачи для самостоятельного решения
- •1.2. Выборочные числовые характеристики Опорный конспект
- •Вопросы для самоконтроля
- •Образцы решения типовых задач
- •Задачи для самостоятельного решения
- •1.3. Точечные оценки. Методы нахождения точечных оценок Опорный конспект
- •Вопросы для самоконтроля
- •Образцы решения типовых задач
- •Задачи для самостоятельного решения
- •1.4. Доверительные интервалы Опорный конспект
- •Вопросы для самоконтроля
- •Образцы решения типовых задач
- •Задачи для самостоятельного решения
- •1.5 Проверка статистических гипотез Опорный конспект
- •Вопросы для самоконтроля
- •Образцы решения типовых задач
- •Задачи для самостоятельного решения
- •Модуль 2. Линейная регрессия. Элементы корреляционного анализа
- •Вопросы для самоконтроля
- •Образцы решения типовых задач
- •Задачи для самостоятельного решения
- •Индивидуальные домашние задания.
- •Приложение
- •Литература
1.5 Проверка статистических гипотез Опорный конспект
Статистической гипотезой называется любое предположение относительно генеральной совокупности. Гипотеза называется параметрической, если в ней содержится некоторое утверждение о параметрах распределения случайной величины (когда сам закон распределения считается известным), и непараметрической – в иных случаях.
Нулевой (основной)
гипотезой
называется
предпо-ложение, которого
мы придерживаемся изначально, пока
наблюдения не заставят нас признать
обратное.
Альтернативной
(конкурирующей)
гипотезой
называется
гипотеза,
которая противоречит
и
которую мы принимаем, если отвергаем
основную гипотезу.
Случайная
величина К,
построенная
по наблюдениям для проверки
нулевой гипотезы, называется статистикой
критерия. В каждом
конкретном случае статистику критерия
подбирают, обычно из перечисленных
ниже: U
– нормальное распределение,
– распределение хи-квадрат (Пирсона),t
– распределение Стьюдента, F
– распределение Фишера-Снедекора.
Схема
построения критерия такова: все выборочное
пространство
делится на две взаимодополняющие
области: область S
отклонения
основной гипотезы
и область S
принятия
этой гипотезы.
Область S,
при
попадании в которую выборочной точки
отвергается основная гипотеза, называется
критической.
При
проверке гипотез могут быть ошибки двух
родов.
Ошибка
первого рода
состоит
в том, что основная гипотеза отвергается,
хотя на самом деле она верна. Вероятность
ее обозначают
обычно
и называютуровнем
значимости критерия.
Ошибка
второго рода
состоит
в том, что основная гипотеза принимается,
хотя на самом деле она неверна. Вероятность
ее обозначают
обычно
.
Вычисленное по выборке значение критерия называют наблюдаемым значением Kнабл.
Критическими
точками (границами)
называют
точки kкр,
отделяющие критическую область от
области принятия гипотезы. Критические
области разделяются на правосторонние
и левосторонние области. Правосторонняя
область
определяется неравенством
,
левосторонняя
Это
односторонние области. Существуют также
и двусторонние области, определяемые
неравенствами ![]()
где
(
и
–
критические
точки). Например, для отыскания
односторонней критической области
необходимо найти критическую точку,
исходя из условия:
(для правосторонней области). Для каждого
критерия, т.е. соответствующего
распределения, обычно составлены
таблицы, по которым находят ![]()
После
того как критическая точка найдена, по
данным выборки вычисляют
наблюдаемое
значение критерии. Если
(для правосторонней области) нулевую
гипотезу отвергают, если наоборот, то
принимают
Проверка гипотезы о распределении. Критерий Пирсона. При проверке статистических гипотез о соответствии отдельных параметров закона распределения случайных величин предполагалось, что законы распределения этих величин известны. Однако при решении практических задач модель закона распределения в общем случае заранее неизвестна. Поэтому возникает необходимость выбора модели закона распределения, согласующейся с результатами выборочных наблюдений.
Пусть
– выборка наблюдений
случайной величины Х
с неизвестной функцией распределения
F(x).
Проверяется гипотеза
,
утверждающая, что Х
распределена по закону, имеющему функцию
распределения F(x),
равную функции
,
т.е. проверяется нулевая гипотеза
.
Критерии, с помощью которых проверяется
нулевая гипотеза о неизвестном
распределении, называютсякритериями
согласия.
Рассмотрим критерий согласия Пирсона
(хи-квадрат
распределения).
Схема
проверки нулевой гипотезы
:
1. По
выборке
строят вариационный
ряд; он может быть как дискретным, так
и интервальным. Рассмотрим для
определенности дискретный вариационный
ряд
|
|
|
|
... |
|
|
|
|
|
|
... |
|
|
2. По данным предыдущих исследований или по предварительным данным делают предположение (принимают гипотезу) о модели закона распределения случайной величины Х.
3. По
выборочным данным проводят оценку
параметров выбранной модели закона
распределения. Предположим, что закон
распределения имеет r
параметров (например, биномиальный
закон имеет один параметр p;
нормальный – два параметра
и т.д.).
4. Подставляя выборочные оценки значений параметров распределения, находят теоретические значения вероятностей
,
![]()
5.
Рассчитывают теоретические частоты
,
где
.
6. Рассчитывают значение критерия согласия Пирсона
.
Эта
величина при
стремится к распределению
с
степенями свободы,где
– число
интервалов, r
– число параметров предполагаемого
распределения. В частности, если
предполагаемое распределение нормально,
то оценивается два параметра, поэтому
число степеней свободы.
.
В дальнейшем для расчетов используют
таблицы распределения
.
7. Задаваясь
уровнем значимости α, находят критическую
область (она всегда правосторонняя)
;
значение
определяют из соотношения
.
Если численное значение
попадает в интервал
,
то гипотеза
отклоняется и принимается альтернативная
гипотеза о том, что выбранная модель
закона распределения не подтверждается
выборочными данными, при этом допускается
ошибка, вероятность которой равна
.
Следует
обратить внимание на то, что критерий
согласия Пирсона можно использовать
только в том случае, когда
Поэтому
тот интервал, для которого это условие
не выполняется, объединяют с соседним
и соответственно уменьшают число
интервалов.
Критерий согласия Колмогорова.
Критерий
согласия Колмогорова применяется для
проверки гипотез только о непрерывных
законах распределения. Мы проверяем
гипотезу
:
против
:
.
Сущность Критерия Колмогорова состоит в том, что вводят в рассмотрение функцию
![]()
![]()
,
называемой статистикой Колмогорова.
Колмогоров
доказал, что при
закон распределения случайной величины
независимо от вида распределения с.в.X
стремится
к закону
распределения Колмогорова.
Существуют
таблицы критических точек
.
Практически они используются уже при
Схема применения критерия Колмогорова следующая.
1. Строятся эмпирическая функция распределения Fn(x) и предполагаемая теоретическая функция распределения F(x).
2. Определяется
мера расхождения между теоретическим
и эмпирическим
распределениями
и
вычисляется величина
.
3. Если
вычисленное значение
окажется
больше критического
,
определенного на уровне значимости
,
то нулевая гипотеза о
том, что случайная величина X
имеет
заданный закон распределения,
отвергается. Если
,
то
считают, что гипотеза
не
противоречит
опытным данным.
Критерий Колмогорова достаточно часто применяется на практике благодаря своей простоте. Однако в принципе его применение возможно лишь тогда, когда теоретическая функция распределения F(x) задана полностью. Но такой случай на практике встречаете весьма редко. Обычно из теоретических соображений известен лишь вид функции распределения, а ее параметры определяются по эмпирическим данным. Поэтому, если при неизвестных значениях параметров применить критерий Колмогорова, взяв за значения параметров их оценки, то есть риск в ряде случаев принять нулевую гипотезу о законе распределение случайной величины как правдоподобную, в то время как на самой деле она противоречит опытным данным.
В математической статистике используется также ранговые критерии однородности.
Ранговые
критерии
однородности
выборок объемом
основаны не на
значениях признака, полученных в выборке,
а на порядковых номерах (рангах) этих
значений, расположенных в порядке
возрастания (убывания) и полученных
после упорядочивания объединенной
выборки объемом
.
В
критерии
Вилкоксона – Манна – Уитни для
проверки нулевой гипотезы однородности
двух выборок
:
против альтернативной
:
используется
статистика
или
(5.1)
где
– сумма рангов
наблюдений первой (второй) выборки,
причем общая сумма рангов
(5.2)
Доказано,
что если гипотеза
верна, то при
,
и
статистика
(5.3)
имеет
стандартный нормальный закон
.
Поэтому гипотеза
отвергается на
уровне значимости
(при ![]()
),
если
,
где
определяется по
таблице 1 приложения.
