
- •Автор: э.И. Коломиец
- •Содержание
- •Введение
- •1. Теоретические сведения
- •1.1. Выборка. Эмпирическая функция распределения. Гистограмма. Выборочные числовые характеристики
- •1.2. Оценивание неизвестных параметров распределений
- •Точечные оценки. Методы нахождения точечных оценок
- •Интервальные оценки
- •Проверка статистических гипотез
- •1.3.1. Проверка гипотезы о виде распределения
- •1.4. Изучение зависимости между случайными величинами.
- •1.4.1. Оценка коэффициента корреляции.
- •1.4.2. Проверка гипотезы о независимости
- •1.4.3. Эмпирические уравнения регрессии.
- •1.5. Моделирование случайных величин и векторов
- •1.5.1. Моделирование непрерывных случайных величин
- •Стандартный метод моделирования непрерывных случайных величин
- •Пример: Моделирование случайной величины с экспоненциальным законом распределения.
- •Моделирование случайной величины, имеющей однопараметрическое гамма-распределение
- •Моделирование случайной величины, имеющей бета-распределение
- •Моделирование нормально распределенной случайной величины
- •1.5.2. Моделирование нормально распределенного случайного вектора
Проверка статистических гипотез
Статистической
гипотезой
называют любое утверждение о виде или
свойствах наблюдаемых в эксперименте
случайных величин. Правило, позволяющее
по имеющимся статистическим данным
(выборке) принять или отклонить выдвинутую
гипотезу, называется статистическим
критерием.
Если формулируется только одна гипотеза
и требуется проверить, согласуются ли
статистические данные с этой гипотезой
или же они ее опровергают, то критерии,
используемые для этого, называются
критериями
согласия.
Если гипотеза
однозначно фиксирует закон распределения
наблюдаемой случайной величины, то она
называется простой, в противном случае
— сложной. Пусть относительно наблюдаемой
случайной величины
сформулирована некоторая гипотеза
;
- выборка объема
,
являющаяся реализацией случайного
вектора
,
координаты которого
независимы и распределены так же, как
.
Общий
метод построения критерия согласия для
проверки гипотезы
состоит в следующем. Вначале ищут
статистику
(случайную величину!), характеризующую
отклонение эмпирического распределения
от теоретического, закон распределения
которой в случае справедливости
можно определить (точно или приближенно).
Далее задают некоторое положительное
малое число
,
так что событие с вероятностью
можно считать практически невозможным
в данном эксперименте. Затем для заданного
определяют в множестве
возможных значений статистики
подмножество
,
так чтобы
.
Критерий согласия имеет следующий вид:
если
значение статистики
,
соответствующее данной выборке
и
,
то гипотеза
отвергается;
если
,
то гипотеза
принимается.
Статистика называется статистикой критерия; множество - критической областью для гипотезы , число - уровнем значимости критерия.
1.3.1. Проверка гипотезы о виде распределения
Пусть
- выборка объема
,
представляющая собой результат
независимых наблюдений над случайной
величиной
,
относительно распределения которой
выдвинута простая гипотеза
(
- теоретическая функция распределения,
соответствующая гипотезе
).
Наиболее распространенным критерием
проверки этой гипотезы
является критерии
Пирсона.
Чтобы
воспользоваться критерием
Пирсона, выборочные данные
следует предварительно сгруппировать,
представив их в виде интервального
статистического ряда. Пусть
-интервалы группировки;
- частоты попадания выборочных значений
в интервалы
соответственно (
).
Обозначим
теоретическую (соответствующую
)
вероятность попадания случайной величины
в интервал
.
Статистикой критерия является величина:
,
которая
характеризует отклонение эмпирической
функции распределения
от теоретической функции распределения
(значение
является приращением эмпирической
функции
на интервале
,
а
- приращением теоретической функции
на том же интервале). Поскольку
относительные частоты
сближаются с вероятностями
при
,
то в случае справедливости гипотезы
значение величины
не должно существенно отличаться от
нуля. Поэтому критическая область
критерия
задается в виде
,
где
– значение величины
,
полученное для заданной выборки, а порог
определяется по заданному уровню
значимости
так, чтобы
.
Нахождение
основано на том факте (известном как
теорема Пирсона), что случайная величина
имеет при
предельное распределение хи - квадрат
с
степенью свободы.
На
практике предельное распределение
можно использовать с хорошим приближением
при
и
.
При выполнении этих условий для заданного
уровня значимости
можно положить
,
где
является (1—
)-квантилью
распределения
.
Таким образом, критерий согласия Пирсона состоит в следующем:
По заданному уровню значимости находится по табл. П4 порог .
По заданной выборке объема определяется число интервалов группировки так, чтобы . Вычисляется значение статистики
.
Если
, то гипотезу отвергают.
Если
, то гипотезу принимают.
Если
случайная величина
дискретная,
- различные выборочные значения, а
в случае справедливости
,
то всегда можно определить
интервалов, содержащих ровно по одному
выборочному значению. Поэтому в данном
случае можно сразу считать, что
,
где
– частота выборочного значения
.
На
практике теоретическое распределение
полностью бывает определено редко. Чаще
известен предположительно только тип
распределения, но неизвестны параметры
его определяющие. В этом случае гипотеза
о виде распределения, подлежащая
проверке, имеет вид
и является сложной параметрической
гипотезой.
Критерий согласия Пирсона применим для проверки такой гипотезы со следующими изменениями:
а)
вероятности
,
вычисляют, заменяя неизвестные параметры
их оценками максимального правдоподобия
:
;
б)
число степеней свободы предельного
распределения хи - квадрат должно
быть уменьшено на число неизвестных
параметров и считаться равным
.