Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лабораторные / Лабораторная работа 5.doc
Скачиваний:
41
Добавлен:
28.06.2014
Размер:
231.94 Кб
Скачать

Работа № 5. Критерий хи-квадрат проверки гипотез

Критерий хи-квадрат Пирсона является весьма общим методом построения тестов для проверки различных гипотез. Рассмотрим исходную схему.

1. Проверка простой гипотезы о вероятностях

Обозначим:

A1, ..., Am-m возможных исходов некоторого опыта; p1, ..., pm - вероятности cooтветствующих исходов, ;

n - число независимых повторений опыта;

n1, ..., nm - число появлений соответствующих исходов в n опытах, ;

p, ..., p - гипотетические значения вероятностей, p> 0, .

Требуется по наблюдениям n1,...,nm проверить гипотезу Н о том , что вероятности p1, ..., pm имеют значения p, ..., p, т.е.

Н: pi= p, i=1, ...,m.

Оценками для p1, ..., pm являются =n1 /n,..., =nm/n. Мерой расхождения между гипотетическими и эмпирическими вероятностями принимается величина

,

которая с точностью до множителя n есть усредненное с весами p значение квадрата относительного отклонения значений от p. Статистика X2 называется статистикой хи-квадрат Пирсона. Для ее вычисления используются две формулы:

. (1)

Условно статистику можно записать так:

Н - наблюдаемые частоты ni, Т - теоретические (ожидаемые) частоты np. Поскольку по закону больших чисел® pi при n®¥, то

.

Последняя величина равна 0, если верна Н; если же Н не верна, то X2 ®¥.

Процедура проверки гипотезы состоит в том, что если величина X2 приняла “слишком большое” значение, т.е. если

X2 ³ h, (2)

то гипотеза Н отклоняется; если это не так, будем говорить, что наблюдения не противоречат гипотезе. На вопрос, что означает “слишком большое” значение, отвечает

Теорема К. Пирсона. Если гипотеза Н верна и pi0 > 0,i=1,...,m, то при n® ¥ распределение статистики Х2 асимптотически подчиняется распределению хи-квадрат с m- 1 степенями свободы, т.е.

Р{ X2 < x / H } ® Fm-1(x) º P{ c2m-1< x }.

Порог h выберем из условия: вероятность ошибки первого рода должна быть малой - равной выбираемому значению a - уровню значимости:

P{ отклонить H/ H верна} = P{X 2 ³h / H}@P{c2m-1 ³ h} =a,

откуда

h = Q(1-a, n -1) (3)

- квантиль уровня 1-a распределения хи-квадрат с m -1 степенями свободы.

Процедура (2) - (3) проверки Н может быть записана иначе: гипотеза Н отклоняется, если

P{c2m-1 ³ X2} £ a, (4)

т.е. если мала вероятность получения (при справедливости Н) такого же расхождения, как в опыте (т.е. X2), или ещё большего. Вероятность слева в (4) называется минимальным уровнем значимости (при любом значении a, большем P{X2m-1³ X2}, гипотеза, очевидно, отклоняется).

Замечание. Теорему Пирсона можно применять, если все ожидаемые частоты

np³10,i=1, ...,m; (5а)

если m порядка десяти и более, достаточно выполнения

np ³ 4,i=1, ...,m. (5б)

Если (5) не выполняется, необходимо некоторые исходы Аi объединять

2. Проверка сложной гипотезы о вероятностях

Пусть A1, ...,Am -m исходов некоторого опыта, n - число независимых повторений опыта, n1,...,nm - числа появлений исходов. Проверяемая гипотеза Н предполагает, что вероятности исходов P(Ai) являются известными функциями pi(a) k-мерного параметра a = (a1,...,ak), т.е.

Н: Р(Аi) = pi(a), i = 1, ..., m,

но значение а неизвестно.

Для проверки гипотезы Н определим статистику

(6)

По теореме Фишера, если Н верна, то при n ® ¥ распределение статистики Х2 асимптотически подчиняется распределению хи-квадрат с числом степеней свободы f = m -1- k, и потому отклоняем Н, если

³h, (7)

где h = Q(1-a, f) - квантиль уровня 1- a распределения хи-квадрат с числом степеней свободы f; такой порог обеспечивает выбранный уровень a вероятности P(отклонить Н / Н) ошибки 1-го рода. Если (7) не выполняется, делаем вывод, что наблюдения не противоречат гипотезе. Распределению хи-квадрат с f = m -1-k степенями свободы асимптотически подчиняется также статистика

, (8)

где - оценка максимального правдоподобия для а, и потому в (7) может быть использована статистика (8) вместо (6). Процедура (7) может быть записана иначе: если

P{cf2 ³ X2} £ a (9)

то гипотеза Н отклоняется.