Добавил:

Tushkan Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный исследовательский университет «МЭИ»

Предмет:

Теория вероятностей и математическая статистика

Файл:

Лабораторные работы / Бочаров (5 вариант) / Лабораторная работа 5.docx

Скачиваний:

Добавлен:

28.06.2014

Размер:

670.47 Кб

Скачать

☆

1 / 31 2 3 > Следующая >>>

НИУ МЭИ (МЭИ (ТУ))

Кафедра прикладной математики

Лабораторная работа № 5 по дисциплине: «Математическая статистика» на тему: «Критерий хи-квадрат проверки гипотез»

Выполнил:

студент группы А-13-08

Бочаров Иван

Основные теоремы

Теорема К. Пирсона. Если гипотеза Н верна и p_i⁰ > 0, i=1,...,m, то при n  распределение статистики Х² асимптотически подчиняется распределению хи-квадрат с m - 1 степенями свободы, т.е.

Р{ X²< x / H }  F_m_-₁(x)  P{ ²_m_-₁ < x }.

Порог h выберем из условия: вероятность ошибки первого рода должна быть малой - равной выбираемому значению  - уровню значимости:

P{ отклонить H / H верна} = P{ X ²  h / H }  P{²_m_-₁  h} = ,

откуда

h = Q( 1-, n -1) (3)

- квантиль уровня 1- распределения хи-квадрат с m -1 степенями свободы.

Процедура (2) - (3) проверки Н может быть записана иначе: гипотеза Н отклоняется, если

P{²_m_-₁  X²}   , (4)

т.е. если мала вероятность получения (при справедливости Н) такого же расхождения, как в опыте (т.е. X²), или ещё большего. Вероятность слева в (4) называется минимальным уровнем значимости (при любом значении , большем P{X²_m_-₁  X²}, гипотеза, очевидно, отклоняется).

2. Проверка сложной гипотезы о вероятностях

Пусть A₁, ...,A_m-mисходов некоторого опыта,n- число независимых повторений опыта,₁,...,_m- числа появлений исходов. Проверяемая гипотезаНпредполагает, что вероятности исходовP(A_i)являются известными функциямиp_i(a) k-мерного параметраa = (a₁,...,a_k), т.е.

Н: Р(А_i) = p_i(a), i = 1, ..., m,

но значение анеизвестно.

Для проверки гипотезы Нопределим статистику

(6)

По теореме Фишера, если Нверна, то приnраспределение статистикиХ²асимптотически подчиняется распределению хи-квадрат с числом степеней свободыf = m-1- k,и потомуотклоняем Н, если

h, (7)

где h = Q(1-, f) - квантиль уровня 1-распределения хи-квадрат с числом степеней свободыf; такой порог обеспечивает выбранный уровеньвероятностиP(отклонитьН / Н) ошибки 1-го рода. Если (7) не выполняется, делаем вывод, чтонаблюдения не противоречат гипотезе. Распределению хи-квадрат сf = m-1-kстепенями свободы асимптотически подчиняется также статистика

, (8)

где - оценка максимального правдоподобия дляа, и потому в (7) может быть использована статистика (8) вместо (6). Процедура (7) может быть записана иначе: если

P{_f²  X²}  (9)

то гипотеза Нотклоняется.

Проверка гипотезы о типе распределения

Пусть требуется проверить гипотезу о том, что выборка x₁, ..., x_nизвлечена из совокупности, распределенной по некоторому закону, известному с точностью доk-мерного параметраа=(а₁,...,а_k). Оказываются теоретически обоснованными следующие действия: разобьем весь диапазон наблюдений наmинтервалов, определим значения_i-число наблюдений вi-м интервале, получим значение оценки минимизацией (6) или методом максимального правдоподобия, определим вероятностиp_i()попадания вi-й интервал, вычислим (6) или (8) и примем решение по (7).

Пример 1. Проверка нормальности.

Проверим гипотезу о нормальном законе распределения размеров головок заклепок, сделанных на одном станке, по выборке объема n = 200; измерения приведены в таблице 1. Оценками для а(среднего) и(стандартного отклонения) являются

Результаты измерения диаметров заклепок занесем в таблицу с одним столбцом (d) и 200 строками:

Во время работы с модулем «Подбор распределения» наблюдаем оценки параметров Mean:13.42,Variance: 0.018.

Наблюдаем таблицу частот, в которой нам нужны столбцы observed frequency (наблюдаемые частоты) иexpectedfrequency (ожидаемые частоты). Сравним графически наблюдаемые и ожидаемые частоты: выделим соответствующие столбцы -Graphs - CustomGraphs - 2D Graphs...- OK. Наблюдаем некоторое различие.

В таблице приведено значение статистики (8) Chi-Square: 13.58969, количество степеней свободыd.f.= 3, которое получилось при объединении интервалов для выполнения условий

np10,i=1, ...,m;(5а)

если же mпорядка десяти и более, достаточно выполнения

np4,i=1, ...,m. (5б)

: f= 6 - 1 - 2 = 3. Приведено значение вероятности

Р²₃13.58969=р= 0.00352.

Видно, что в выборке имеется одно аномальное значение 14.56 (№ 188), которое могло появиться в результате какой-либо ошибки (при записи наблюдений, при перепечатке или попалась деталь с другого станка и т.д.). Удалим его и снова проверим гипотезу. Удаление одного наблюдения, если оно типично, не может изменить характеристики совокупности из 200 элементов; если же изменение происходит, следовательно, это наблюдение типичным не является и должно быть удалено.

Чтобы не портить исходные данные, продублируем их в новый столбец, например, dc, и удалим аномальное наблюдение.

Повторим проверку гипотезы для “цензурированной” выборки и убедимся в том, что наблюдения не противоречат гипотезе о нормальности.

Вероятность получить большое отклонение велика, гипотеза принимается.

1 / 31 2 3 > Следующая >>>

Соседние файлы в папке Бочаров (5 вариант)

#
28.06.20141.33 Mб19Лабораторная работа 1.docx
#
28.06.2014301.82 Кб19Лабораторная работа 3.docx
#
28.06.2014921.74 Кб28Лабораторная работа 4.docx
#
28.06.2014670.47 Кб21Лабораторная работа 5.docx
#
28.06.2014242.29 Кб31Лабораторная работа 6.docx
#
28.06.2014432.77 Кб23Лабораторная работа 8.docx