Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Раздел 2 лекция 5

.doc
Скачиваний:
35
Добавлен:
13.04.2015
Размер:
60.42 Кб
Скачать

Раздел 2 Статистические гипотезы и их проверка

Лекция № 5

Тема: общие принципы проверки статистических гипотез.

План: 1.Понятие статистической гипотезы. Ошибки I и II рода.

2.Критерий оценки статистических гипотез. Уровень значимости.

Понятие статистической гипотезы. Ошибки I и II рода.

Статистической гипотезой называется предположение о том, что распределение случайной величины (результата эксперимента) подчиняется определённому закону распределения.

Статистический критерий (или критерий оценки статистической гипотезы) -это проверка, позволяющая оценить, насколько статистическая гипотеза согласуется с экспериментальными данными.

Пусть в нашем распоряжении имеется величина х – одно из возможных значений случайной величины (результата эксперимента).

Выдвинем гипотезу о том, что случайная величина х распределена по закону, задаваемому функцией плотности вероятности φ0(х). Гипотезу обозначим как Н0 и назовем нуль гипотезой.

φ(х)

φ0(х) φ1(х)

- х х

Введём также некоторую альтернативную гипотезу Н1, содержание которой состоит в том, что рассматриваемая случайная величина х подчиняется закону распределения, описываемого функцией плотности вероятности φ1(х). Будем считать, что гипотеза Н1 является истинной, если нуль-гипотеза Н0 не верна. Требуется на основании распределения величины х решить, какой из гипотез Н0 или Н1 следует отдать предпочтение. Решение поставленной задачи может быть как верным, так и ложным.

Неправильное решение может быть двух родов:

  1. Ошибка первого рода – не принять нуль-гипотезу, когда она в действительности верна, (т.е принять Н1 вместо Н0). α – это вероятность совершить ошибку I рода (или риск) – показывает какова вероятность отбросить верные (истинные) результаты.

  2. Ошибка второго рода – принять нуль-гипотезу, когда она не верна (т.е. принять Н0 вместо Н1 ). β – это вероятность совершить ошибку второго рода. Показывает какова вероятность принять неверные (ложные) результаты.

Тогда, α уменьшается, β увеличивается, а (1–β) уменьшается. Т.е. α уменьшается (вероятность не принять Н0, когда она верна) следовательно (1- β) уменьшается (вероятность не принять, когда Н0 не верна).

Поэтому, для принятия проверяемой гипотезы вероятность совершить ошибку I рода α должна быть не самой низкой, а оптимальной.

Для выбора величины α существуют определённые правила (критерии), которые позволяют оценить насколько верно проверяемая гипотеза описывает экспериментальные данные.

Критерии оценки статистических гипотез при обработке результатов эксперимента

Рассмотрим критерии оценки гипотезы Н0 (т.е. верна она или нет) для случайной величины х (т.е. для результата эксперимента). Пусть гипотеза Н0 верна и состоит в том, что рассматриваемая случайная величина х действительно распределена по закону, задаваемому функцией φ0(х). Однако, если х попало в область, расположенную вблизи правого или левого «хвоста» функции φ0(х), то вероятность попадания случайной величины в эту область, вычисляется при помощи функции φ0(х) мала и приближается к нулю. Поэтому проще и целесообразнее признать ошибочность гипотезы и не принять её в этой область. Тогда эта область будет характеризоваться α - вероятностью не принять гипотезу Н0 , когда она в действительности верна.

φ0(х)

α/2 Р=1 – α α/2

х1 х2 х

критическая область доверительный интервал критическая область

  1. Назовём интервал значений случайной величины х, т.е отрезок оси абсцисс, расположенный вблизи «хвоста» функции φ0(х) критической областью данной функции распределения.

  2. Значения случайной величины х1 и х2, отделяющих критические области, называются критическими значениями данной функции распределения.

  3. Размеры критической области определяются вероятностью попадания в неё случайных величин. Вероятность попадания значений х случайной величины в критическую область получила название уровень значимости критерия оценки статистической гипотезы или просто уровень значимости р. Видно, что

р=α или р=1–Р

Уровень значимости (риск) – это вероятность отвергнуть проверяемую гипотезу Н0, когда она в действительности верна. Проще говоря р – это вероятность отбросить верные результаты.

Критерием оценки статистической гипотезы является попадание хi в критическую область. Если случайная величина х не попадает в критическую область, то анализируемая гипотеза считается приемлемой. Если случайная величина х попадает в критическую область, то это свидетельствует о неприемлемости анализируемой гипотезы.

Если критическая область, попадание в которую значений х случайной величины, целиком расположена в правой (или левой) части графика φ0(х), то критерий оценки статистической гипотезы называется односторонним. В случае одностороннего критерия уровень значимости равен α=р=(1 –Р).

φ0(х) φ0(х)

или

В противном случае критическую область необходимо рассматривать из двух частей, а соответственный критерий называется двухсторонним. В случае двухстороннего критерия α=р=(1 –Р)/2.

φ0(х)

α=р=(1 –Р)/2 α=р=(1 –Р)/2

0 х

Односторонний критерий используют только в том случае, если экспериментатор заранее знает, что результаты опытов не попадают в противоположную часть (область) функции, или для него это будет иметь практическое значение.

Пример 1:

φ0(х)

α=р=1-Р

+Wвлаги

- х 0 х

Пример 2: Д окрашивание раствора

-0,16; 0,16; 0,17;…

-0,16 не имеет практического значения, т.к. раствор мутный и луч не проходит через раствор – результат не верен.

α=р=(1-Р)/2

0

Принять проверяемую гипотезу можно только при определённых значениях р. Критерии принятия статистической гипотезы:

  1. Если значения уровня значимости р равно 5% и более, то проверяемую гипотезу следует признать согласующейся с полученными экспериментальными данными. В этом случае различия между гипотетическими экспериментальными данными являются статистически незначимым.

р≥0,05

  1. Если уровень значимости менее 5%, но более 1%, то можно пойти на риск принятия проверяемой гипотезы, либо взять гипотезу под сомнение. Различие между гипотетическими и экспериментальными данными является спорным. Для уточнения выводов следует признать целесообразным повторение эксперимента

0,01<p<0,05

  1. Если значение критерия значимости составляет 1% и менее, то проверяемая гипотеза отбрасывается. Различия между гипотетическими и экспериментальными данными являются статистически значимыми.

р≤0,01