биометрия уср 3
.docxРеферат на тему: Статистическая гипотеза
Подготовила: Децук Валерия
Статистическая гипотеза (statistical hypothesys) – это определенное предположение о распределении вероятностей, лежащем в основе наблюдаемой выборки данных.
В области биометрии широко используется так называемая нулевая гипотеза (Н0), которая чаще всего носит общепринятый характер. Например: средняя температура воздуха зимы этого года не отличается от прошлогодней. Студенты дневного отделения сдают зачет по биометрии так же, как студенты заочного.
Противоположная нулевой – альтернативная гипотеза (НА или Н1) – исходит из обратного предположения, например, средняя температура воздуха зимы этого года отличается от прошлогодней. Студенты дневного отделения успешнее сдают зачет по биометрии, чем студенты заочного.
Гипотеза выражается в терминах вероятности и может быть проверена по выборочным характеристикам. Проверка статистической гипотезы, или статистический тест (testing statistical hypotheses), – это процесс принятия решения о том, противоречит ли рассматриваемая статистическая гипотеза наблюдаемой выборке данных или нет.
Статистический тест включает 4 основных элемента:
1) формулировку нулевой гипотезы (Н0);
2) формулировку альтернативной гипотезы (НА или Н1);
3) вычисление статистики теста. Вопрос о том, какую статистику надо взять для проверки той или иной гипотезы, решается в каждом случае отдельно;
4) определение фиксированного уровня значимости (не более 0,05). Определение достигаемого уровня значимости. Достигаемый уровень значимости (p-value) – это наименьшая величина уровня значимости, при которой нулевая гипотеза отвергается для данного значения вычисляемой статистики критерия (p < 0,05). Нулевую гипотезу не отвергают, если в результате окажется, что p-value превышает 5 %, т. е. p > 0,05.
При проверке статистических гипотез возможны ошибки первого и второго рода.
Ошибка первого рода или «ложная тревога» (англ. type I error, false positive) – когда нулевая гипотеза отвергается, хотя на самом деле она верна. Максимальная допустимая вероятность ошибки первого рода α (вероятность справедливости нулевой гипотезы) – это уровень значимости выбранного критерия.
Ошибка второго рода или «пропуск цели» (англ. type II error, false negative) – когда нулевая гипотеза принимается, хотя на самом деле она не верна. Минимальная допустимая вероятность ошибки второго рода β (вероятность справедливости альтернативной гипотезы) – мощность выбранного критерия. Чем ближе мощность критерия к 1, тем более эффективен критерий. Мощность критерия – это вероятность того, что нулевая гипотеза будет отвергнута, когда альтернативная гипотеза верна.
В зависимости от проверяемой нулевой гипотезы статистические критерии делятся на группы.
Критерии согласия проверяют, согласуется ли заданная выборка с заданным фиксированным распределением, с заданным параметрическим семейством распределений, или с другой выборкой.
Критерий Колмогорова-Смирнова.
Критерий хи-квадрат (Пирсона).
Критерии нормальности (выделенный частный случай критериев согласия). Проверка на нормальность выполняется на первом шаге анализа выборки, чтобы решить, использовать далее параметрические методы или непараметрические.
Критерий Шапиро-Уилка.
Критерий асимметрии и эксцесса.
Критерии сдвига (специальный случай двухвыборочных критериев согласия). Проверяется гипотеза сдвига, согласно которой распределения двух выборок имеют одинаковую форму и отличаются только сдвигом на константу.
Критерий Стьюдента.
Критерий Вилкоксона, Манна-Уитни.
Критерии однородности предназначены для проверки нулевой гипотезы о том, что две выборки (или несколько) взяты из одного распределения, либо их распределения имеют одинаковые значения средней величины, дисперсии, или других параметров.
Критерии симметричности позволяют проверить симметричность распределения.
Одновыборочный критерий Вилкоксона.
Критерий знаков.
Коэффициент асимметрии.
Критерии тренда и случайности предназначены для проверки нулевой гипотезы об отсутствии зависимости между выборочными данными и номером наблюдения в выборке. Они часто применяются в анализе временных рядов, в частности, при анализе регрессионных остатков.
Критерии выбросов.
Критерии дисперсионного анализа.
Критерии корреляционного анализа.
Критерии регрессионного анализа.
статистические гипотезы:
Для коэффициента асимметрии:
Н0: в генеральной совокупности показатель асимметрии As равен нулю, данные распределяются по нормальному закону.
НА (или Н1): в генеральной совокупности показатель асимметрии As не равен нулю, данные не распределяются по нормальному закону.
Для коэффициента эксцесса:
Н0: в генеральной совокупности показатель эксцесса Ex равен нулю, данные распределяются по нормальному закону.
НА (или Н1): в генеральной совокупности показатель эксцесса Ex не равен нулю, данные не распределяются по нормальному закону.