
- •Статистика как наука о массовых явлениях и процессах
- •Одномерное частотное распределение
- •Графическое представление данных
- •Характеристика центра распределения признака (меры центральной тенденции)
- •Нормальное распределение Гаусса
- •Другие распределения
- •Основы статистического вывода
- •Построение простой случайной репрезентативной выборки
- •Статистическая проверка гипотез
- •Виды статистических гипотез
- •Аналитическая статистика
- •Анализ взаимосвязи признаков
- •Частотная модель парных связей. Таблицы сопряженности.
- •Локальные таблицы сопряженности. Таблица сопряженности размером 2х2
- •Теоретико-информационные меры связи
- •Анализ связи ранжированных рядов
- •Корреляционный анализ. Анализ связи двух количественных признаков
- •Регрессионный анализ. Парная линейная регрессия
Статистическая проверка гипотез
1. Естественное понятие СГ.
2. Виды СГ.
3. Ошибка первого рода и ошибка второго рода.
4. Критические области.
5. Алгоритм статистической проверки гипотез (Проверка СГ).
1. СГ – утверждение о распределении ГС, соответствующая некоторым представлениям об изучаемом явлении. СГ – это два взаимосвязанных, но противоположных выражений.
Нулевая гипотеза – постулируется отсутствие различий между некоторыми параметрами ГС или отсутствие связи между переменными. Всегда предрешена. Альтернативная гипотеза – постулируется неравенство или различие между параметрами ГС или наличие связи между переменными и предположениями об их характере. Классификации: Односторонние и двусторонние.
2. Простая гипотеза – содержащая одно предположение.
Сложная гипотеза – состоит из конечного или бесконечного числа гипотез.
3. Н0 считается базовой и справедливой до тех пор, пока не будут найдены убедительные доказательства для её отклонений. Н1 принимается только в тех случаях, если существуют всякие доказательства в её пользу. При этом Н0 принимается или не принимается в строгой зависимости от того, с какой Н1 осуществляется её проверка.
|
Выборка |
|||
Н0 |
Н1 |
|||
ГС |
Н0 |
+ |
Ошибка α |
|
Н1 |
Ошибка β |
+ |
Ошибка первого рода – ошибочное решение, связанная с неправильным принятием Н1, в то время как в ГС верна Н0. Ошибка второго рода - -//- Н0, --//-- Н1. Величина альфа α – называется уровнем значимости критерия, по которому проверяется справедливость гипотезы Н0. Вероятность ошибки первого рода. Вероятность ошибки второго рода – бета β. Зависит от альтернативной гипотезы. Если мы понижаем α, то растет β; если понижаем β, то α понижается – специфика проверки гипотезы. Идеальное решение найти практически невозможно. После выбора критерия всех возможных значений разбивать на два непересекающихся подмножества. Одно из них содержит значение критерия, при которых Н0 отвергается, другая – при которых она принимается. Критической областью (КО) называют совокупность всех значений критерия, при которых нулевую гипотезу отвергают. Областью принятия нулевой гипотезы (областью допустимых значений) называют совокупность значений критерия, при которых Н0 принимают.
Основной принцип проверки гипотез: если наблюдаемое значение принадлежит критической области, то Н0 отвергают и принимают Н1; если наблюдаемое значение принадлежит области принятия Н0, то Н0 считается подтвержденной. Критерий К – одномерная случайная величина, следовательно, критическая область и область принятия гипотезы - это интервал. Критические К точки/границы – точки, отделяющие критическую область от области принятия Н0. Виды КО:
- односторонние (направленные КО)
- левосторонние – КО, определяемая неравенством:
KH < Kкр
Ккр < 0
- правосторонние – КО, определяемая неравенством:
KH > Kкр
Ккр > 0
- двусторонние (ненаправленные КО) – определяемые следующими неравенствами:
KH < K1
KH > K2
K2 > K2
|K| > Ккр
Дв. КО определяется, когда Н1 имеет вид: Н1: µ ≠ µ0
П. КО: µ > µ0.
5. Алгоритм проверки статистических гипотез:
1) формулировка гипотезы Н0 и Н1;
2) выбрать уровень значимости альфа;
3) определить объём выборки n;
4) выбрать критерий К для проверки гипотезы Н0;
5) определить КО и области принятия гипотезы;
6) вычислить наблюдаемое значение критерия Кн;
7) принять решение.
Если Кн, вычисленное по выборке, принадлежит КО, то гипотезу Н0 отвергают. Если Кн принадлежит области принятия гипотезы, то Н0 нет оснований отвергнуть.