
- •Задачи математической статистики. Материальные объекты, их вероятностная природа.
- •Основные понятия выборочного метода. Точечные оценки числовых характеристик случайной величины.
- •Оценка плотности вероятностей и функции распределения.
- •Статистическое оценивание параметров модели. Метод моментов. Метод максимального правдоподобия.
- •Проверка статистических гипотез. Постановка задачи. Общая логическая схема проверки гипотез. Свойства критериев.
- •Гипотезы о равенстве дисперсий двух случайных величин (при известных и неизвестных математических ожиданиях).
- •Гипотезы о равенстве математических ожиданий двух случайных величин (при известных и неизвестных дисперсиях).
- •Критерии проверки гипотезы об однородности двух или нескольких выборок. Критерий однородности 2.
- •Ранговый критерий однородности Вилкоксона-Манна-Уитни.
- •Критерии проверки гипотезы о согласии эмпирического и теоретического распределений. Критерии согласия 2 – Пирсона и Колмогорова-Смирнова. Применимость критериев.
- •Задачи корреляционного анализа. Типы измерителей статистической связи. Постановка задачи корреляционного анализа.
- •Понятие тесноты статистической связи между количественными переменными. Парный коэффициент корреляции.
- •Ранговые коэффициенты корреляции Спирмена и Кендалла.
- •Ложная корреляция и частный коэффициент корреляции.
- •Множественная корреляция. Коэффициент конкордации.
- •Проверка гипотезы о статистической значимости выборочного коэффициента конкордации.
Проверка статистических гипотез. Постановка задачи. Общая логическая схема проверки гипотез. Свойства критериев.
Постановка задачи. Общая логическая схема статистического критерия проверки гипотез
На разных этапах статистического исследования возникает необходимость в формулировании и экспериментальной проверке некоторыхпредположительных утверждений (гипотез, истин), от которых зависит правомерность и эффективность применяемых методов анализа, например:
можно ли считать подлежащие обработке данные результатами независимых наблюдений случайной величины;
при наличии нескольких групп исходных данных можно ли считать, что они извлечены из одной генеральной совокупности;
симметричен ли закон распределения исследуемой случайной величины относительно центра группирования;
какую модель надо выбрать для описания эмпирических данных;
какова природа и величина неизвестных параметров рассматриваемой стохастической схемы и т.д.
Наша цель в данном случае – проверить, не противоречит ли высказанная нами гипотеза Н0 имеющимся эмпирическим данным.
Процедура обоснованного сопоставления высказанной гипотезы с имеющейся выборкой х1, х2, ..., xn осуществляется с помощью того или иного статистического критерия и называется статистической проверкой гипотез.
Результат такого сопоставления может быть как отрицательным (данные наблюдения противоречат выдвинутой гипотезе, следовательно, от нее надо отказаться), так и положительным (наблюдения не противоречат высказанной гипотезе, и поэтому ее можно принять в качестве одного из решений). Положительный результат статистической проверки гипотез не означает, что высказанное нами предположительное утверждение является наилучшим. Могут так же существовать другие критерии, которые не будут противоречить тем же эмпирическим данным. Принятая в этом случае гипотеза будет рассматриваться как достаточно правдоподобное, не противоречащее опыту утверждение.
Статистические критерии проверки гипотез разнообразны, но у них единая логическая схема построения критерия, которая укладывается в 5 шагов /1/.
1-й шаг. Выдвигается основная (или проверяемая) гипотеза Н0. Гипотеза Н1, которая противоречит основной Н0, называется альтернативной, или конкурирующей.
2-й шаг. Задается уровень значимости критерия a. Дело в том, что любое статистическое решение, принимаемое на основе ограниченного ряда наблюдений, сопровождается, хоть и малой, вероятностью ошибочного заключения. Именно в доле случаев a гипотеза Н0 может быть отвергнута, при условии, что она верна, или, наоборот, в доле случаев b мы можем принять гипотезу Н0, в то время как она ошибочна. При фиксированном объеме выборки n величину вероятности a или b мы можем выбирать самостоятельно. Если есть возможность сколь угодно увеличивать n, то теоретически можно добиться каких угодно малых ошибок a и b при любой фиксированной конкурирующей гипотезе Н1.
Величину a называют уровнем значимости, размером критерия или ошибкой первого рода. Это вероятность отвергнуть основную гипотезу Н0 при условии, что она верна.
Чем весомее для исследователя потери от ошибочного отвержения гипотезы Н0, тем меньшее a необходимо выбирать. Обычно пользуются стандартными значениями a (0.1; 0.05; 0.025; 0.01; 0.005; 0.001).
Пример
Величина a = 0.05 означает, что в среднем в 5 случаях из 100 при использовании данного статистического критерия будет ошибочно отвергаться справедливая основная гипотеза Н0.
|
3-й шаг. Задается некоторая функция результатов наблюдения – критическая статистика
кр =
(х1,
х2,
..., хn).
Как функция наблюдений эта критическая статистика также является случайной величиной и в предположении справедливости Н0 подчинена некоторому хорошо изученному закону распределения с плотностью вероятности W( кр). Механизм построения закона распределения критической статистики описан в /1/.
Содержательный
смысл критической статистики – мера
расхождения имеющейся в распоряжении
исследователя выборки с основной
гипотезой Н0.
Например,
в гипотезе
об однородности двух
выборок случайных величин Х и Y
кр –
мера различия между функциями
распределения
и
.
4-й шаг. Из статистических таблиц распределения W( кр) находятся квантили уровня a /2 и 1-a/2 или процентные точки (1-a/2)Ч100% и (a/2)Ч100%, являющиеся соответственно нижней кр.н и верхней кр.в критическими точками (границами) (см. рисунок). Они делят всю область допустимых значений кр на области:
неправдоподобно малых (I);
правдоподобных (II);
неправдоподобно больших (III).
Области
принятия и отвержения гипотезы Н0.
Область принятия гипотезы Н0 определяется как доверительный интервал для кр, который формируется на основе распределения статистики W( кр) при уровне доверительной вероятности р = 1 - a. Различают односторонние и двухсторонние критерии. Для одностороннего критерия область принятия основной гипотезы может иметь ограничение только с одной стороны (сверху или снизу). При этом область значений статистики кр разбивается на две: область правдоподобных и область неправдоподобно больших или неправдоподобно малых значений. Для двухстороннего критерия область принятия гипотезы Н0 имеет два ограничения – сверху и снизу.
5-й шаг. Определяется наблюденное (расчетное) значение критической статистики расч подстановкой в кр конкретных выборочных значений х1, х2, ..., хn или некоторых функций от них. Если окажется, что расч принадлежит области правдоподобных значений, то гипотеза Н0верна, т.е. не противоречит выборочным данным. В противном случае Н0 отвергается с ошибкой первого рода a. Отвержение Н0 означает, что расч не подчиняется закону распределения W( кр). Ошибка b может возникнуть тогда, когда принимается Н0, в то время когда она неверна. bназывается ошибкой второго рода, а (1-b) – мощностью критерия. Если проверяемая гипотеза Н0 сводится к проверке точного равенства, то гипотеза называется простой, в других случаях мы имеем дело сосложной или вложенной гипотезой.
Пример
Первый шаг проверки гипотез об однородности двух выборок выглядит так:
Н0: = , Н1: ¹ .
Здесь Н0 – гипотеза простая, Н1 – гипотеза сложная (вложенная).