- •Лекция 4
- •НУЛЕВАЯ ГИПОТЕЗА
- •СТАТИСТИЧЕСКАЯ ЗНАЧИМОСТЬ
- •ОШИБКИ ПЕРВОГО И ВТОРОГО РОДА
- •МЕТОДЫ АНАЛИЗА РАЗ
- •Возможные варианты различий средних между группами
- •Чтобы оценить величину различий, нужно каким-то
- •Дисперсию совокупности можно оценить двумя
- •Если верна нулевая гипотеза, то как внутригрупповая, так и межгрупповая дисперсии служат оценками
- •Критическое значение F
- •Межгрупповое число степеней свободы —
- •Дисперсионный анализ, в котором проверяется влияние одного фактора, называется однофакторным. При изучении
- •Итак, на наш вопрос можно ли считать различия в длительности госпитализации случайными мы
- •КРИТЕРИЙ СТЬЮДЕНТА
- •Для двух случайных выборок извлеченных из одной
- •Критические значения t (подобно критическим значениям F они сведены в таблицу) зависят не
- •Ошибки в использовании критерия Стьюдента
- •АНАЛИЗ КАЧЕСТВЕННЫХ ПРИЗНАКОВ
- •СРАВНЕНИЕ ДОЛЕЙ
- •Таблицы сопряженности: кр
- •Критерии χ2
- •Критическое значение χ2 для 5% уровня
- •Точный критерий Фишера
- •НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ
- •Параметрические и непараметрические
- •Непараметрические
- •ВЫВОДЫ
СРАВНЕНИЕ ДОЛЕЙ
Критерий z, аналогичный критерию Стьюдента t:
О статистически значимом различии долей можно
говорить, если значение z окажется «большим». С
такой же ситуацией мы имели дело, рассматривая критерии Стьюдента. Отличие состоит в том, что t
подчиняется распределению Стьюдента, а z —
стандартному нормальному распределению.
Таблицы сопряженности: кр
Будем рассматривать не долю, а число больных с тромбозом. Занесем результаты испытания в таблицу. Для каждой из групп укажем число больных с
тромбозом и без тромбоза. У нас два признака:
препарат (аспирин—плацебо) и тромбоз (есть—нет); в
таблицеуказаны все их возможные сочетания, поэтому такая таблица называется таблицей сопряженности. В данном случае размер таблицы
2×2
Критерии χ2 |
для таблицы 2×2 |
|
Критерий χ2 |
(читается «хи-квадрат») не |
|
требует |
никаких |
предположений |
относительно |
параметров |
совокупности, из |
которой извлечены выборки, — это непараметрический
где О — наблюдаемое число в клетке таблицы сопряженности, Е — ожидаемое число в той же клетке. Суммирование проводится по всем клеткам таблицы. Как видно из формулы, чем больше разница наблюдаемого и ожидаемого числа, тем больший вклад вносит клетка в
Критическое значение χ2 для 5% уровня
значимости для таблиц сопряженности размером 2×2 - 3,84.
В примере с тромбозом шунта мы получили значение 7,10, поэтому мы отклоняем гипотезу об отсутствии
связи между приемом аспирина и образованием |
|||
Применениет омбов. |
критерия χ2 |
правомерно, |
если |
ожидаемое |
число в любой из |
клеток больше |
или |
равно 5 (в противном случае мы вынуждены
использовать точный критерий Фишера). размеров
Критическое значение χ2 зависит от
таблицы сопряженности, то есть от числа сравниваемых методов лечения (строк таблицы) и числа возможных исходов (столбцов таблицы). Размер таблицы выражается числом степеней свободы ν:
ν = (r – 1)(c – 1),
где r — число строк, а с — число столбцов.
Точный критерий Фишера
Критерий χ2 годится для анализа таблиц
сопряженности 2×2, если ожидаемые значения в любой из ее клеток не меньше 5. Когда число наблюдений невелико, это условие не выполняется и
критерий χ2 неприменим. В этом случае используют
точный критерий Фишера. Он основан на переборе всех возможных вариантов заполнения таблицы сопряженности при данной численности групп, поэтому, чем она меньше, тем проще его применить.
Нулевая гипотеза состоит в том, что между лечением и исходом нет никакой связи.
НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ
Природа порядковых признаков такова, что о двух значениях можно сказать лишь, какое больше или меньше, но в принципе нельзя — на сколько или во сколько раз. (Любой количественный признак можно рассматривать как порядковый, но не наоборот.)
Первое, что следует сделать при анализе таких
признаков, это перейти к их рангам — номерам, под
которыми будут стоять исходные данные, если выстроить их по возрастанию. Критерии, основанные на рангах, не нуждаются в предположениях о типе распределения. Единственное требование состоит в
том, чтобы тип распределения в сравниваемых совокупностях был одинаковым. При этом не нужно знать, что это за распределение и каковы его параметры.
Параметрические и непараметрические
методы.
Какой выбрать?
Непараметрические методы, которые мы рассмотрим в этой главе, заменяют реальные значения признака рангами. При этом мы сохраняем большую часть информации о распределении, но избавляемся от необходимости знать, что это за распределение. Нас
не интересуют более параметры распределения,
отпадает и необходимость равенства дисперсий.
Остается в силе только предположение, что тип
распределения во всех случаях одинаков. Если выполняется условие нормальности распределения, параметрические критерии обеспечивают наибольшую чувствительность. Если же это условие не выполняется хотя бы приблизительно, их чувствительность существенно снижается и непараметрические критерии дают больше шансов
выявить реально существующие различия.
Непараметрические
критерии
СРАВНЕНИЕ ДВУХ ВЫБОРОК: КРИТЕРИЙ МАННА—УИТНИ
СРАВНЕНИЕ НАБЛЮДЕНИЙ ДО И ПОСЛЕ ЛЕЧЕНИЯ:
КРИТЕРИЙ УИЛКОКСОНА
СРАВНЕНИЕ НЕСКОЛЬКИХ ГРУПП:
КРИТЕРИЙ КРУСКАЛА-УОЛЛИСА
ПОВТОРНЫЕ
ИЗМЕРЕНИЯ:
КРИТЕРИЙ
ФРИДМАНА
ВЫВОДЫ
Обратите внимание, что, оперируя не данными, а рангами, рассмотренные методы строятся, в сущности, по тому же принципу, что и рассмотренные ранее пераметрические, такие, как критерий Стьюдента и дисперсионный анализ. Заменив данные рангами, мы делаем следующее.
•Формулируем нулевую гипотезу, то есть предполагаем, что наблюдаемые различия случайны.
•Выбираем критерий, то есть числовое выражение различий.
•Определяем, каким было бы распределение величины критерия при условии справедливости нулевой гипотезы.
•Находим критическое значение, то есть величину, которую при справедливости нулевой гипотезы значение критерия превышает достаточно редко (точнее, с вероятностью, равной уровню значимости α).
•Вычисляем значение критерия для наших данных и сравниваем его с критическим: если вычисленное значение больше, признаем различия статистически значимыми.
Выбор между параметрическими и непараметрическими методами определяется прежде всего характером данных. Имея дело с порядковыми признаками, не остается ничего, кроме как воспользоваться непараметрическими методами. Если признак числовой, стоит подумать, нормально ли его распределение. Тут могут помочь как общие соображения, так и графическое представление
данных. Даже если нет веских оснований сомневаться в нормальности