Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
пособие_Матем ч4.doc
Скачиваний:
11
Добавлен:
01.03.2025
Размер:
5.37 Mб
Скачать

4.2. Критерий знаков для одной выборки

На изложенном выше способе проверки статистических гипотез в схеме Бернулли основан широко распространенный критерий знаков. Для его применения достаточны очень слабые предположения о закону распределения данных, такие как независимость наблюдений и однозначная определенность медианы. Напомним, что медианой распределения случайной величины называется такое число , для которого .

Предположим, что в результате многочисленных измерений артериального кровяного давления у пациентов некой поликлиники было установлено его медианное значение . Эти измерения возобновились после летних отпусков. У первых N пациентов были зарегистрировано значения давления крови . Можно ли считать, что медианный уровень давления понизился после летнего отдыха?

Как обычно, проще проверить гипотезу о том, что значение медианы не изменилось. При этом надо рассматривать только односторонние альтернативы — в данном случае, левосторонние (как будет описано ниже). Если гипотеза будет отвергнута, это будет означать положительный ответ на поставленный выше вопрос.

Проверка этой гипотезы с помощью критерия знаков проводится следующим образом. Рассмотрим случайную величину . Так как, согласно гипотезе, , то . В выборке , подсчитаем число положительных разностей и обозначим его через S. Для формализации этого алгоритма удобно ввести функцию

Тогда . Случайная величина принимает два значения: 0 и 1. Согласно выдвинутой гипотезе, вероятность каждого из этих значений равна 1/2. Таким образом, видно, что задача сводится к схеме испытаний Бернулли, в которой через S обозначено число «успехов», и следует проверить гипотезу . В нашем примере надо рассматривать левосторонние альтернативы, но вообще альтернативы могут быть как односторонними, так и двусторонними, в зависимости от решаемой задачи.

Отметим важное обстоятельство в приведенном примере. Гипотеза о значении медианы случайной величины, выдвинутая нами первоначально, не определяла однозначно закон распределения X, и тем самым не позволяла вычислить вероятность произвольных значений X. В связи с этим мы были вынуждены перейти к случайной величине , которая задает только знак разности . При этом вероятностное распределение определяется уже однозначно. Изложенный критерий получил название критерия знаков, так как он работает фактически только со знаками преобразованных некоторым образом случайных величин. Этот критерий хорош именно тем, что требует очень немногого от функции распределения случайной величины и очень прост в применении.

5. Проверка гипотез в двухвыборочных задачах

Область применения. Рассмотрим часто встречающуюся на практике задачу сравнения двух выборочных совокупностей. В духе основной статистической предпосылки мы будем рассматривать эти совокупности как случайные. Например, нас может интересовать сравнение двух методов обработки, т.е. двух разных действий, направленных к одной цели: двух лекарств, двух рационов питания, двух методик обучения или профессиональной подготовки и т.д.

Данные. Для исследования нужны однородные объекты, разделенные на две группы. Взаимные влияния и взаимодействия объектов должны быть исключены. Для каждого объекта регистрируется некоторая его числовая характеристика. Возникающие при этом две группы чисел можно рассматривать как две независимые выборки.

Постановка задачи. Рассмотрим вопрос о том, какие задачи целесообразно рассматривать при сравнении двух выборок. Вспомним, что обычно две выборки получаются как характеристики двух обработок, то есть как результаты применения различных условий эксперимента к двум группам однородных объектов. Опыт применения статистики показывает, что изменение условий эксперимента обычно сказывается прежде всего на изменении положения распределения измеряемой числовой характеристики на числовой прямой. Масштаб и форма распределения при малых изменениях условий эксперимента обычно остаются практически неизменными. При больших различиях в условиях эксперимента наряду с изменением положения распределения изменяется и его разброс (дисперсия). И совсем редко происходит изменение самой формы распределения. Поэтому при исследовании различий в двух выборках часто предполагают, что законы распределения двух анализируемых выборок отличаются только сдвигом, т.е. принадлежат сдвиговому семейству распределений.

Определение. Распределение G(x) принадлежит сдвиговому семейству распределений F, задаваемому распределением F(x), если существует такая , что для любого .

Другими словами, если случайная величина имеет распределение F(x), то распределение G(x) случайной величины принадлежит сдвиговому семейству F тогда и только тогда, когда для некоторого неслучайного числа распределения случайных величин и совпадают.

Для некоторых сдвиговых семейств (например, для семейства, порожденного нормальным распределением) построены весьма эффективные критерии для проверки гипотезы Н против альтернатив сдвига . Однако эти критерии предполагают, что F и G принадлежат определенному семейству, а поэтому могут давать неправильные результаты при невыполнении этого условия. Другой класс критериев — непараметрические критерии, — не требует этого предположения. Такие критерии не зависят от распределений F и G (если эти распределения непрерывны), и эффективно работают при более широком классе альтернатив. В частности, с их помощью можно найти различия в случайных величинах при альтернативах и . Дадим определения этих понятий.

Определение. Мы говорим, что , где F и G — функции распределения, если для любого числа х выполняется . Мы говорим, что , если для любого числа х выполняется .

Смысл этого определения состоит в том, что при случайная величина X, имеющая закон распределения F, имеет тенденцию принимать меньшие значения, чем случайная величина Y с законом распределения G, т.е. для любого х выполняется .

Методы. Ниже мы расскажем, как проверить однородность двух выборок с помощью критерия Манна-Уитни или критерия Уилкоксона.