- •Введение
- •Задания
- •Предварительные понятия и определения
- •Выборка
- •Проверка гипотез
- •Точечное оценивание
- •Доверительное оценивание.
- •Вероятностные модели
- •Первичный статистический анализ
- •Задание 1. Выборочные характеристики.
- •Задание 2. Гистограмма выборки.
- •Задание 3. Эмпирическая функция распределения.
- •Проверка гипотезы о типе распределения
- •Задание 4. Критерий согласия хи-квадрат.
- •Проверка гипотезы однородности
- •Задание 5. Одновыборочный критерий Стьюдента.
- •Задание 6. Критерий знаков.
- •Задание 7. Двухвыборочный критерий Стьюдента.
- •Задание 8. Критерий Вилкоксона.
- •Задание 9. Критерий Фишера. Критерий сравнения дисперсий.
- •Задание 10. Критерий однородности хи-квадрат.
- •Интервальные оценки
- •Задание.
- •Задание 11. Построить интервальную оценку для среднего значения нормального распределения.
- •Задание 12.
- •Задание 13. Построить интервальную оценку для вероятности успеха
- •Доказательство корректности метода II.
- •Исследование зависимости между двумя характеристиками
- •Задание 14. Проверить независимость двух характеристик по критерию сопряженности хи-квадрат
- •Задания 15-16. Проверить независимость двух характеристик по критерию Стьюдента. Построить линии регрессии.
-
Проверка гипотезы однородности
В практике применения методов статистического анализа наиболее востребованы методы сравнения различных совокупностей выборочных данных с целью выяснения их однородности. Например, при исследовании лечебных свойств нового препарата часто требуется
а) сравнить воздействие этого препарата на некоторую характеристику здоровья в одной группе пациентов (– первая выборка) с воздействием старого препарата на ту же характеристику в другой группе пациентов (– вторая выборка), или
б) сравнить характеристики здоровья у пациентов одной группы до лечения (– первая выборка) и после лечения препаратом (– вторая выборка), или
в) сравнить долю выздоровевших пациентов при различных способах лечения.
В общем виде задачу можно сформулировать следующим образом.
Имеются две совокупности выборочных данных. Требуется сравнить их между собой.
Случайные выборки можно сравнить только по их функциям распределения. Таким образом, совпадение совокупностей означает, что они имеют одинаковое распределение или, другими словами, однородны.
Здесь мы изучим 6 критериев сравнения совокупностей. На практике выбор того или иного критерия зависит от ответа на следующие два основных вопроса.
-
Имеют ли выборки нормальное распределение?
-
Можно ли считать наблюдения в различных выборках независимыми?
Задание 5. Одновыборочный критерий Стьюдента.
Постановка задачи.
Двухвыборочный вариант. Имеются две выборки одинакового объема. Известно, что распределения в этих выборках подчинены нормальному закону и, кроме того, каждое -ое наблюдение в 1-ой выборке зависит (в вероятностном смысле) от соответствующего -ого наблюдения во второй выборке. Требуется проверить гипотезу однородности выборок. Точнее, требуется проверить гипотезу о том, что среднее значение разности выборок равно нулю (меньше нуля, больше нуля).
Одновыборочный вариант. Имеется одна выборка из нормального распределения. Требуется проверить гипотезу о том, что среднее значение этого распределения не превосходит заданной величины .
Теоретические основы.
Поскольку каждое значение в одной выборке зависит от значения в другой выборке (например, оба значения суть измерения одной и той же характеристики у одного пациента), то вместо двух измерений рассматривают их разность . Таким образом, если обе выборки получены из нормального распределения, то гипотеза однородности выборок может быть сформулирована в виде
,
где – разность средних значений первой и второй выборок. Альтернатива к нулевой гипотезе чаще всего совпадает с ожиданиями экспериментатора. Например, если выборки представляют собой измерения верхнего артериального давления до и после лечения новым препаратом от гипертонии, то естественно ожидать, что во второй выборке значения будут ниже, чем в первой. В этом случае альтернатива должна иметь вид . С другой стороны, если экспериментатору важен лишь сам факт отличия одной выборки от другой, то следует выбирать двухстороннюю альтернативу вида .
Статистика одновыборочного критерия Стьюдента равна
,
где – выборочное среднее, – выборочная дисперсия (смещенная оценка), вычисленные по разностям – объем выборки. Если справедливо предположение о нормальности распределения и верна нулевая гипотеза, то статистика имеет распределение Стьюдента с -ой степенью свободы (см.введение). В любом учебнике по математической статистике имеются таблицы этого распределения. Следует помнить, что распределение Стьюдента симметрично – , поэтому таблицы построены обычно лишь для входных значений . Таким образом, если – результат вычислений статистики по экспериментальным данным, то критический уровень значимости равен
альтернатива |
критический уровень значимости |
пояснения |
|
||
|
||
|
Из опыта применения этого критерия замечено, что очень часто при вычислении разностей переставляются выборки (вместо вычисляется ), что не является криминалом. Необходимо лишь следить за адекватностью выдвинутой односторонней альтернативы и избранного способа вычисления статистики Стьюдента. Для двухсторонней альтернативы способ вычисления не принципиален.
Замечание. Критерий потому и называется одновыборочным, что по своей сути предназначен для сравнения среднего значения одной нормальной выборки с некоторой нормой . Описанную выше схему с очевидными изменениями можно применить и в этом случае. Например, если перед исследователем стояла задача полного излечения гипертонических больных, то необходимо было бы проверить гипотезу о том, что среднее значение верхнего артериального давления у пациентов, прошедших курс лечения, будет больше 125 при альтернативе меньше 125. Отличие заключается только в том, что вместо разностей следует рассмотреть разности .