- •Раздел 1. Элементы теории вероятностей и математической статистики 2
- •Раздел 2. Основы проверки статистических гипотез 65
- •Раздел 1. Элементы теории вероятностей и математической статистики
- •1. Основные определения и теоремы
- •1.1. Предмет теории вероятности
- •1.2. Событие как результат испытания
- •1.3. Частость и вероятность. Классическое определение вероятности
- •1.4. Теорема сложения вероятностей
- •1.5. Теорема умножения вероятностей
- •2. Повторные независимые испытания
- •2.1. Биномиальное распределение вероятностей
- •2.2. Наивероятнейшее число появлений события
- •2.3. Асимптотическая формула биномиального распределения (локальная терема Лапласа). Формула Пуассона
- •2.4. Интегральная теорема Лапласа
- •Упражнения.
- •3. Случайная величина и ее числовые характеристики
- •3.1. Случайная величина и ее распределение
- •3.2. Математическое ожидание и его свойства
- •3.3. Дисперсия и среднее квадратическое отклонение
- •3.4. Нормальный закон распределения и понятие о теореме Ляпунова
- •4. Закон больших чисел
- •4.1. Неравенства Маркова и Чебышева
- •4.2. Теорема Чебышева
- •5. Основные сведения из математической статистики
- •5.1. Генеральная совокупность и выборка
- •5.2. Устойчивость выборочных средних
- •5.3. Определение параметров выборки с помощью теоремы Ляпунова
- •5.4. Понятие о доверительных границах для средних
- •5.5. Примеры математической обработки данных выборочного наблюдения
- •5.6. Понятие о критериях согласия
- •6. Элементы теории корреляции
- •6.1. Функциональная и корреляционная зависимости
- •6.2. Линейная корреляция.
- •6.3. Коэффициент корреляции
- •6.4. Упрошенный способ вычисления коэффициента корреляции
- •6.5. Простейшие случаи криволинейной корреляции
- •6.6. Понятие о множественной корреляции
- •Упражнения
- •Раздел 2. Основы проверки статистических гипотез
- •1. Статистические модели
- •2. Проверка статистических гипотез (общие положения)
- •3. Примеры статистических моделей и гипотез, ранги и ранжирование
- •4. Проверка статистических гипотез (прикладные задачи)
- •4.1. Схема испытаний Бернулли
- •4.2. Критерий знаков для одной выборки
- •5. Проверка гипотез в двухвыборочных задачах
- •5.1. Критерий Манна-Уитни
- •5.2. Критерий Уилкоксона
- •6. Парные наблюдения
- •6.1. Критерий знаков для анализа парных повторных наблюдений
- •6.2. Анализ повторных парных наблюдений с помощью знаковых рангов (критерий знаковых ранговых сумм Уилкоксона)
- •Список использованной литературы
- •Список рекомендуемой литературы
6. Парные наблюдения
Рассмотренное в предыдущем параграфе сравнение двух совокупностей наблюдений (двух выборок) часто проводится для обнаружения результата какого-либо воздействия (выявления эффекта обработки), либо, напротив, для подтверждения его отсутствия. Чем более однородными окажутся выбранные для эксперимента объекты (для контроля и воздействия), чем меньше их случайные различия, тем точнее (и по меньшему числу наблюдений) можно будет дать ответ на вопрос. Кстати, формирование однородной группы экспериментальных объектов составляет важную и не всегда простую задачу.
Ясно, что различие между объектами, выбранными для воздействия и для контроля (или для двух разных воздействий, если интерес представляет их сопоставление) будет наименьшим, если в обоих качествах выступает один и тот же объект. Если это возможно, то далее обычным порядком мы составляем группу экспериментальных объектов (по-прежнему стремясь к тому, чтобы они были однородны — значение этого выяснится в п. 6.2). Далее для каждого объекта мы измеряем два значения интересующей нас характеристики (например, до воздействия и после или при двух разных воздействиях). Так возникают пары наблюдений и парные данные. Но, конечно, парные данные могут возникать и иначе (скажем, при наблюдениях над близнецами, которые во многих отношениях считаются идентичными).
6.1. Критерий знаков для анализа парных повторных наблюдений
Назначение. Критерий знаков используется для проверки гипотезы об однородности наблюдений внутри каждой пары (иногда говорят — для проверки гипотезы об отсутствии эффекта обработки).
Данные. Рассмотрим совокупность
случайных пар
объема п. Введем величины
Допущения. 1. Все
предполагаются взаимно независимыми.
Заметим, что мы не требуем независимости
между элементами
и
с одинаковым номером i.
Это весьма важно на практике, когда
наблюдения делаются для одного объекта
и тем самым могут быть зависимы.
2. Все zi
имеют равные нулю медианы, т.е.
.
Подчеркнем, что законы распределения
разных zi
могут не совпадать.
Гипотеза. Утверждение об
отсутствии эффекта обработки для
повторных парных наблюдений
можно записать в виде
для всех i= 1,..., n.
Метод. 1. Перейдем от повторных парных наблюдений к величинам , i= 1,..., n, введенным выше.
2. К совокупности , i= 1,..., n применим критерий знаков для проверки гипотезы о равенстве нулю медиан распределений величин , i= 1,..., n (см. п. 4.2).
Приближение для больших совокупностей. Следует воспользоваться нормальной аппроксимацией биномиального распределения.
Связанные данные. Если среди значений есть нулевые, то их следует отбросить и соответственно уменьшить n до числа ненулевых значений .
Оценка эффекта обработки. Нередко
для
рассматривают модель
,
,
где
—
ненаблюдаемые случайные величины,
— некоторая константа, характеризующая
положение одного распределения
относительно другого (скажем, до
воздействия и после). Эту константу
часто именуют эффектом обработки.
Принятые выше допущения 1
и 2 переносятся на величины
.
Гипотеза однородности формулируется
в виде гипотезы о нулевом эффекте
обработки
Введенные величины и представления оказываются полезными, если в ходе проверки гипотезы выясняется, что и что поэтому надо оценить количественно то различие, которое привносит обработка (воздействие).
Пример. Покажем как использовать критерий знаков для анализа данных о времени реакции на звук и на свет. В этом примере рассматривается группа испытуемых, а целью исследования служит проверка гипотезы о равенстве времени реакций на звук и на свет. Порядок организации эксперимента позволяет предположить, что полученные данные на одном испытуемом независимы от аналогичных данных для остальных.
Осуществим переход от пар к величинам , i= 1,..., n и запишем последние в виде: , .
Выполняются ли для сформулированной
задачи допущения, используемые в критерии
знаков? Независимость
обеспечивается условиями организации
эксперимента. Априорно предполагаемая
непрерывность распределений рассматриваемых
выборок обеспечивает непрерывность
распределения
.
В случае совпадения распределений
времени реакции на звук и на свет
справедливо следующее соотношение
.
Следовательно,
,
то есть медиана распределения
равна нулю. Таким образом, предположение
обеспечивает выполнение допущения
2.
Одной из разумных альтернатив нулевой
гипотезе в данном случае является
предположение о том, что
.
Далее мы будем использовать критерий
знаков против этой односторонней
альтернативы.
В табл. 5 приведены соответствующие расчеты для данного примера.
Обозначим число положительных значений через . Из таблицы 5 видно, что равно трем, а среди есть одно значение, равное 0. В таких случаях необходимо уменьшить число наблюдений на число значений , равных 0, т.е. перейти от п = 17 к п = 16.
Вычислим вероятность
.
Для этого воспользуемся таблицами
биномиального распределения при
,
п = 16.
Учитывая, что в силу симметрии при
,
получаем:
То есть минимальный уровень значимости, на котором можно отвергнуть гипотезу о том, что против односторонних альтернатив, равен 0.0106. Учитывая малость этого числа, заключаем, что гипотезу следует отвергнуть в пользу альтернативы .
Таблица 5
i |
xi |
yi |
zi |
S(xi) |
1 |
223 |
181 |
-42 |
- |
2 |
104 |
194 |
90 |
+ |
3 |
209 |
173 |
-36 |
- |
4 |
183 |
153 |
-30 |
- |
5 |
180 |
168 |
-12 |
- |
6 |
168 |
176 |
8 |
+ |
7 |
215 |
163 |
-52 |
- |
8 |
172 |
152 |
-20 |
- |
9 |
200 |
155 |
-45 |
- |
10 |
191 |
156 |
-35 |
- |
11 |
197 |
178 |
-19 |
- |
12 |
183 |
160 |
-23 |
- |
13 |
174 |
164 |
-10 |
- |
14 |
176 |
169 |
-7 |
- |
15 |
155 |
155 |
0 |
0 |
16 |
115 |
122 |
+7 |
+ |
17 |
163 |
144 |
-19 |
- |
Обсуждение. Одно из главных достоинств критерия знаков — его простота. Другой важной особенностью этого критерия являются скромные требования к первоначальному статистическому материалу. Эти требования описываются с помощью модели парных наблюдений.
