
- •Перевірка статистичних гіпотез
- •Непараметрическая статистика
- •Краткий обзор непараметрических процедур
- •Описание непараметрических процедур на примерах
- •Наблюдаемые частоты в сравнении с ожидаемыми
- •Критерий серий Вальда—Вольфовица
- •Двухвыборочный критерий Колмогорова—Смирнова
- •Пример. Критерий серий Вальда—Вольфовица, Манна—Уитни u-критерий, двухвыборочный критерий Колмогорова—Смирнова
- •Критерий знаков
- •Критерий Вилкоксона
Критерий серий Вальда—Вольфовица
Критерий серий Вальда—Вольфовица представляет собой непараметрическую альтернативу для независимых выборок. Данные имеют тот же вид, что и в t-критерии для независимых выборок. Файл должен содержать группирующую (независимую) переменную, принимающую, по крайней мере, два различных значения (кода), чтобы однозначно определить, к какой группе относится каждое наблюдение в файле данных.
Программа открывает диалоговое окно выбора группирующей переменной и списка зависимых переменных (переменных, по которым две группы сравниваются между собой), а также кодов для группирующей переменной (опция Коды).
Критерий серий Вальда—Вольфовица устроен следующим образом. Представьте, что вы хотите сравнить мужчин и женщин по некоторому признаку. Вы можете упорядочить данные, например, по возрастанию, и найти те случаи, когда субъекты одного и того же пола примыкают друг к другу в построенном вариационном ряде (иными словами, образуют серию).
Если нет различия между мужчинами и женщинами, то число и длина «серий», относящиеся к одному и тому же полу, будут более или менее случайными. В противном случае две группы (мужчины и женщины) отличаются друг от друга, то есть не являются однородными.
Критерий предполагает, что рассматриваемые переменные являются непрерывными и измерены, по крайней мере, в порядковой шкале.
Критерий серий Вальда—Вольфовица проверяет гипотезу о том, что две независимые выборки извлечены из двух популяций, которые в чем-то существенно различаются между собой, иными словами, различаются не только средними, но также формой распределения. Нулевая гипотеза состоит в том, что обе выборки извлечены из одной и той же популяции, то есть данные однородны.
U-критерий Манна—Уитни
Критерий Манна—Уитни представляет непараметрическую альтернативу t-критерию для независимых выборок. Опция предполагает, что данные расположены таким же образом, что в и t-критерии для независимых выборок. В частности, файл должен содержать группирующую переменную, имеющую, по крайней мере, два разных кода для однозначной идентификации принадлежности каждого наблюдения к определенной группе.
Критерий U Манна—Уитни предполагает, что рассматриваемые переменные измерены, по крайней мере, в порядковой шкале (ранжированы). Заметим, что во всех ранговых методах делаются поправки на совпадающие ранги.
Интерпретация теста, по существу, похожа на интерпретацию результатов t-критерия для независимых выборок за исключением того, что U-критерий вычисляется как сумма индикаторов парного сравнения элементов первой выборки с элементами второй выборки.
U-критерий — наиболее мощная (чувствительная) непараметрическая альтернатива t-критерию для независимых выборок; фактически, в некоторых случаях он имеет даже большую мощность, чем t-критерий (см. например, Холлендер М., Вульф Д. А. (1983), Непараметрические методы статистики, а также заметку М. С. Никулина в Энциклопедии: «Вероятность и математическая статистика». С. 299). Формально статистика Манна—Уитни вычисляется как:
где W — так называемая статистика Вилкоксона,
Таким образом, статистика U считает общее число тех случаев, в которых элементы второй группы, например, мужчины, превосходят элементы первой группы, например, женщин.