Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Презентации по математике / Лекции 2 семестр / Элементы мат.статистики.doc
Скачиваний:
271
Добавлен:
11.02.2015
Размер:
2.3 Mб
Скачать

Непараметрические критерии

Правильное применение параметрических критериев для проверки статистических гипотез основано на предположении о нормальном распределении совокупностей, из которых взяты сравниваемые выборки. Однако это не всегда имеет место, так как не все биологические признаки распределяются нормально. Немаловажным является и то обстоятельство, что исследователю приходится иметь дело не только с количественными, но и с качественными признаками, многие из которых выражаются порядковыми номерами, индексами и другими условными знаками. В таких случаях необходимо использовать непараметрические критерии.

Известен целый ряд непараметрических критериев, среди которых видное место занимают так называемые ранговые критерии, применение которых основано на ранжировании членов сравниваемых групп. При этом сравниваются не сами по себе члены ранжированных рядов, а их порядковые номера, или ранги. Далее мы рассмотрим некоторые непараметрические критерии, применяемые для проверки нулевой гипотезы при сравнении как независимых, так и зависимых выборочных групп.

- критерий Уилкоксона (Манна—Уитни). Гипотезу о принадлежности сравниваемых независимых выборок к одной и той же генеральной совокупности или к совокупностям с одинаковыми параметрами, т. е. Н0-гипотезу, можно проверить с помощью рангового критерия Уилкоксона (МаннаУитни).

Для расчета -критерия необходимо:

1. Расположить числовые значения сравниваемых выборок в возрастающем порядке в один общий ряд и пронумеровать члены общего ряда от 1 до . (Эти номера и будут «рангами» членов ряда.)

2. Отдельно для каждой выборки найти суммы рангов и определить величины,

и

которые отображают связь между суммами рангов первой и второй выборки.

3. В качестве -критерия использовать меньшую величину , которую сравнить с табличным значением Условием для сохранения принятой Н0-гипотезы служит неравенство >. Критические точки -критерия для п1, п2 и принимаемого уровня значимости α содержатся в таблице 3 Приложения.

Пример 3. На двух группах лабораторных мышей – опытной (п1 = 9) и контрольной (п2 = 11) – изучали воздействие на организм нового препарата. Испытание продолжалось один месяц. После этого масса тела животных, выраженная в граммах, варьировала следующим образом:

В опытной группе 80, 76, 75, 64, 70, 68, 72, 79, 83.

В контрольной группе 70,78, 60, 80, 62, 68, 73, 60, 71, 66, 69.

Вычислим по выборкам: =74,1 и =68,8.

Проверим с помощью -критерия, является ли разность в массе тела между опытной и контрольной группами мышей статистически достоверной. Для этого обратимся к табл. 3, в которой содержатся расположенные в возрастающем порядке числовые значения сравниваемых выборок и их ранги.

Таблица 3.

В данном случае N=9+11 = 20.

Суммируя ранги отдельно для каждой группы, находим:

R1= 4+6+9+12+14+15+17+19+20=112;

R2= 1+2+3+5+7+8+10+11+13+16+18=94.

Подставляем эти данные в формулы:

;

Меньшую величину U2 = 22 сравниваем с табличным значением для п1=9, п2=11 и уровня значимости α=0,01, которое равно =19 (см. табл. 3 Приложения).

Поскольку >, отвергнуть проверяемую Н0-гипотезу нельзя. Следовательно, различия, наблюдаемые между этими выборками, статистически недостоверны. Выборки не имеют значимых отличий.

Критерий знаков z. В тех случаях, когда результаты наблюдений выражаются не числами, а качественными признаками, принимающими два различных значения (помечаем их знаками плюс (+) и минус (—)), различия между попарно связанными членами сравниваемых выборок оценивают с помощью критерия знаков z. Конструкция этого критерия базируется на весьма простых соображениях: если попарно сравниваемые значения двух зависимых выборок существенно не отличаются друг от друга, то число плюсовых и минусовых разностей окажется совершенно одинаковым; если же заметно преобладают плюсы или минусы, это будет указывать на положительное или отрицательное действие изучаемого фактора на результативный признак. Большее число однозначных разностей служит в качестве фактически найденной величины z-критерия знаков. При этом нулевые разности, т. е. случаи, не давшие ни положительного, ни отрицательного результата, обозначаемые цифрой 0, в расчет не принимают и число парных наблюдений соответственно уменьшается.

Как и всякий другой выборочный показатель, z-критерий знаков является величиной случайной; он служит для проверки Н0-гипотезы, т. е. предположения о том, что совокупности, из которых взяты сравниваемые выборки, имеют одинаковые функции распределения. Н0-гипотеза отвергается, если zф zkp для принятого уровня значимости α и числа парных наблюдений п, взятых без нулевых разностей. Критические точки zkp для двух уровней значимость и числа парных наблюдений содержатся в табл. 4 Приложения.

Пример 4. Изучали влияние туберкулина на состав крови низших обезьян. Результаты наблюдения приведены в табл. 4.

Таблица 4.

Из табл. 4 видно, что после введения туберкулина количество эозинофилов в крови у большинства обезьян оказалось пониженным. Так, из 14 наблюдений две оказались нулевыми, т. е. n = 14—2=12. Из этого числа положительных разностей насчитывается 10. Следовательно, zф =10. По табл. 4 Приложения для n=12 и α =5% находим zkp =11. Равенство zф= zkp дает основание отвергнуть H0-гипотезу на 5%-ном уровне значимости. Следовательно, с вероятностью 95% можно утверждать, что введение туберкулина (реакция Манту) вызывает заметное снижение эозинофилов в крови обезьян.

Коэффициент корреляции Спирмена. Допустим, что объекты генеральной совокупности обладают двумя качественными признаками. Напомним, что под качественным подразумевается признак, который невозможно измерить точно, но он позволяет сравнивать объекты между собой. Следовательно, можно расположить их в порядке убывания или возрастания качества. Для определенности будем всегда располагать объекты в порядке ухудшения качества. При таком «ранжировании» на первом месте находится объект наилучшего качества по сравнению с остальными; на втором месте окажется объект «хуже» первого, но «лучше» других, и т. д.

Пусть выборка объема n содержит независимые объекты, которые обладают двумя качественными признаками A и В. Для оценки степени связи признаков вводят, в частности, коэффициенты ранговой корреляции Спирмена (изложен в настоящем параграфе) и Кендалла (см. далее).

Расположим сначала объекты выборки в порядке ухудшения качества по признаку А при допущении, что все объекты имеют различное качество по обоим признакам (случай, когда это допущение не выполняется, рассмотрим ниже). Припишем каждому объекту ранг, равный порядковому номеру объекта. Например, ранг объекта, занимающего первое место x1 = 1; объект, расположенный на втором месте, имеет ранг х2 = 2, и т. д. В итоге получим последовательность рангов по признаку А: х1=1, х2 = 2, ..., хn =n.

Расположим теперь объекты в порядке убывания качества по признаку В и припишем также каждому из них ранг, равный порядковому номеру объекта по признаку А. Например, запись y2 = 5 означает, что по признаку А объект стоит на втором месте, а по признаку В—на пятом.

В итоге получим две последовательности рангов:

по признаку А . x1, xt,. . ., хп

по признаку В. у1, у2, . .., уп.

На практике чаще будет встречаться промежуточный случай, когда ухудшение качества по одному признаку влечет для некоторых объектов ухудшение, а для других— улучшение качества. Задача состоит в том, чтобы оценить связь между признаками. Для ее решения рассмотрим ранги x1, х2, ..., хп как возможные значения случайной величины X, a у1, у2, . .., уп — как возможные значения случайной величины Υ. Таким образом, о связи между качественными признаками А и В можно судить по связи между случайными величинами X и Υ, для оценки которой используем коэффициент корреляции.

Подробнее о коэффициент корреляции мы будем говорить в следующей теме, а пока запишем выборочный коэффициент ранговой корреляции Спирмена (без вывода формулы):

где di = xi yi.

Замечение. Если выборка содержит объекты с одинаковым качеством, то каждому из них приписывается ранг, равный среднему арифметическому порядковых номеров объектов. Например, если объекты одинакового качества по признаку А имеют порядковые номера 5 и 6, то их ранги равны x5= (5+6)/2 = 5,5; x6=5,5.

Приведем свойства выборочного коэффициента корреляции Спирмена.

Свойство 1. Если между качественными признаками А и В имеется «полная прямая зависимость» в том смысле, что ранги объектов совпадают при всех значениях i, то выборочный коэффициент ранговой корреляции Спирмена равен единице.

Свойство 2. Если между качественными признаками A и В имеется «противоположная зависимость» в том смысле, что рангу х1 = 1 соответствует ранг у1 = п; …, рангу хп = п соответствует ранг уп= 1, то выборочный коэффициент ранговой корреляции Спирмена равен минус единице.

Свойство 3. Если между качественными признаками А и В нет ни «полной прямой», ни «противоположной» зависимостей, то коэффициент ρв заключен между — 1 и + 1, причем чем ближе к нулю его абсолютная величина, тем зависимость меньше.

Правило. Для того чтобы при уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента ранговой корреляции ρг Спирмена, надо вычислить критическую точку:

где n — объем выборки, ρв —выборочный коэффициент ранговой корреляции Спирмена, t — критическая точка, которую находят по таблице распределения Стьюдента, по уровню значимости α и числу степеней свободы k = n2.

Если |ρв| < Tkp —нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками незначима.

Если |ρв| > Tkp — нулевую гипотезу отвергают. Между качественными признаками существует значимая ранговая корреляционная связь.

Пример 5. Найти выборочный коэффициент ранговой корреляции Спирмена по данным ранга объектов выборки объема n=10:

Экстерьер собаки xi 1234567 8 910

Выполнение команд хозяина yi 6 4 8 1 2 5 10 3 7 9

Найдем разности рангов

di = —5,—2,—5, 3, 3, 1, —3, 5, 2, 1.

Вычислим сумму квадратов разностей рангов:

= 25+4+25+9+9+1+9+25+4+1 = 112.

Найдем искомый коэффициент ранговой корреляции, учитывая, что n= 10:

Найдем критическую точку двусторонней критической области распределения Стьюдента по уровню значимости α = 0.05 и числу степеней свободы k = n—2=10—2 = 8: t = 2,31.

Найдем критическую точку: Tkp = 2,31*10*0,24=0,79.

Так как ρв < Tкр — нет основании отвергнуть нулевую гипотезу; ранговая корреляционная связь между признаками незначимая. Следовательно, связь между экстерьером и послушанием собаки не является значимой.

Наряду с коэффициентом ранговой корреляции Спирмена применяют и другие, например, коэффициент Кендалла.