Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
АОЭД / Лабораторная работа №2.doc
Скачиваний:
34
Добавлен:
27.04.2015
Размер:
1.5 Mб
Скачать

Министерство образования и науки Российской Федерации

Марийский государственный технический университет

Кафедра РТиМБС

Методические указания

к выполнению лабораторной работы №2

по дисциплине

“Автоматизация обработки экспериментальных данных”

Изучение непараметрических методов оценки значимости различий для независимых и связанных выборочных совокупностей

г. Йошкар-Ола

2006 г.

Цель работы: Изучить основные непараметрические методы оценки значимости различий для независимых и зависимых (связанных) выборочных совокупностей. Рассмотреть применение непараметрических критериев на практике для вычисления статистической значимости (существенности) различия двух связанных между собой или независимых совокупностей наблюдений. Провести сравнительный анализ рассмотренных методов.

1. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ

1.1. Общие замечания

Важным достоинством ряда непараметрических методов является и то, что они могут быть приложимы не только к совокупностям, имеющим строго количественное выражение, но и к совокупностям полуколичественного, порядкового характера.

Еще одной положительной стороной большинства методов непараметрической статистики является их относительная простота, отсутствие необходимости производить сложные расчеты. Это в сочетании с достаточной мощностью (чувствительностью) непараметрических критериев дает им значительное преимущество по сравнению с параметрическими критериями.

Непараметрические методы, прежде всего, могут быть использованы для характеристики одной совокупности наблюдений, когда к этой совокупности нельзя применить параметрические методы. Непараметрические критерии, кроме того, находят широкое применение для вычисления статистической значимости (существенности) различия двух связанных между собой или независимых совокупностей наблюдений. При этом одни критерии способны обнаруживать различия между совокупностями преимущественно по центральной тенденции (т. е. по величине средних значений), а другие учитывают также и рассеяние отдельных значений совокупностей.

Оценку существенности различия сравниваемых выборочных совокупностей с помощью непараметрических критериев следует производить, во-первых, в случаях, когда неприменимы параметрические критерии (полуколичественный характер наблюдений, отклонение от нормального закона распределения) и, во-вторых, в целях экономии времени и труда при вычислениях. В последнем случае целесообразно первоначально использовать как бы в качестве “экспресс-метода” наиболее простой из применимых в данной ситуации непараметрических критериев. Если примененный критерий опровергает нулевую гипотезу, то на этом анализ заканчивается. Если же нулевая гипотеза этим критерием не опровергается, то следует воспользоваться для ее проверки более сложным (но и обладающим, как правило, большей статистической мощностью) непараметрическим критерием данной группы.

1.2. Непараметрические критерии различия для двух независимых выборочных совокупностей.

Сравниваемые наблюдения в этом случае являются не связанными между собой (различные группы больных, опытная и интактная группы лабораторных животных, опытные и контрольная серии экспериментальных исследований и т.п.); сопоставляемые выборки могут иметь неодинаковую численность. При сравнении двух независимых выборочных совокупностей могут выявиться различия в их среднем значении (центральной тенденции), а также в характере рассеяния вариант (функции распределения).

Существующие непараметрические критерии позволяют обнаружить различия между двумя выборками либо преимущественно по центральной тенденции, либо по любым различиям в сравниваемых распределениях.

К первой группе критериев различия относятся (в порядке возрастания мощности) критерий Вилкоксона для независимых совокупностей, критерий инверсий (Uкритерий Мэнна и Уитни) и критерий X ван дер Вардена.

Из непараметрических критериев второй группы в настоящем разделе описываются серийный критерий Вальда — Вольфовица и критерий Колмогорова — Смирнова для двух совокупностей.

Критерий Вилкоксона для независимых совокупностей является наиболее простым критерием данной группы. Для его применения необходимо построить из вариант сравниваемых выборок единый ранжированный ряд и подсчитать сумму рангов вариант каждой выборки. Меньшая сумма (Т) оценивается по таблице критических значений Т. Если найденная величина Т равна или больше Т05, то принимается нулевая гипотеза, если Т < Т05—нулевая гипотеза отвергается, и различие между сравниваемыми совокупностями по центральной тенденции признается значимым с соответствующей вероятностью ошибки (5%). Так как с табличными значениями Т должна сравниваться меньшая сумма рангов, следует убедиться, что найденная величина Т действительно является наименьшей. Это можно сделать, определив после нахождения Т величину

где п = пх + пучисло наблюдений в обеих выборках. Если вычисленное значение Т меньше, чем Т, его и следует оценивать по таблице 3 приложения.

Пример 1. Имеются данные об уровне максимального артериального давления (в мм рт. ст.) через 6 часов после стоматологических операций, произведенных у двух групп больных: у группы больных с менее выраженной реакцией на адреналин, содержащийся в анестезирующем растворе (пх = 5), и у группы больных с более выраженной реакцией (пу = 7).

Необходимо определить, являются ли в среднем различия между уровнями артериального давления у больных обеих групп статистически значимыми (таблица 1):

Таблица 1

X

100

110

120

120

135

y

115

125

135

140

160

170

180

Rx

1

2

4

5

7,5

Ry

3

6

7,5

9

10

11

12

Tx=19,5 Ty=58,5

Критические значения Т при пх5 и пу = 7 (или наоборот) равны T05 = 20, Т01 = 17.

Вывод: так как полученная величина Тх < Т05, различия в среднем уровне артериального давления у больных сравниваемых групп можно признать значимыми.

Критерий инверсий (Uкритерий Мэнна и Уитни) является более мощным по сравнению с предыдущим критерием этой группы. Сущность критерия заключается в том, что в ранжированном ряду, составленном из двух сравниваемых выборок, определяется число вариант выборки х, предшествующих каждой из вариант выборки у, т. е. находится число инверсий у по х или, наоборот, х по у. Меньшая сумма инверсии U оценивается по таблице с избранным уровнем значимости.

Для использования критерия инверсий необходимо:

1) объединить варианты сравниваемых выборочных совокупностей в единый ранжированный ряд.

2) обозначить варианты одной выборки буквами х, а другой — у (при недостаточной непрерывности значений признака и наличии одинаковых вариант в обеих выборках следует обеспечить случайный порядок расположения их в ранжированном ряду;

3) подсчитать, какое число вариант, обозначенных буквой х, предшествует каждой из вариант, обозначенных буквой у, т. е. определить сумму инверсий у по х.

4) проверить, является ли полученная сумма инверсий меньшей в данном ряду, т. е. величиной U, для чего найти сумму инверсий х по у (так же, как указано в пункте 3) или по формуле

где пх и nyчисленности сравниваемых выборок, а Uнайденная ранее сумма инверсий;

5) меньшую сумму инверсий — U оценить с помощью таблицы 4 или таблицы 5 приложения или специальной формулы (в зависимости от объема выборок пх и пу и избранного уровня значимости) для принятия или отклонения нулевой гипотезы.

Рассмотрим применение критерия инверсий при различном числе наблюдений.

а) Выборки пх 8 и пу8.

По данным объединенного вариационного ряда находим меньшую сумму инверсий U и сравниваем ее с критическими значениями.

Для примера используем данные из предыдущего примера (см. пример 1).

Располагаем величины артериального давления у больных групп х и у в единый ранжированный вариационный ряд:

100 110 115 120 120 125 135 135 140 160 170 180

х х у х х у у х у у у у

Определяем число инверсий у по х.

Значение у— 115 дает две инверсии (с х = 100 и х= 110), значение у= 125 — четыре инверсии (с х = 100, х = ПО, х = 120 и х = 120), у = 135 также дает 4 инверсии, значения у, равные 140, 160, 170 и 180, дают по 5 инверсий каждое. Таким образом, сумма инверсий у по х составляет 30:

варианты — х х у х х у у х у у у у

инверсии

у по х — 2 4 4 5 5 5 5 U = 30.

Поскольку в объединенном ряду значения х чаще предшествовали значениям у, чем наоборот, можно ожидать, что сумма инверсий х по у () будет меньше полученной величины U=30:

Найдем эту сумму как дополнение к U:=5

Меньшая сумма инверсий, т. е. подлинное значение U, равна 5.

При nх = 5 и ny = 7 критические значения U составляют: U05 = 6. Поскольку найденная величина U<U05, различия между средними значениями выборок х и у признаются статистически достоверными (вероятность ошибки меньше 5%).

б) При достаточно объемистых выборках, даже при nx и ny<20, расчет величины U представляет значительные трудности, поэтому он может быть упрощен путем использования сумм рангов объединенного ряда х и у. С этой целью применимы формулы:

или

где Тхсумма рангов вариант X, а Tyсумма рангов вариант У.

в) Большие выборки: пх(пу) > 20.

Доказано, что с увеличением объема выборок распределение величин U быстро приближается к нормальному со средней

и средним квадратическим отклонением

Поэтому для оценки значимости различия сравниваемых выборок может быть вычислена случайная переменная и по формуле:

Определенным недостатком критерия инверсий является то, что он применим только к совокупностям непрерывных вариант. Это ограничение практически лишает нас возможности использовать критерий для оценки различия совокупностей полуколичественных данных, которые нередко встречаются в медицинских исследованиях. Приходится испытывать затруднения и в применении критерия к количественным выборкам, содержащим одинаковые варианты

Три рассмотренных выше критерия позволяют различить сравниваемые выборочные совокупности по их средним значениям, центральной тенденции. Однако применение этих критериев не всегда дает исследователю достаточную информацию, поскольку его могут интересовать различия между выборками не только в средних значениях, но и в степени рассеяния вариант, форме распределения и других признаках.

Действительно, в практике медицинских исследований нередко встречаются случаи, когда совокупности сравниваемых наблюдений с весьма близкими средними значениями существенно различаются по другим свойствам. Для выявления различия двух сравниваемых независимых выборок как по их средним значениям, так и по другим характеристикам распределения, применяются непараметрические критерии следующей группы: серийный критерий и критерий Колмогорова — Смирнова.

Серийный критерий Вальда — Вольфовица (критерий итераций для двух выборочных совокупностей) целесообразно использовать для статистической оценки различия выборок значений количественных признаков сравнительно небольшого объема (до нескольких десятков наблюдений в каждой).

Применение этого критерия основано на предположении о том, что в случае принадлежности сравниваемых выборок к одной совокупности (т. е. при отсутствии между ними значимых различий) составляющие их варианты при объединении в общий ранжированный ряд будут чередоваться, образуя большое число серий (итераций). Наоборот, при наличии между выборками значимых различий чередование вариант в объединенном ряду будет наблюдаться редко и, следовательно, образовавшееся при этом число серий не будет большим.

Для заключения о наличии или отсутствии значимых различий между сопоставляемыми выборочными совокупностями число серий r, полученное в результате объединения вариант обеих выборок в один ранжированный ряд, сравнивается с критическим значением r05 из таблицы 6 приложения. Если r равно или больше табличного значения r05, признается справедливой нулевая гипотеза. Если r < r05различия между выборками следует считать статистически значимыми с вероятностью ошибки не более 5%.

Пример 2. Изучалось влияние на величину веса щитовидной железы белых крыс “сшибки” их нервной деятельности, вызывавшейся раздражением животных во время кормления (в течение 18 дней) слабым электрическим током. Авторами получены следующие данные о весе (в мг) щитовидной железы указанных животных и животных контрольной группы, не подвергавшихся раздражению:

Подопытные животные (х) — 16, 21, 16, 16, 35, 24, 23, 23, 16, 22; пх = 10.

Контрольные животные (у)19, 10, 12, 13, 9, 8, 15, 13, 12,11, 17; ny= 11.

Применяя серийный критерий, определим, являются ли различия в весе щитовидной железы животных сравниваемых групп статистически значимыми.

Расположим имеющиеся значения веса в порядке их возрастания в виде одного ряда. Для наглядности значения веса железы подопытных и контрольных животных укажем в разных строках:

х- 16, 16, 16, 16 21, 22, 23, 23, 24, 25

у-8. 9, 10, 11, 12, 12, 13, 13, 15 17, 19

В образовавшемся ряду имеются четыре последовательных серии (итерации) значений, принадлежащих к разным выборкам, т. е. r=4. При nx=10 и ny=11, критическое значение числа серий r05 = 7.(см. табл. 6 приложения)

Вывод: так как полученное число серий r<r05, различия между весом щитовидной железы у подопытных и контрольных крыс следует признать неслучайными.

Серийный критерий может применяться для сравнения выборочных совокупностей, при отсутствии в них одинаковых вариант. В противном случае необходимо использовать для их статистической обработки другой непараметрический метод — критерий Колмогорова — Смирнова.

Разобранная методика применения серийного критерия возможна при числе наблюдений в каждой выборке не более 20.

Установлено, что в случаях, когда в одной или обеих выборках п > 20, значения r распределяются почти нормально со средним значением

и средним квадратическим отклонением равным:

?

где а = 2пхпу, b = пх + пу.

Вычисляя случайную переменную по формуле:

принимаем нулевую гипотезу, если и1,96, и отвергаем ее с уровнем значимости 5%, если u> 1,96 и с уровнем значимости 1%, если и 2,58.

Критерий Колмогорова — Смирнова в применении к двум сравниваемым выборочным совокупностям позволяет выяснить различия в характере распределения этих совокупностей. Так же как серийный критерий, он применим к случайным выборкам с непрерывными значениями изучаемого признака, однако требования к отсутствию повторяемости вариант в сравниваемых выборках у него менее строги. Вместе с тем, критерий Колмогорова — Смирнова является более мощным критерием, особенно эффективным при достаточно большом числе (несколько десятков) наблюдений.

Пример 3.

Изучалось влияние на поглотительные способности ретикулоэндотелиальной системы витамина В12, определялась величина конгорот-индекса у кроликов после 8-дневного введения препарата витамина В12 (подопытная группа) и физиологического раствора (контрольная группа).

Были получены следующие данные о величине конгорот-индекса (в %):

Подопытная группа (х) —28, 29, 33, 34, 35, 36, 39, 48, 50, 53, 54, 57, 59; пх=13.

Контрольная группа (у) —40, 48, 50, 50, 51, 53, 55, 59, 60, 60, 62, 84; пу=12.

Таблица 2

Оценка с помощью критерия Колмогорова — Смирнова различия в характере распределения значений конгорот-индекса у кроликов, получавших витамин В12 (первая группа) и физиологический раствор (вторая группа)

Значения конгорот-индекса (%) встречающиеся в обеих группах животных

Частоты этих значений по группам

Накопленные частоты по группам

Функции распределения (накопленные частости) по группам

Абсолютные разности функций распределения

28

1

0

1

0

0,077

0,000

0,077

29

1

0

2

0

0,154

0,000

0,154

33

1

0

3

0

0,231

0,000

0,231

34

1

0

4

0

0,307

0,000

0,307

35

1

0

5

0

0,385

0,000

0,385

36

1

0

6

0

0,461

0,000

0,461

39

1

0

7

0

0,538

0,000

D=0,538

40

0

1

7

1

0,538

0,083

0,455

48

1

1

8

2

0,615

0,166

0,449

50

1

2

9

4

0,692

0,333

0,359

51

0

1

9

5

0,692

0,417

0,275

53

1

1

10

6

0,769

0,500

0,269

54

1

0

11

6

0,846

0,500

0,346

55

0

1

11

7

0,846

0,583

0,263

57

1

0

12

7

0,923

0,583

0,340

59

1

1

13

8

1,000

0,666

0,334

60

0

2

13

10

1,000

0,833

0,167

62

0

1

13

11

1,000

0,917

0,083

84

0

1

13

12

1,000

1,000

0,000

n1=13 n2=12 D=0,538

1) запишем в возрастающем порядке значения изучаемого признака (конгорот-индекс в %), встречающиеся в сравниваемых выборках (графа 1 табл. 2);

2) в графах 2 и 3 таблицы укажем частоты этих значений для обеих выборок 1 и р2);

3) в графах 4 и 5 приведем накопленные частоты значений обеих выборок 1 и m2);

4) разделив накопленные частоты каждого ряда на число наблюдении в нем ( и ), получим значения функции распределения сравниваемых выборок Fn1(х) и Fn2(х), которые запишем в графах 6 и 7;

5) сравниваем между собой значения соседних накопленных частостей и абсолютные разности между ними указываем в графе 8 таблицы;

6) определим абсолютные (без учета алгебраических знаков) разности полученных функций распределения с целью отыскания максимальной разности D.

7) по формуле находим — величину, характеризующую значение критерия Колмогорова — Смирнова;

8) сравниваем полученное значение с критическими значениями =1,84 и = 2, 65.

Если >, различия между сравниваемыми выборками признаются статистически значимыми. Если — принимается нулевая гипотеза (следует считать выборки принадлежащими к одной генеральной совокупности).

Как видно из табл. 2., максимальная разность функций D равна 0,538. Таким образом, =1,803.

Вывод: различия в характере распределения значений конгорот-индекса у кроликов сравниваемых групп следует считать случайными.

Таким образом, если наиболее простые в применении, но и менее мощные, критерии (серийный и Вилкоксона) не находят значимых различий в сравниваемых выборках, то более мощные критерии Мэнна и Уитни и ван дер Вардена с высоким уровнем вероятности (>99%) указывают на наличие неслучайного различия выборок по центральной тенденции, а критерий Колмогорова— Смирнова с вероятностью > 95% —о различии их также и по характеру распределения.