Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Matematicheskaya_statistika_v_meditsine

.pdf
Скачиваний:
120
Добавлен:
19.02.2016
Размер:
5.63 Mб
Скачать

1.Проверить, выполняются ли условия применения критерия.

2.Сформулировать гипотезы.

3.Полученные данные объединить в единый ряд, предварительно пометив относящиеся к каждой выборке данные разным цветом.

4.Упорядочить полученный единый ряд по возрастанию признака.

5.Проранжировать значения, приписывая меньшему значению меньший ранг. Общее количество рангов будет равняться количеству испытуемых в объединенной выборке.

6.Подсчитать суммы рангов отдельно по каждой группе. Проверить совпадение общей суммы рангов с расчетной.

7.Подсчитать значение критерия Н по формуле:

 

 

 

2

 

H

12

 

Tj

3(N

 

 

N (N 1)

 

n j

 

 

 

 

 

 

1)

,

где N – общее количество испытуемых в объединенной выборке;

nj – количество испытуемых в каждой группе;

 

 

 

 

Тj суммы рангов по каждой группе.

 

 

 

 

8. Определить критические значения Hкр. При количестве

групп с=3, n1, n2 , n3 5 ,

определить критические значения Hкр и соответствующий им уровень значимости по табли-

це 12. При количестве групп с>3 или количестве испытуемых

n1, n2 , n3 5 ,определить кри-

тические значения Hкр по таблице 19 для критерия

2

(при этом

f

c 1).

 

9. Отметить на оси значимости эмпирическое значение критерия и сделать вывод.

8.5. S-критерий тенденций Джонкира

Назначение критерия: данный критерий позволяет подтвердить либо опровергнуть гипотезу о тенденции изменения признака при переходе от группы к группе. В отличие от H- критерия Крускала – Уоллиса, данный критерий позволяет подтвердить не только значимость различий при переходе от группы к группе, но и позволяет увидеть направление изменения признака.

Условия применения критерия:

Во всех рассматриваемых выборках число наблюдений должно быть одинаковым. В противном случае требуется уравнивание объемов выборок, если оно невозможно, то нужно использовать H-критерий Крускала – Уоллиса.

Выборки должны быть упорядочены по количественно изменяющемуся признаку. Допускается упорядочение выборок по качественно изменяющемуся признаку, но в этом случае требуется каким-то образом ранжировать градации данного признака.

Минимальное число наблюдений в каждой выборке – 2, минимальное число выборок –3. Максимальное число наблюдений – 10, максимальное число выборок – 6.

Гипотезы:

H0: тенденция увеличения значений признака при переходе от группы к группе является случайной;

H1: тенденция увеличения значений признака при переходе от группы к группе не является случайной;

Расчет S-критерия тенденций Джонкира:

1.Проверить, выполняются ли условия применения критерия.

2.Упорядочить выборки по возрастанию (по суммам значений признака или по средним значениям).

3.Сформулировать гипотезы.

61

4. Подсчитать для каждого значения признака во всех столбцах (кроме последнего), сколько значений в соседних столбцах справа больше данного. Для каждой из выборок вы-

писать данные числа и их просуммировать – это будет значение параметра A:

c A Si i 1

.

5.

Найти значение параметра B по формуле:

B

число измерений в выборках.

 

6.

Вычислить эмпирическое значение критерия

Sэмп 2A B .

 

 

c(c 1)

n

2

, где c – число выборок, n

 

2

 

 

 

 

 

по формуле:

7. По таблице критических значений (см. таблицу 13) определить критические значения; сравнить эмпирическое значение с критическими и сделать выводы.

Примеры решения задач

Пример 21. Оценка величины динамического тремора рук (количество касаний стенок лабиринта в тремометре Меде) у начинающих и опытных хирургов дала следующие результаты:

Хирурги

 

 

 

 

Величина тремора рук

 

 

 

 

Начинающие

16

17

14

15

12

17

18

14

15

13

16

19

11

Опытные

15

12

13

11

10

9

11

14

12

9

10

12

13

Оцените, значимы ли различия между двумя группами хирургов.

Решение:

Так как требуется сравнить две независимые выборки по уровню признака, и объемы выборок превосходят 11, то будем использовать Q-критерий Розенбаума для выявления различий.

1.

Задача удовлетворяет условиям применения Q-критерия Розенбаума.

 

 

 

2.

Упорядочим значения отдельно в каждой выборке по степени убывания признака.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Хирурги

 

 

 

 

Величина тремора рук

 

 

 

 

 

Начинающие

19

18

17

17

16

16

15

15

14

14

 

13

12

11

Опытные

15

14

13

13

12

12

12

11

11

10

 

10

9

9

3.

Первой назовем выборку из начинающих хирургов, второй – опытных.

 

 

4.

Гипотезы:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

H0: Динамический тремор рук в выборке 1 не превышает динамического тремора в выборке 2.

H1: Динамический тремор рук в выборке 1 превышает динамический тремор в выбор-

ке 2.

5. Максимальное значение в выборке 2 составляет 15; минимальное значение в выборке

1 – 11.

Построим еще одну таблицу для подсчета «хвостов» S1 и S2:

Начинающие

 

Опытные

19

 

 

18

 

 

17

 

S1=6

17

 

 

 

16

 

 

16

 

 

15

 

15

15

 

 

 

62

14

14

14

 

13

13

 

13

12

12

 

12

 

12

11

11

 

11

 

10

S2=4

10

9

 

 

9

6.Qэмп=S1+S2=6+4=10.

7.По таблице 10 Приложения определим критические значения Qкр(0.05)=6;

Qкр(0.01)=9.

Нанесем на ось значимости полученные значения.

8. Как видно, Qэмп попадает в «зону значимости», следовательно H0 отклоняется, H1

принимается на уровне значимости p 0.01

. Динамический тремор рук в выборке 1 превы-

шает динамический тремор в выборке 2.

 

Пример 22. Для ответа на вопрос, существуют ли различия в школьной успеваемости между детьми с хроническими заболеваниями и нормальным здоровьем, было проведено исследование, в котором получены следующие результаты:

 

 

 

Средние баллы по предметам

 

 

Хронич. больные (X)

8.4

5.5

7.1

4.3

4.7

6.7

6.4

9.2

8.8

Здоровые дети (Y)

8.3

4.4

4.2

7.2

6.5

6.4

9.0

8.8

8.9

Определите, существуют ли различия между указанными группами детей в школьной успеваемости.

Решение:

1.Так как требуется сравнить две независимые выборки по уровню признака, и объемы выборок превосходят 5, но меньше 11, то будем использовать U-критерий Манна – Уитни для выявления различий.

2.Упорядочим все значения признака, независимо от того, к какой выборке они относятся по возрастанию. Данные, относящиеся к выборке X, отметим жирным шрифтом:

Средн.

4.2

4.3

4.4

4.7

5.5

6.4

6.4

6.5

6.7

7.1

7.2

8.3

8.4

8.8

8.8

8.9

9.0

9.2

баллы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

№ п/п

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

 

 

 

 

 

 

 

 

63

 

 

 

 

 

 

 

 

 

 

3. Проранжируем значения полученного ряда:

Средн.

 

4.2

4.3

4.4

 

4.7

 

5.5

6.4

6.4

6.5

6.7

7.1

7.2

8.3

8.4

8.8

8.8

8.9

9.0

9.2

баллы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ri

 

1

2

 

3

 

4

 

5

6.5

6.5

8

9

10

11

12

13

14.5

14.5

16

17

18

4. Подсчитаем ранговые суммы отдельно по каждой выборке:

 

 

 

 

 

Tx = 2 + 4 + 5 + 6.5 + 9 + 10 + 13 + 14.5 + 18 = 82

 

 

 

 

 

 

 

 

Ty = 1 + 3 + 6.5 + 8 + 11 + 12 + 14.5 + 16 + 17 = 89

 

 

 

 

 

 

 

 

5. Выполним проверку ранговой суммы:

 

 

 

 

 

 

 

 

 

 

Tx + Ty = 82 + 89 = 171

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Расчетная ранговая сумма:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

R

N (N 1)

 

18 (18 1)

171

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

2

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Общая сумма рангов совпадает с расчетной.

6.Большая ранговая сумма составляет 89, что соответствует выборке Y.

7.Теперь можно сформулировать гипотезы.

Гипотезы:

H0: Уровень признака в группе X не ниже уровня признака в группе Y. H1: Уровень признака в группе X ниже уровня признака в группе Y.

8. Количество испытуемых в выборке Y составляет 9 значение критерия Uэмп.

U

 

(n

 

n

 

)

ny (ny 1)

T

 

(9 9)

9 (9 1)

89

эмп

x

y

2

y

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где nx – количество испытуемых в выборке X; ny – количество испытуемых в выборке Y;

Ty – большая из двух ранговых сумм.

человек. Определим эмпирическое

37

,

9. Определим критические значения Uкр по таблице 11, Uкр(0.05)=21; Uкр(0.01)=14. Построим ось значимости и отметим их на оси значимости, обозначим на ней Uэмп.

Так как Uэмп попало в зону незначимости, мы принимаем нулевую гипотезу (H0) об отсутствии различий по уровню успеваемости между выборками детей с хроническими заболеваниями и здоровых детей.

Пример 23. На дневном стационаре использовались разные схемы лечения заболевания. Состояние здоровья после курса комплексной медикаментозной терапии оценивалось

64

на протяжении 5 недель по 50-балльной шкале.

 

1-я неделя

2-я неделя

3-я неделя

4-я неделя

5-я неделя

схема А

21

23

25

35

36

схема В

30

32

40

45

48

схема С

30

35

38

45

47

Определите на уровне значимости p = 0.01, различаются ли по степени эффективности различные способы медикаментозной терапии.

Решение:

1.Так как требуется сравнить три независимые выборки по уровню признака, и градации признака «Схема лечения» не могут быть ранжированы, то будем использовать H-

критерий Крускала – Уоллиса для выявления различий.

2.Задача удовлетворяет условиям применения данного критерия.

3.Гипотезы:

H0: по степени эффективности три схемы терапии не различаются; H1: по степени эффективности три схемы терапии различаются.

4. Упорядочим все значения признака, независимо от того, к какой выборке они относятся по возрастанию и проранжируем полученный ряд. Данные, относящиеся к схеме А, отметим подчеркиванием, к схеме В – двойным подчеркиванием.

Баллы

21

 

23

 

25

30

30

 

32

35

35

36

38

40

45

45

47

48

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ri

1

 

2

 

3

4.5

4.5

 

6

7.5

7.5

9

10

11

12.5

12.5

14

15

5. Подсчитаем ранговые суммы отдельно по каждой выборке:

 

 

 

 

TA = 1 + 2 + 3

+ 7.5 + 9 = 22.5

 

 

 

 

 

 

 

 

 

 

 

TB = 4.5

+ 6 +

11 + 12.5 + 15 = 49

 

 

 

 

 

 

 

 

 

 

TC = 4.5 + 7.5

+ 10 + 12.5 + 14 = 48.5

 

 

 

 

 

 

 

 

 

6. Выполним проверку ранговой суммы:

TA + TB + TC = 22.5+49+48.5 = 120

Расчетная ранговая сумма:

R

N (N 1)

 

15 (15 1)

120

 

 

i

2

2

 

 

 

Общая сумма рангов совпадает с расчетной.

7. Вычислим эмпирическое значение критерия:

 

 

 

 

 

12

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

H эмп

 

 

 

 

 

 

Tj

 

 

3

(N 1)

 

 

N (N

 

 

n

 

 

 

 

 

 

1)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j

 

 

 

 

 

 

 

 

 

 

 

12

 

 

 

22,5

2

 

 

49

2

 

48,5

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3 (15 1) 4.595.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

15

(15 1)

 

5

 

 

 

 

5

 

 

 

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8. Определим критические значения критерия Нкр по таблице 12, H0.05=5.72; H0.01=7.98. Построим ось значимости и отметим их на оси значимости, обозначим на ней Hэмп.

65

Так как Hэмп попадает в зону незначимости, мы принимаем нулевую гипотезу (H0) об отсутствии различий в степени эффективности схем медикаментозной терапии.

Пример 24. В результате проведения исследования, в ходе которого устанавливалась связь между социальным статусом ребенка и его пространственным поведением были получены следующие результаты для индивидуальной дистанции (в см):

Высокий социальный статус

25, 30, 28, 33, 45, 29, 32

Средний социальный статус

29, 32, 33, 28, 36, 44, 39

Низкий социальный статус

39, 45, 52, 43, 33, 40, 48

Есть ли связь между социальным статусом и индивидуальной дистанцией ребенка?

Решение:

1.Так как мы сравниваем между собой 3 независимые выборки по уровню признака, и значения признака «Социальный статус» могут быть упорядочены по возрастанию или по убыванию, то можно использовать S-критерий тенденций Джонкира. Кроме того, объёмы выборок равны и меньше 10.

2.Упорядочиваем данные:

Находим суммы значений признака в каждой выборке:

n x1i i 1

n x2i i 1

n x3i i 1

25 30 28

29 32 33

39 45 52

33 45 29 32 28 36 44 39 43 33 40 48

 

222 241 300

;

;

.

Упорядочиваем значения признака по возрастанию сумм (дополнительно в каждом столбце упорядочиваем значения признака по возрастанию).

3.Как видно из таблицы, по мере понижения социального статуса наблюдается повышение индивидуальной дистанции ребенка. Таким образом, формулируем гипотезы:

H0: тенденция увеличения индивидуальной дистанции ребенка по мере понижения социального статуса является случайной;

H1: тенденция увеличения индивидуальной дистанции ребенка по мере понижения социального статуса не является случайной.

4.Считаем сейчас, сколько для данного значения признака чисел, больших, чем оно, стоит в столбцах справа. Например, для значения признака «25» из первой выборки во второй и третьей выборках чисел, больших, чем заданное, будет всего 14; для значения признака

«28» – 13 и т.д.

66

Высокий социальный

S

 

Средний социальный

S

 

Низкий социальный

статус

i

статус

i

статус

 

 

 

 

 

 

25

14

28

7

33

28

13

29

7

39

29

12

32

7

40

30

12

33

6

43

32

11

36

6

45

33

9

39

5

48

45

2

44

3

52

222

73

241

41

300

Суммируем найденные числа для каждой выборки (кроме последней) и находим пара-

метр A: 5.

B

A 73 41 114 .

 

 

Находим параметр B:

 

 

 

c(c 1)

n

2

 

3 (3 1)

7

2

 

 

2

 

2

 

 

 

 

 

 

 

147

.

6.Находим эмпирическое значение критерия:

Sэмп 2A B 2 114 147 81.

7.По таблице 13 критических значений S-критерий тенденций Джонкира находим критические значения:

Sкр (0.05) 91 ,

Sкр (0.05) 93 .

Построим ось значимости и отметим их на оси значимости, обозначим на ней

Sэмп

:

Так как Sэмп попадает в зону незначимости, мы принимаем нулевую гипотезу (H0), что

тенденция увеличения индивидуальной дистанции ребенка по мере понижения социального статуса является случайной.

67

ГЛАВА 9. НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ ВЫЯВЛЕНИЯ СДВИГА ЗНАЧЕНИЙ

ИССЛЕДУЕМОГО ПРИЗНАКА

9.1. Задачи выявления достоверности сдвига значений исследуемого признака. Алгоритм принятия решения о выборе критерия

В психологических исследованиях часто ставится задача доказать, что в результате действия каких-либо факторов произошли достоверные изменения (сдвиг) в измеряемых показателях. Такими факторами могут являться:

время: показатели одной и той же группы испытуемых измеряются по одинаковым методикам в разное время (временной сдвиг);

условия измерения: одни и те же методики применяются в разных условиях (ситуационный сдвиг, умозрительный сдвиг);

контролируемые или неконтролируемые воздействия (сдвиг под влиянием факторов);

разные показатели одних и тех же испытуемых, измеренных в одних и тех же единицах по одной и той же шкале (структурный сдвиг).

Критерии, рассмотренные в этой главе, предполагают, что мы сопоставляем так называемые зависимые выборки, состоящие из одних и тех же испытуемых, находящихся под действием разных факторов.

Решение о выборе того или иного критерия принимается на основе того, сколько выборок сопоставляется и каков их объем.

Можно использовать следующую схему принятия решения о выборе критерия:

Сколько выборок

Каков объем

Рекомендуемый крите-

Что делать, если различия не

сопоставляется?

выборок (n)?

рий

выявляются?

2 выборки

n≥5

G-критерий знаков или

Использовать угловое преобра-

T-критерий Вилкоксона

зование Фишера

 

 

 

 

 

 

 

 

χ2r-критерия Фридмана

Использовать угловое преобра-

3 и более выборок

n≥2

или L-критерий тенден-

зование Фишера с попарным

 

 

ций Пейджа*

сопоставлением групп

 

 

 

 

*Примечание. При рассмотрении 3 и более выборок, предпочтительнее использовать критерий тенденций Пейджа, если это возможно.

9.2. G-критерий знаков

Назначение критерия: данный критерий является маломощным критерием выявления сдвига в выборке. Он позволяет установить только направление сдвига, но не его интенсивность.

Перед вычислением данного критерия требуется определить сдвиг значений признака для каждого испытуемого. Для этого нужно найти разность между новым и старым значением признака для данного испытуемого. Если значение признака не изменилось, то сдвиг называют нулевым. Преобладающие (те, которых больше) сдвиги (положительные или отрицательные) называют типичными, не преобладающие – нетипичными.

Условия применения критерия:

● Минимальное количество ненулевых сдвигов в выборке – 5, максимальное – 300.

68

● Количество положительных сдвигов не должно быть равно количеству отрицательных сдвигов.

Гипотезы:

H0: Преобладание типичного сдвига является случайным. H1: Преобладание типичного сдвига является не случайным.

di

Подсчет G-критерия знаков:

1. Вычислить сдвиг значений признака для каждого испытуемого по формуле xi x0i .

2.Подсчитать количество положительных и отрицательных сдвигов. Удалить из выборки испытуемых, для которых сдвиг был нулевым.

3.Преобладающие сдвиги объявить типичными, не преобладающие – нетипичными.

4.Убедиться в возможности применения критерия.

5.Сформулировать гипотезы.

6.Подсчитать количество нетипичных сдвигов – это и будет эмпирическим значением

критерия:

G

 

эмп

 

Nнетип

.

7. По таблице критических значений G-критерия знаков (см. таблицу 14) определить критические значения и нанести их на ось значимости. Определить, в какую зону попадает эмпирическое значение критерия, и сделать выводы.

9.3. T-критерий Вилкоксона

Назначение критерия: Критерий применяется для сопоставления показателей, измеренных в двух разных условиях на одной и той же выборке испытуемых. Он позволяет установить не только направленность изменений, но и их выраженность. С его помощью мы определяем, является ли сдвиг показателей в каком-то одном направлении более интенсивным, чем в другом. Критерий T применим в тех случаях, когда признаки измерены, по крайней мере, в шкале порядка, и сдвиги между данными, измеренными в разных условиях, тоже могут быть упорядочены. Для этого они должны варьировать в достаточно широком диапазоне. Выраженность сдвигов в том или ином направлении сопоставляется по абсолютной величине. Для этого сначала ранжируются все абсолютные величины сдвигов, а потом суммируются ранги. Если сдвиги в положительную и отрицательную сторону происходят случайно, то суммы рангов абсолютных значений их будут примерно равны. Если же интенсивность сдвига в одном из направлений перевешивает, сумма рангов абсолютных значений сдвигов в противоположную сторону будет значительно ниже, чем это могло бы быть при случайных изменениях.

Типичным сдвигом назовем сдвиг в более часто встречающемся направлении, а нетипичным, или редким, – сдвиг в более редко встречающемся направлении.

Условия применения критерия:

Минимальное количество испытуемых, прошедших измерения в двух условиях, составляет 5 человек.

Максимальное количество испытуемых – 50 человек, что диктуется верхней границей имеющихся таблиц.

Нулевые сдвиги из рассмотрения исключаются, и количество наблюдений n уменьшается на количество этих нулевых сдвигов.

Гипотезы:

H0: Интенсивность сдвигов в типичном направлении не превосходит интенсивности сдвигов в нетипичном направлении.

H1: Интенсивность сдвигов в типичном направлении превышает интенсивность сдвигов в нетипичном направлении.

69

Подсчет критерия T-Вилкоксона:

1.Проверить условия применения критерия.

2.Составить список испытуемых в любом порядке, например, алфавитном.

3.Вычислить разность между индивидуальными значениями во втором и первом замерах («после» – «до»). Определить, что будет считаться «типичным» сдвигом и сформулировать соответствующие гипотезы.

4.Нулевые сдвиги из рассмотрения исключить, и количество наблюдений n уменьшить на количество этих нулевых сдвигов.

5.Перевести разности в абсолютные величины.

6.Проранжировать абсолютные величины разностей, начисляя меньшему значению меньший ранг. Проверить совпадение полученной суммы рангов с расчетной.

7.Подсчитать сумму рангов, соответствующих нетипичным сдвигам:

T

R

эмп

r

,

где Rr – ранговые значения сдвигов с более редким знаком.

8. Определить критические значения Tкр для данного n по таблице 15. Критерий T также является исключением из общего правила: зона значимости располагается слева, а зона незначимости – справа.

Отметить на оси значимости эмпирическое значение критерия Tэмп и сделать вывод. Если Tэмп попадает в зону значимости, сдвиг в «типичную» сторону по интенсивности достоверно преобладает.

9.4. χ2r-критерий Фридмана

Назначение критерия: данный критерий предназначен для сравнения значений признака, измеренного в одной и той же выборке, при 3 и более условиях. При этом данный критерий позволяет просто констатировать изменение признака в выборке при переходе от условия к условию, но не позволяет установить, как изменяется признак.

Условия применения критерия:

Минимальное количество условий – 3 (c≥3), минимальное количество измерений – 2 (n≥2).

Если в таблице критических значений (см. таблицы 16 или 17) отсутствуют критические значения для данного числа измерений (c) и числа условий (n), то недостающие критические значения нужно брать из таблицы критических значений критерия χ2-Пирсона (см. таблицу 19). Число степеней свободы при этом вычисляется как f c 1.

Гипотезы:

H0: Изменение признака в выборке при переходе от условия к условию является случайным.

H1: Изменение признака в выборке при переходе от условия к условию не является случайным.

Порядок расчета χ2r-критерия Фридмана:

1.Проверить условия применения критерия.

2.Сформулировать гипотезы.

3.Проранжировать индивидуальные значения для каждого испытуемого.

4. Найти ранговую сумму для каждого условия:

T

j .

 

c

5. Найти общую ранговую сумму T Tj и сравнить ее с контрольной ранговой сум-

j 1

70

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]