Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Мат статистика.doc
Скачиваний:
1
Добавлен:
01.07.2025
Размер:
3.81 Mб
Скачать
  1. Критерий Вилкоксона (общая характеристика, графическая интерпретация, ограничения, примеры использования).

Т-критерий Вилкоксона — непараметрический статистический тест (критерий), используемый для проверки различий между двумя выборками парных измерений. Впервые предложен Фрэнком Уилкоксоном[1]. Другие названия — W-критерий Вилкоксона[2]критерий знаковых рангов Вилкоксонакритерий Уилкоксона для связных выборок.

Критерий предназначен для сопоставления показателей, измеренных в двух разных условиях на одной и той же выборке испытуемых. Он позволяет установить не только направленность изменений, но и их выраженность, то есть способен определить, является ли сдвиг показателей в одном направлении более интенсивным, чем в другом.

ритерий применим в тех случаях, когда признаки измерены, по крайней мере, в порядковой шкале. Целесообразно применять данный критерий, когда величина самих сдвигов варьирует в некотором диапазоне (10—15 % от их величины). Это объясняется тем, что разброс значений сдвигов должен быть таким, чтобы появлялась возможность их ранжирования. В случае если сдвиги незначительно различаются между собой и принимают какие-то конечные значения (например. +1, -1 и 0), формальных препятствий к применению критерия нет, но, ввиду большого числа одинаковых рангов, ранжирование утрачивает смысл, и те же результаты проще было бы получить с помощью критерия знаков.

Суть метода состоит в том, что сопоставляются абсолютные величины выраженности сдвигов в том или ином направлении. Для этого сначала все абсолютные величины сдвигов ранжируются, а потом суммируются ранги. Если сдвиги в ту или иную сторону происходят случайно, то и суммы их рангов окажутся примерно равны. Если же интенсивность сдвигов в одну сторону больше, то сумма рангов абсолютных значений сдвигов в противоположную сторону будет значительно ниже, чем это могло бы быть при случайных изменениях.

Минимальное значение величины: {\displaystyle W=n(n+1)/2} , где n — объём второй выборки. Максимальное значение величины {\displaystyle W=n(n+1)/2+mn} , где n — объём второй выборки, m — объём первой выборки.

Ограничения критерия

Объем выборки — от 5 до 50 элементов[источник не указан 1895 дней].

Нулевые сдвиги исключаются из рассмотрения. (Это требование можно обойти, переформулировав вид гипотезы. Например: сдвиг в сторону увеличения значений превышает сдвиг в сторону их уменьшения и тенденцию к сохранению на прежнем уровне.)

Сдвиг в более часто встречающемся направлении принято считать «типичным», и наоборот.

Есть также урезанный вариант для сравнения одной выборки с известным значением медианы.

Алгоритм

  1. Составить список испытуемых в любом порядке, например, алфавитном.

  2. Вычислить разность между индивидуальными значениями во втором и первом замерах. Определить, что будет считаться типичным сдвигом.

  3. Согласно алгоритму ранжирования, проранжировать абсолютные величины разностей, начисляя меньшему значению меньший ранг, и проверить совпадение полученной суммы рангов с расчетной.

  4. Отметить каким-либо способом ранги, соответствующие сдвигам в нетипичном направлении. Подсчитать их сумму Т.

  5. Определить критические значения Т для данного объема выборки. Если Т-эмп. меньше или равен Т-кр. – сдвиг в «типичную» сторону достоверно преобладает.

Фактически оцениваются знаки значений, полученных вычитанием ряда значений одного измерения из другого. Если в результате количество снизившихся значений примерно равно количеству увеличившихся, то гипотеза о нулевой медиане подтверждается.

Пример алгоритма для серии из двух опытов

Пусть имеется две серии эксперимента, в результате которых были получены две выборки объёмами n и m. Пусть нулевая гипотеза H0: Генеральные средние обеих выборок совпадают. Чтобы проверить гипотезу H0, необходимо:

  1. Просуммировать элементы второй выборки (вычислить W)

  2. Вычислить математическое ожидание случайной величины W. {\displaystyle M(W)=n(m+n+1)/2}

  3. При справедливости H0 математическое ожидание случайной величины W близко к статистике W.

  4. Проверка гипотезы начинается с выбора уровня значимости — а

  5. Вычислить пределы значимости (Из симметрии достаточно одного предела) и границу критической области W(a)

  6. Справедливость неравенства W > W(a) свидетельствует о справедливости нулевой гипотезы. H0 принимается на уровне значимости = а

Пример расчета T-критерия Вилкоксона

Допустим мы сравниваем между собой уровень тревожности подростков до и после тренинга уверенности в себе.

Шаг 1. Запишем значения в таблицу.

Шаг 2. Рассчитаем разность значений. Для данного случае типичным сдвигом будет считаться сдвиг в отрицательную сторону (7 значений, красный цвет заливки), а нетипичным в положительную сторону (3 значения, зеленый цвет заливки)

Шаг 3. Найдем значения шага 2 по модулю

Шаг 4. Проранжируем значения по модулю.

Все четыре шага приведены в таблице.

Уровень тревожности (до тренинга)

Уровень тревожности (после тренинга)

Шаг 2: Разность (после-до)

Шаг 3: Значение разности по модулю

Шаг 4: Ранг разности

1

15

14

-1

1

3

2

14

11

-3

3

8

3

16

17

1

1

3

4

18

19

1

1

3

5

21

20

-1

1

3

6

21

18

-3

3

8

7

20

15

-5

5

10

8

15

17

2

2

6

9

17

14

-3

3

8

10

13

12

-1

1

3

Шаг 5. Найдем T эмпирическое вычислив сумму рангов в НЕтипичном направлении (зеленый цвет заливки).

Шаг 6. Используя таблицу критических значений T-критерия Вилкоксона определяем T-критическое

6.1. Находим количество человек в выборке. n=10

6.2. Определяем T-критическое справа от значения количества человек в выборке. для p<0,05 T=10; для p<0,01 T=5

Шаг 7. Сравниваем T-критическо и T-эмпирическое.

Шаг 8 Делаем выводы.

Таблица критических значений T-критерия Вилкоксона

В таблице указаны критические значения T-критерия Вилкоксона в зависимости от уровня значимости.

N

p<0,05

p<0,01

5

0

6

2

7

3

0

8

5

1

9

8

3

10

10

5

11

13

7

12

17

9

13

21

12

14

25

15

15

30

19

16

35

23

17

41

27

18

47

32

19

53

37

20

60

43

21

67

49

22

75

55

23

83

62

24

91

69

25

100

76

26

110

84

27

119

92

28

130

101

29

140

110

30

151

120

31

163

130

32

175

140

33

187

151

34

200

162

35

213

173

36

227

185

37

241

198

38

256

211

39

271

224

40

286

238

41

302

252

42

319

266

43

336

281

44

353

296

45

371

312

46

389

328

47

407

345

48

426

362

49

446

379

50

466

397

В таблице критических значений T-критерия Вилкоксона находиться Т-критическое.

Если Е-критическое выше Т-эмпирического, то сдвиги в «типичную» сторону достоверное не преобладают.

T-критерий Вилкоксона предназначен для сравнения двух зависимых выборок между собой по уровню выраженности какого-либо признака.

С его помощью можно определить

1) направленность изменений, 2) выраженность изменений в зависимых выборках. С его помощью есть возможность определить в каком направлении сдвиг более интенсивен.

Параметрический аналог:  t-критерий Стьюдента.

Непараметрический аналог:  G-критерий знаков (менее мощный).

Суть применения T-критерия Вилкоксона сводится к тому, чтобы проранжировать разности значений в двух выборках.

Гипотезы

Н0: Интенсивность сдвигов в типичном направлении не превосходит интенсивности сдвигов в нетипичном направлении.

H1: Интенсивность сдвигов в типичном направлении превышает интен­сивность сдвигов в нетипичном направлении.

Особенности применения:

  1. Признаки должны быть измерены в шкале порядка.

  2. Эффективнее применять критерий, если разброс значений достаточно широк например от -30 до 30, если разброс значений не большой лучше применять G-критерий знаков (например от -3 до 3)

  3. Минимальное количество замеров 5

  4. Максимальное количество замеров 50 (ограничение обусловлено использованием таблицы критических значений T-Вилкоксона, при расчете в SPSS ограничение отсутствует)

  5. Нулевые сдвиги не считаются замерами. Например группу могут составлять 50 человек, но у 10 из них сдвиги нулевые, следовательно мы будем рассчитывать значения исходя из 40 замеров)

Расчет T-критерия Вилкоксона заключается в выполнении следующих шагов:

  1. Составить список значений испытуемых в первом и во втором замерах.

  2. Найти разность по каждому замеру, т.е. вычесть из значений второго замера значения первого замера. Важно! Подсчитать количество отрицательных и количество положительных значений. Большее количество значений того или иного вида будет представлять из себя «типичный» сдвиг.

  3. Найти значения разностей по модулю.

  4. Ранжировать полученные на 4-ом шаге значения, по принципу меньшему значения приписывается меньший ранг. т.е. значение 1 — это 1 ранг.

  5. Подсчитать T-эмпирическое,  являющееся суммой рангов в НЕтипичном направлении:  , где   — ранговые значения сдвигов в НЕтипичном направлении

  6. Определить T-критическое используя таблицу критических значений T-критерия Вилкоксона 6.1. Определяем количество человек в выборке. 6.2. Определяем T-критическое справа от значения количества человек в выборке в зависимости от уровня значимости.

  7. Сравниваем T-эмпирическое и Т-критическое

  8. Делаем вывод: Если — эмпирическое меньше T-критического, то сдвиг в «типичную» сторону преобладает на уровне значимости p<0,05

Пример

В выборке курсантов военного училища (юноши в возрасте от 18 до 20 лет) измерялась способность к удержанию физического волевого усилия на динамометре. Сначала у испытуемых измерялась максималь­ная мышечная сила каждой из рук, а на следующий день им предлага­лось выдерживать, на динамометре с подвижной стрелкой мышечное усилие, равное 1/2 максимальной мышечной силы данной руки. Почув­ствовав усталость, испытуемый должен был сообщить об этом экспери­ментатору, но не прекращать опыт, преодолевая усталость и неприят­ные ощущения - "бороться, пока воля не иссякнет". Опыт проводился дважды; вначале с обычной инструкцией, а затем, после того, как ис­пытуемый заполнял опросник самооценки волевых качеств по методике А.Ц. Пуни (Пуни А.Ц., 1977), ему предлагалось представить себе, что он уже добился идеала в развитии волевых качеств, и продемонст­рировать соответствующее идеалу волевое усилие. Подтвердилась ли гипотеза экспериментатора о том, что обращение к идеалу способствует возрастанию волевого усилия? Данные представлены в Табл. 3.5.

Таблица 3.5

Расчет критерия Т при сопоставлении замеров физического волевого усилия

Код имени испытуемого

Длительность удержания усилия на динамометре (с)

Разность

(fпосле- fдо)

Абсолютное значение разности

Ранговый номер разности

До измерения волевых качеств и обращения к идеалу (fдо)

После измерения волевых качеств и обращения к идеалу (fпосле)

1

2

3

4

5

6

7

8

9 10 11

Г.

Кос. Крив. Кур.

Л.

М.

Р.

С.

Т.

X.

Ю.

64

77

74

95

105

83

73

75

101

97

78

25

50

77

76

67

75

77

71

63

122

60

- 39

- 27

+ 3

- 19

- 38

- 8

+ 4

- 4

- 38

+ 25

- 18

39

27

5

19

38

8

4

4

38

25

18

11

8

1

6

9,5

4

2,5

2,5

9,5

7

5

Сумма

66

Для подсчета этого критерия нет необходимости упорядочивать ряды значений по нарастанию признака. Мы можем использовать ал­фавитный список испытуемых, как в данном случае.

Первый шаг в подсчете критерия Т - вычитание каждого инди­видуального значения "до" из значения "после"1. Мы видим из Табл. 3.5, что 8 полученных разностей - отрицательные и лишь 3 - положи­тельные. Это означает, что у 8 испытуемых длительность удержания мышечного усилия во втором замере уменьшилась, а у 3 - увеличилась. Мы столкнулись с тем случаем, когда уже сейчас мы не можем сфор­мулировать статистическую гипотезу, соответствующую первоначально­му предположению исследователя. Предполагалось, что обращение к идеалу будет увеличивать длительность мышечного усилия, а экспери­ментальные данные свидетельствуют, что лишь в 3 случаях из 11 этот показатель действительно увеличился. Мы можем сформулировать лишь гипотезу, предполагающую несущественность сдвига этого показателя в сторону снижения.

Сформулируем гипотезы.

Н0: Интенсивность сдвигов в сторону уменьшения длительности мы­шечного усилия не превышает интенсивности сдвигов в сторону ее увеличения.

H1: Интенсивность сдвигов в сторону уменьшения длительности мы­шечного усилия превышает интенсивность сдвигов в сторону ее увеличения.

На следующем шаге все сдвиги, независимо от их знака, должны быть проранжированы по выраженности. В Табл. 3.5 в четвертом слева столбце приведены абсолютные величины сдвигов, а в последнем столбце (справа) - ранги этих абсолютных величин. Меньшему значе­нию соответствует меньший ранг. При этом сумма рангов равна 66, что соответствует расчетной:

Теперь отметим те сдвиги, которые являются нетипичными, в данном случае - положительными. В Табл. 3.5 эти сдвиги и соответствующие им ранги выделены цветом. Сумма рангов этих "редких" сдвигов и составляет эмпирическое значение критерия Т:

где Rr - ранговые значения сдвигов с более редким знаком.

Итак, в данном случае,

Тэмn=1+2,5+7=10,5

По Таблице VI Приложения 1 определяем критические значения Т для n=11:

Зона значимости в данном случае простирается влево. Действи­тельно, если бы "редких", в данном случае положительных, сдвигов не было совсем, то и сумма их рангов равнялась бы нулю. В данном же случае эмпирическое значение Т попадает в зону неопределенности:

Тэмп<Ткр (0,05)

Ответ: Н0 отвергается. Интенсивность отрицательного сдвига показателя физического волевого усилия превышает интенсивность по­ложительного сдвига (р<0,05).

Таким образом, исследователю придется признать, что продолжительность удержания мышечного волевого усилия во втором замере снижается, и этот сдвиг неслучаен. Инструкция, ориентирующая испы­туемого на соответствие идеалу в развитии воли, оказалась гораздо ме­нее мощным фактором, чем какая-то иная сила - возможно, мышечное утомление, может быть, разочарование в себе или в возможностях дан­ного психологического эксперимента. А может быть, в момент второго замера просто перестает действовать какой-то мощный фактор, который был активен вначале? На все эти вопросы статистические методы не могут ответить, если в схему эксперимента не включена контрольная группа - в данном случае, выборка, уравновешенная с эксперименталь­ной группой по всем значимым характеристикам (полу, возрасту, про­фессии, месту обучения), у которой просто измерили бы вторично воле­вое усилие через такой же промежуток времени, не призывая соответ­ствовать идеалу в развитии воли.

Представим выполненные действия в виде алгоритма: