Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ermolaev_MC_dlya_psikhologov.doc
Скачиваний:
45
Добавлен:
01.05.2025
Размер:
5.22 Mб
Скачать

8.2. Критерий Колмогорова-Смирнова

Этот критерий используется для решения тех же задач, что и критерий хи-квадрат. Иначе говоря, с его помощью можно сравнивать эмпирическое распределение с теоретическим или два эмпирических распределения друг с другом. Однако если при применении хи-квадрат мы сопоставляем частоты двух распределений, то в данном критерии сравниваются накопленные (кумулятивные) частоты по каждому разряду (альтернативе). При этом если разность накопленных частот в двух распределениях оказывается большой, то различия между двумя распределениями являются существенными.

Задача 8.12. Предположим, что в эксперименте психологу необходимо использовать шестигранный игральный кубик с цифрами на гранях от 1 до 6. Для чистоты эксперимента необходимо получить «идеальный» кубик, т.е. такой, чтобы при достаточно большом числе подбрасываний, каждая его грань выпадала бы примерно равное число раз. Задача состоит в выяснении того, будет ли данный кубик близок к идеальному?

Решение. Подбросим кубик 120 раз и сравним полученное эмпирическое распределение с теоретическим. Поскольку теоретическое распределение является равновероятным, то соответствующие теоретические частоты равны 20. Распределение эмпирических и теоретических частот представим совместно в таблице 8.15:

Таблица 8.15

Грани

1

2

3

4

5

6

1

2

3

4

5

6

В — частоты эмпирические

18

23

15

21

25

18

Е — частоты теоретические

20

20

20

20

20

20

Для подсчета по критерию Колмогорова—Смирнова необходимо провести ряд преобразований с данными таблицы 8.15. Представим эти преобразования в таблице 8.16 и объясним их получение:

Таблица 8.16

FE

20

40

60

80

100

120

FB

15

33

51

72

95

120

|FE-FB|

5

7

9

8

5

0

Символом FE в таблице 8.16 будем обозначать накопленные теоретические частоты. В таблице они получаются следующим образом: к первой теоретической частоте 20, добавляется вторая частота, также равная 20, получается число 20 + 20 = 40. Число 40 ставится на место второй частоты. Затем к числу 40 прибавляется следующая теоретическая частота, полученная величина 60 — ставится на место третьей теоретической частоты и так далее.

Символом FB в таблице 8.16 обозначаются накопленные эмпирические частоты. Для их подсчета необходимо расположить эмпирические частоты по возрастанию: 15, 18, 18, 21, 23, 25 и затем по порядку сложить. Так, вначале стоит первая частота равная 15, к ней прибавляется вторая по величине частота и полученная сумма 15 + 18 = 33 ставится на место второй частоты, затем к 33 добавляется 18 (33 + 18 = 51), полученное число 51 ставится на место третьей частоты и т.д.

Символом |FE FB| в таблице 8.16 обозначаются абсолютные величины разности между теоретической и эмпирической частотой по каждому столбцу отдельно.

Эмпирическую величину этого критерия, которая обозначается как Dэмп получают используя формулу (8.13):

Для её получения среди чисел |FEFB| находят максимальное число (в нашем случае оно равно 9) и делят его на объем выборки п. В нашем случае п = 120, поэтому Dэмп = 9/120 = 0,075.

Для этого критерия таблица с критическими значениями дана в Приложении 1 под № 13. Из таблицы 13 Приложения 1 следует, однако, что в том случае, если число элементов выборке больше 100, то величины критических значений вычисляются по формуле (8.14):

Иными словами, вместо привычных табличных значений вычисляются величины Dкр подстановкой величины объема выборки вместо символа п.

В нашем случае п = 120, поэтому D для 0,05 равно и Dкр для 0,01 равно , или в привычной форме записи:

Строим «ось значимости»:

В нашем случае Dэмп оказалось равным 0,075, что гораздо меньше 0,124, иначе говоря, эмпирическое значение критерия Колмогорова—Смирнова попало в зону незначимости. Таким образом, гипотеза Н1 отклоняется и принимается гипотеза Но о том, что теоретическое и эмпирическое распределения не отличаются между собой. Следовательно, можно с уверенностью утверждать, что наш игральный кубик «безупречен».

Приведем еще один пример решения задачи сравнения эмпирического распределения с теоретическим при помощи критерия Колмогорова—Смирнова.

Задача 8.13. В выборке из здоровых лиц мужского пола, студентов технических и военно-технических вузов в возрасте от 19-ти до 22 лет, средний возраст 20 лет, проводился тест Люшера в 8-цветном варианте. Установлено, что желтый цвет предпочитается испытуемыми чаще, чем отвергается. Можно ли утверждать, что распределение желтого цвета по 8-ми позициям у здоровых испытуемых отличается от равномерного распределения? (Пример взят из книги Е.В. Сидоренко, (30). Ниже приведено решение этого примера с использованием вышеприведенного способа, а не способом, приведенным в работе Е.В. Сидоренко).

Решение. Представим экспериментальные данные сразу в виде таблицы 8.17:

Таблица 8.17

Градации цвета

1

2

3

4

5

6

7

8

В — эмпирические частоты

24

15

13

8

15

10

, 9

8

Е — теоретические частоты

14

14

14

14

14

14

14

14

Сумма эмпирических частот этого примера равна 112. При подсчете теоретических частот мы исходим из предположения об их равенстве, следовательно 112/8 = 14.

Упорядочим эмпирические частоты:

8 8 9 10 13 15 24 25

Рассчитаем соответствующую кумулятивную таблицу:

Таблица 8.18

FE

14

28

42

56

70

84

98

112

FB

8

16

25

35

48

63

87

112

|FE-FB|

6

12

17

21

22

21

11

0

В первой строчке таблицы 8.18, обозначенной символом FE, накопленные теоретические частоты получены так: первая частота — 14, вторая частота — 14 + 14 = 28, третья частота — 28 + 14 = 42 и т.д.

Во второй строчке таблицы 8.18, обозначенной символом FB, накопленные эмпирические частоты получены так: первая частота 8, вторая 8 + 8 = 16, третья — 16 + 9 = 25, четвертая 25 + 10 = 35 и т.д.

При п = 112 по формуле (8.13) находим:

В нашем случае п = 112, поэтому по формуле (8.14) находим:

В привычной форме записи величины критических значений выглядят так:

Строим «ось значимости»:

Полученная величина Dэмп показывает, что эмпирическое распределение на высоком уровне значимости отличается от теоретического равномерного распределения. Гипотеза Но отвергается. Следовательно, распределение желтого цвета отличается от равномерного по восьми позициям.

Отметим, что критерий Колмогорова—Смирнова позволяет сравнивать между собой два эмпирических распределения. Однако проведение такого расчета оказывается достаточно сложным. Поэтому в настоящем пособии способ сравнения двух эмпирических распределений с использованием критерия Колмогорова-Смирнова рассматриваться не будет, тем более что принцип сравнения двух эмпирических распределение подробно изложен выше при анализе работы с критерием хи-квадрат (см. раздел 8.2).

Для применения критерия Колмогорова—Смирнова необходимо соблюдать следующие условия:

  1. Измерение может быть проведено шкале интервалов и отношений.

  2. Выборки должны быть случайными и независимыми.

  3. Желательно, чтобы суммарный объем двух выборок > 50. С увеличением объема выборки точность критерия повышается.

  4. Эмпирические данные должны допускать возможность упорядочения по возрастанию или убыванию какого-либо признака и обязательно отражать какое-то его однонаправленное изменение. В том случае, если трудно соблюсти принцип упорядоченности признака, лучше использовать критерий хи-квадрат.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]