Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ермолаев О.Ю. Математическая статистика.doc
Скачиваний:
369
Добавлен:
13.08.2019
Размер:
23.04 Mб
Скачать

8.2, Критерий Колмогорова-Смирнова

Этот критерий используется для решения тех же задач, что и критерий хи-квадрат. Иначе говоря, с его помощью можно срав­нивать эмпирическое распределение с теоретическим или два эмпирических распределения друг с другом. Однако если при применении хи-квадрат мы сопоставляем частоты двух распреде­лений, то в данном критерии сравниваются накопленные (куму­лятивные) частоты по каждому разряду (альтернативе). При этом если разность накопленных частот в двух распределениях оказы­вается большой, то различия между двумя распределениями яв­ляются существенными.

Задача 8.12. Предположим, что в эксперименте психологу не­обходимо использовать шестигранный игральный кубик с цифрами на гранях от 1 до 6. Для чисто­ты эксперимента необходимо получить «идеаль­ный» кубик, т.е. такой, чтобы при достаточно большом числе подбрасываний, каждая его грань выпадала бы примерно равное число раз. Задача состоит в выяснении того, будет ли данный ку­бик близок к идеальному?

Решение. Подбросим кубик 120 раз и сравним полученное эмпирическое распределение с теоретическим. Поскольку теоретическое распределение являет­ся равновероятным, то соответствующие теоре­тические частоты равны 20. Распределение эмпи­рических и теоретических частот представим со­вместно в таблице 8.15:

160

Таблица 8.15

№ 1

№ 2

№3

№4

№5

№ 6

№ 7

Грани

1

2

3

4

5

6

В — частоты эмпирические

18

23

15

21

25

18

Е — частоты теоретические

20

20

20

20

20

20

Для подсчета по критерию Колмогорова—Смирнова необхо­димо провести ряд преобразований с данными таблицы 8.15. Представим эти преобразования в таблице 8.16 и объясним их получение:

Таблица 8.16

FE

20

40

60

80

100

120

FB

15

33

51

72

95

120

|FE-FB|

5

7

9

8

5

0

Символом FE в таблице 8.16 будем обозначать накопленные теоретические частоты. В таблице они получаются следующим об­разом: к первой теоретической частоте 20, добавляется вторая частота, также равная 20, получается число 20 + 20 = 40. Число 40 ставится на место второй частоты. Затем к числу 40 прибавляется следующая теоретическая частота, полученная величина 60 -станится на место третьей теоретической частоты и так далее.

Символом FB в таблице 8.16 обозначаются накопленные эм­пирические частоты. Для их подсчета необходимо расположить эмпирические частоты по возрастанию: 15, 18, 18, 21, 23, 25 и затем по порядку сложить. Так, вначале стоит первая частота равная 15, к ней прибавляется вторая по величине частота и по­лученная сумма 15 + 18 = 33 ставится на место второй частоты, затем к 33 добавляется 18 (33 + 18 = 51), полученное число 51 ставится на место третьей частоты и т.д.

Символом |FE - FB| в таблице 8.16 обозначаются абсолютные величины разности между теоретической и эмпирической часто­той по каждому столбцу отдельно.

161

Эмпирическую величину этого критерия, которая обознача­ется как Dэмп получают используя формулу (8.13):

(8.13)

Для её получения среди чисел |FE - FB| находят максималь­ное число (в нашем случае оно равно 9) и делят его на объем

выборки п. В нашем случае п = 120, поэтому Dэмп = 9:120=0,075

Для этого критерия таблица с критическими значениями дана в Приложении 1 под № 13. Из таблицы 13 Приложения следует, однако, что в том случае, если число элементов выбор­ке больше 100, то величины критических значений вычисляются по формуле (8.14):

(8.14)

Иными словами, вместо привычных табличных значений вы­числяются величины Dкр подстановкой величины объема выбор­ки вместо символа и.

Dкр= (0,124 для Р< 0,05

Dкр= ( 0,149 для Р< 0,01

Строим «ось значимости»:

В нашем случае Dэмп оказалось равным 0,075, что гораздо меньше 0,124, иначе говоря, эмпирическое значение критерия

162

Колмогорова—Смирнова попало в зону незначимости. Таким об­разом, гипотеза Н1 отклоняется и принимается гипотеза Н0 о том, что теоретическое и эмпирическое распределения не отли­чаются между собой. Следовательно, можно с уверенностью ут­верждать, что наш игральный кубик «безупречен».

Приведем еще один пример решения задачи сравнения эм­пирического распределения с теоретическим при помощи кри­терия Колмогорова—Смирнова.

3 а д а ч а 8.13. В выборке из здоровых лиц мужского пола, сту­дентов технических и военно-технических вузов в возрасте от 19-ти до 22 лет, средний возраст 20 лет, проводился тест Люшера в 8-цветном вари­анте. Установлено, что желтый цвет предпочита­ется испытуемыми чаще, чем отвергается. Можно ли утверждать, что распределение желтого цвета по 8-ми позициям у здоровых испытуемых отли­чается от равномерного распределения? (Пример взят из книги Е.В. Сидоренко, (30). Ниже приве­дено решение этого примера с использованием вышеприведенного способа, а не способом, при­веденным в работе Е.В. Сидоренко).

Решение. Представим экспериментальные данные сразу в виде таблицы 8.17:

Таблица 8.17

Градации цвета

1

2

3

4

5

6

7

8

В — эмпирические частоты

24

15

13

8

15

10

9

8

Е — теоретические частоты

14

14

14

14

14

14

14

14

Сумма эмпирических частот этого примера равна 112. При подсчете теоретических частот мы исходим из предположения об

их равенстве, следовательно 112:8 = 14.

Упорядочим эмпирические частоты: 8 8 9 10 13 15 24 25

163

Рассчитаем соответствующую кумулятивную таблицу:

Таблица 8.18

FE

14

28

42

56

70

84

98

112

FB

8

16

25

35

48

63

87

112

|FE-FB|

6

12

17

21

22

21

11

0

В первой строчке таблицы 8.18, обозначенной символом FE, накопленные теоретические частоты получены так: первая частота — 14, вторая частота — 14 + 14 = 28, третья частота -28 + 14 = 42 и т.д.

Во второй строчке таблицы 8.18, обозначенной символом FB, накопленные эмпирические частоты получены так: первая частота 8, вторая 8 + 8 = 16, третья -- 16 + 9 = 25, четвертая 25 + 10 = 35 и т.д.

При п = 112 по формуле (8.13) находим:

В нашем случае n = 112, поэтому по формуле (8.14) нахо­дим:

В привычной форме записи величины критических значений выглядят так:

Dкр= ( 0,128 для Р< 0,05 Dкр= ( 0,154 для Р< 0,01

Строим «ось значимости»:

164

Полученная величина Dэмп показывает, что эмпирическое распределение на высоком уровне значимости отличается от те­оретического равномерного распределения. Гипотеза Н0 отверга­ется. Следовательно, распределение желтого цвета отличается от равномерного по восьми позициям.

Отметим, что критерий Колмогорова—Смирнова позволяет сравнивать между собой два эмпирических распределения. Одна­ко проведение такого расчета оказывается достаточно сложным. Поэтому в настоящем пособии способ сравнения двух эмпиричес­ких распределений с использованием критерия Колмогорова-Смирнова рассматриваться не будет, тем более что принцип срав­нения двух эмпирических распределение подробно изложен выше при анализе работы с критерием хи-квадрат (см. раздел 8.2).

Для применения критерия Колмогорова—Смирнова необходи­мо соблюдать следующие условия:

1. Измерение может быть проведено шкале интервалов и отноше­ний.

2. Выборки должны быть случайными и независимыми.

3. Желательно, чтобы суммарный объем двух выборок > 50. С уве­личением объема выборки точность критерия повышается.

4. Эмпирические данные должны допускать возможность упоря­дочения по возрастанию или убыванию какого-либо призна­ка и обязательно отражать какое-то его однонаправленное изменение. В том случае, если трудно соблюсти принцип упорядоченности признака, лучше использовать критерий хи-квадрат.