Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1 розенбаума.doc
Скачиваний:
10
Добавлен:
11.09.2019
Размер:
1.39 Mб
Скачать

3.11. Критерий Колмогорова-Смирнова

К ритерий предназначен для сопоставления двух распределений: а) эмпирического с теоретическим; б) одного эмпирического распределения с другим эмпирическим распределением.

Критерий Колмогорова-Смирнова включает следующие этапы:

1

Определить признак, который необходимо исследовать (значение признака может быть представлено в любой шкале измерения).

2

Провести наблюдения одной выборки респондентов объема n (Объем выборки должен быть больше 50): x1, x2,…xi,… ,где случайная переменная X характеризует состояние изучаемого свойства в рассматриваемой совокупности.

3

Сформулировать гипотезы:

H0

Полученное эмпирическое распределение не отличатся от теоретического распределения.

H1

Полученное эмпирическое распределение отличатся от теоретического распределения.

4

Результаты измерения объектов выборки записать в ряд по возрастанию.

5

Исходные выборочные данные сгруппировать и представить в виде интервального статистического ряд распределения частот (для распределения случайной величины по равномерному закону, для нормального распределения):

элементы

хi

[x0; x1]

(x1; x2]

....

(xm-1;xm]

эмпирическая частота

....

.

6

Для каждой ячейки найти значение эмпирической функции распределения изучаемого свойства: , где а – число значений .

7

Для каждой ячейки вычислить по формуле:

а

для нормального распределения , где , , – правый конец интервала, значение положить равным . Значения определить по таблице № 13 приложения;

б

для распределения случайной величины по равномерному закону , .

8

Вычислить значение по формуле

Для нахождения значения , данные можно записать в таблицу:

элементы

хi

.

9

Определить критические значения λ21кр и λ 22кр, которые отвечают уровням значимости в 5% и 1% по таблице №13 или №14 приложения.

10

Расположить эмпирическое значение критерия и критические значения λ 21кр и λ 22кр на оси значимости.

11

Если находится в зоне незначимости, то принимается гипотеза Н0 об отсутствии различий. Если находится в зоне значимости, то гипотеза об отсутствии различий Н0 отклоняется и принимается гипотеза Н1 о наличии различий. Если находится в зоне неопределенности, то существует вероятность принятия ложного решения.

Критерий Колмогорова-Смирнова включает следующие этапы:

1

Определить признак, участвующий в сопоставлении (значения признака должны быть представлены не ниже порядковой шкалы).

2

Произвести выборку двух групп респондентов (при увеличении объема выборки точность критерия повышается).

3

Провести две серии наблюдений на двух независимых выборках респондентов объема n1, и n2:

x1, x2,…xi,… ;

y1, y2,…,yj,…, ,

где случайная переменная х характеризует состояние изучаемого свойства в одной из рассматриваемых совокупностей, а случайная переменная у – состояние того же свойства во второй совокупности.

4

В зависимости от объема выборки:

4.1

При небольших объемах выборки:

а

Результаты измерения объектов первой выборки записать в ряд по возрастанию. Для каждого значения переменной х найти значение эмпирической функции распределения изучаемого свойства: , где а – число значений .

б

Результаты измерения объектов второй выборки записать в ряд по возрастанию. Для каждого значения переменной у найти значение эмпирической функции распределения изучаемого свойства: , где b – число значений .

в

Данные записать в таблицу вида:

xi

yj

.

4.2

При больших объемах выборок:

а

Составить таблицу, в которой значения наблюдений обеих выборок записываются в форме интервального ряда. Для каждого интервала значений наблюдений подсчитываются абсолютные частоты для каждой из выборок и .

б

По каждой выборке на основе абсолютных частот подсчитать накопительные частоты и .

в

Вычислить значения эмпирических функций по формулам: и .

г

Данные записать в таблицу вида:

Границы

интервала

Абсолютная

частота

Накопительная

частота

.

5

Сформулировать гипотезы:

Н0

Законы распределения случайных величин X и Y одинаковы в обеих рассматриваемых совокупностях.

Н1

Законы распределения случайных величин X и Y различны в обеих рассматриваемых совокупностях.

6

Вычислить значение по формуле , где .

Для нахождения значения данные можно записать в таблицу:

элементы

хi

.

7

Определить критические значения λ1кр и λ2кр, которые отвечают уровням значимости в 5% и 1% по таблицам № 13 или №14 приложения.

8

Расположить эмпирическое значение критерия и критические значения λ1кр и λ2кр на оси значимости.

9

Если находится в зоне незначимости, то принимается гипотеза Н0 об отсутствии различий. Если находится в зоне значимости, то гипотеза об отсутствии различий Н0 отклоняется и принимается гипотеза Н1 о наличии различий. Если находится в зоне неопределенности, то существует вероятность принятия ложного решения.

Пример. Для того, чтобы показать преимущества разработанной методической системы обучения решению задач относительно традиционной, в качестве одного из показателей эффективности использовались результаты выполнения студентами тестирования. Извлечены две выборки студентов объемами п1= 40 (новая методическая система обучения) и п2= 50 (традиционная система обучения). Результаты выполнения тестирования двух выборок представлены таблице.

Число верных ответов

Частота в первой выборке

Частота во второй выборке

41-45

1

1

46-50

1

0

51-55

1

1

56-60

0

1

61-65

1

4

66-70

1

2

71-75

1

2

76-80

2

6

81-85

3

5

86-90

4

2

91-95

10

8

96-100

15

18

40

50

Требуется проверить гипотезу H0 : число баллов, набранных на тестировании в обеих выборках, подчиняются одному и тому же закону распределенная. При альтернативной гипотезе H1: число баллов, набранных на тестировании, в обеих выборках подчиняются различным законам распределения.

Число верных ответов

Абсолютная

частота

Накопительная

частота

Эмпирическая

функция

41-45

1

1

1

1

0,03

0,02

0,01

46-50

1

0

2

1

0,05

0.02

0,03

51-55

1

1

3

2

0,08

0,04

0,04

56-60

0

1

3

3

0,08

0,06

0,02

61-65

1

4

4

7

0,10

0.14

0,04

66-70

1

2

5

9

0,13

0.18

0,05

71-75

1

2

6

11

0,15

0,22

0,07

76-80

2

6

8

17

0,20

0,34

0,14

81-85

3

5

11

22

0,28

0,44

0,16

86-90

4

2

15

24

0,38

0,48

0,10

91-95

10

8

25

32

0,63

0,64

0,01

96-100

15

18

40

50

1,00

1,00

0,00

Вычислим .

Определим по таблице № 13 приложения критические значения λ1кр и λ2кр, которые отвечают уровням значимости в 5% и 1%:

находится в зоне незначимости. Оснований для отклонения H0 нет, поэтому число баллов, набранных на тестировании в обеих группах, есть случайная величина, распределенная по одному и тому же закону, следовательно, говорить о преимуществах новой системы обучения относительно традиционной нельзя.