Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
пособие по матем методам.doc
Скачиваний:
223
Добавлен:
20.04.2019
Размер:
2.75 Mб
Скачать

7.5 Оценка сходства-различия распределений признаков

Для установления сходства - различия между эмпирическим и теоретическим распределениями (равномерным, нормальным или каким-то иным) используется 2- критерий Пирсона

где fi - эмпирическая частота для интервала квантования, ft - теоретическая (ожидаемая) частота для того же интервала. Сравнение эмпирического распределения с нормальным уже рассмотрено ранее. При сравнении эмпирического распределения с равномерным теоретическая (ожидаемая) частота интервала квантования находится по простой формуле:

Количество степеней свободы для сравнения эмпирического распределения с равномерным определяется по формуле

= k-1

где k - число групп или интервалов квантования.

Задача: определить, равномерно ли распределяется число полученных учениками неудовлетворительных оценок по месяцам учебного года.

Подсчитав по классному журналу «двойки» учеников, получили следующие результаты:

Таблица 18.

Месяц

Сен

Окт

Нояб

Дек

Янв

Фев

Март

Апр

Май

Кол-во «двоек»

10

20

15

12

14

12

20

18

14

Общее число «двоек» N=135. Если бы все они были распределены равномерно по 9 месяцам учебного года (k=9), то каждый месяц ученики получали бы 135/9=15 двоек. Это число 15 является теоретической частотой ft для расчета величины 2. Значения эмпирической частоты fi даны в условии задачи (таблица).

Н0: Распределение неудовлетворительных оценок по месяцам учебного года не отличается значимо от равномерного.

Н1: Распределение неудовлетворительных оценок по месяцам учебного года значимо отличается от равномерного.

Рассчитываем критерий 2 Пирсона:

Критическое значение критерия 2 определяется по таблицам (Таблица 3 Приложения), в нашем случае при =9-1=8 и =0.05 оно будет равным 15.51, при =0.10

2кр. =13.36, и при =0.20 2кр. =11.03.

Ответ: мы должны принять нулевую гипотезу и признать, что распределение двоек по месяцам статистически значимо не отличается от равномерного (=0.20).

Непараметрический критерий Колмогорова-Смирнова можно использовать для сравнения двух любых распределений, между собой. Критерий основан на сравнении накопленных частот в двух распределениях, упорядоченных по тому или иному принципу. Порядок применения критерия для сравнения двух эмпирических распределений следующий:

  1. Упорядочить распределения по одному и тому же основанию (принципу). Например, рассматривая темперамент учащихся двух классов, мы в первый интервал заносим данные меланхоликов, затем во второй интервал - флегматиков, потом сангвиников и, наконец, холериков как в первой, так и во второй выборках.

  2. Для каждого интервала распределения рассчитать относительную частоту

где fi - абсолютная частота интервала, а n - объем соответствующей выборки.

  1. Рассчитать накопленные частоты, сложив fотн каждого интервала с относительными частотами всех предшествующих интервалов. Накопленная частота последнего интервала равна 1.00.

  2. Рассчитать разность накопленных частот соответствующих интервалов двух распределений. Наибольшая по абсолютной величине (то есть без учета знака) из рассчитанных разностей используется для расчета эмпирического значения 

где (f1/n1 - f2/n2)max - наибольшая разность накопленных частот, а n1 и n2 - объем выборок.

  1. Сформулировать нулевую и альтернативную гипотезы:

Н0: Распределение 1 значимо не отличается от распределения 2.

Н1: Распределение 1 значимо отличается от распределения 2.

  1. Сравнить эмпирическое значение с критическим. Критические значения составляют:

Таблица 19.

Доверительная вероятность

0.80

0.90

0.95

0.99

0.999

Критическое значение 

1.07

1.22

1.36

1.63

1.95

Если эмпирическое значение больше критического, то принимается альтернативная гипотеза, если меньше, то нулевая.

Задача: Сопоставить профили распределения результатов ШТУР учениц 11 класса, показавших наилучший и наихудший результаты:

Таблица 20

Разделы ШТУР

Баллы «лучшей» ученицы

Относи-тельная частота

Накопленная частота

Баллы «худшей» ученицы

Относи-тельная частота

Накопленная частота

Разность накопленных частот

общая осведомленность

20

0,1626

0,163

15

0,2727

0,273

0,110

частная осведомленность

20

0,1626

0,325

9

0,1636

0,436

0,111

способности классификации

22

0,1789

0,504

6

0,1091

0,545

0,041

способности поиска аналогии

20

0,1626

0,666

8

0,1455

0,691

0,025

способности обобщения

29

0,2358

0,902

16

0,2909

0,982

0,080

способности выполнения счетных операций

12

0,0976

1,000

1

0,0182

1,000

0,000

Сумма

123

55

Н0: Профили распределения результатов ШТУР лучшей и худшей учениц значимо не отличаются друг от друга.

Н1: Профили распределения результатов ШТУР лучшей и худшей учениц различаются значимо.

Максимальное значение разности накопленных частот 0,111.

эмп. = 0,1116,165 = 0.684. эмп.< кр.(при доверительной вероятности 0.95), следовательно, принимается нулевая гипотеза.

Ответ: Профили распределения результатов ШТУР «лучшей» и «худшей» учениц не различаются значимо.