
- •Калинин а.А., Гусева с.И. Простейшие методы анализа данных в психологии
- •Введение
- •1. Шкалы
- •2. Случайное событие
- •3. Случайная величина
- •3.1 Распределение случайной величины
- •Способность обобщения учеников 10 класса одной из школ Ленинградской области (по результатам штур)
- •3.2 Параметры распределения
- •3.3 Нормальное распределение
- •4. Генеральная совокупность и выборка
- •5. Стандартизация психодиагностических методов
- •6. Статистические гипотезы
- •7. Математический аппарат проверки статистических гипотез
- •Подготовка данных и выбор критерия
- •Формулирование нулевой и альтернативной гипотез.
- •7.1. Подготовка данных
- •7.1.1 Порядок выявления аномальных значений
- •7.1.2 Проверка эмпирического распределения на его соответствие нормальному распределению
- •7.2 Сравнение среднего значения некоторой выборки со средним значением генеральной совокупности или с нормативным значением
- •7.3 Сравнение уровня признака в независимых выборках
- •7.4 Сравнение уровня признака в зависимых выборках
- •7.5 Оценка сходства-различия распределений признаков
- •8. Изучение взаимосвязи психологических явлений
- •8.1 Меры связи явлений, измеренных в номинативных шкалах
- •8.2 Корреляционная связь
- •8.2.1 Меры связи для явлений, измеренных в ранговых шкалах
- •8.2.2 Меры связи для явлений, измеренных в разных шкалах
- •8.2.3 Меры связи для явлений, измеренных в шкале интервалов или отношений
- •8.3 Корреляционный анализ
- •Список использованной литературы:
- •Критические значения f-критерия Фишера
- •Приложение 2 . Результаты штур, использованные при составлении задач настоящего методического пособия
- •11 Класса одной из школ Ленинградской области
- •Калинин а.А., Гусева с.И. Простейшие методы анализа данных в психологии
- •189620, Г. Пушкин, Петербургское шоссе, 10
7.5 Оценка сходства-различия распределений признаков
Для установления сходства - различия между эмпирическим и теоретическим распределениями (равномерным, нормальным или каким-то иным) используется 2- критерий Пирсона
где fi - эмпирическая частота для интервала квантования, ft - теоретическая (ожидаемая) частота для того же интервала. Сравнение эмпирического распределения с нормальным уже рассмотрено ранее. При сравнении эмпирического распределения с равномерным теоретическая (ожидаемая) частота интервала квантования находится по простой формуле:
Количество степеней свободы для сравнения эмпирического распределения с равномерным определяется по формуле
= k-1
где k - число групп или интервалов квантования.
Задача: определить, равномерно ли распределяется число полученных учениками неудовлетворительных оценок по месяцам учебного года.
Подсчитав по классному журналу «двойки» учеников, получили следующие результаты:
Таблица 18.
Месяц |
Сен |
Окт |
Нояб |
Дек |
Янв |
Фев |
Март |
Апр |
Май |
Кол-во «двоек» |
10 |
20 |
15 |
12 |
14 |
12 |
20 |
18 |
14 |
Общее число «двоек» N=135. Если бы все они были распределены равномерно по 9 месяцам учебного года (k=9), то каждый месяц ученики получали бы 135/9=15 двоек. Это число 15 является теоретической частотой ft для расчета величины 2. Значения эмпирической частоты fi даны в условии задачи (таблица).
Н0: Распределение неудовлетворительных оценок по месяцам учебного года не отличается значимо от равномерного.
Н1: Распределение неудовлетворительных оценок по месяцам учебного года значимо отличается от равномерного.
Рассчитываем критерий 2 Пирсона:
Критическое значение критерия 2 определяется по таблицам (Таблица 3 Приложения), в нашем случае при =9-1=8 и =0.05 оно будет равным 15.51, при =0.10
2кр. =13.36, и при =0.20 2кр. =11.03.
Ответ: мы должны принять нулевую гипотезу и признать, что распределение двоек по месяцам статистически значимо не отличается от равномерного (=0.20).
Непараметрический критерий Колмогорова-Смирнова можно использовать для сравнения двух любых распределений, между собой. Критерий основан на сравнении накопленных частот в двух распределениях, упорядоченных по тому или иному принципу. Порядок применения критерия для сравнения двух эмпирических распределений следующий:
Упорядочить распределения по одному и тому же основанию (принципу). Например, рассматривая темперамент учащихся двух классов, мы в первый интервал заносим данные меланхоликов, затем во второй интервал - флегматиков, потом сангвиников и, наконец, холериков как в первой, так и во второй выборках.
Для каждого интервала распределения рассчитать относительную частоту
где fi - абсолютная частота интервала, а n - объем соответствующей выборки.
Рассчитать накопленные частоты, сложив fотн каждого интервала с относительными частотами всех предшествующих интервалов. Накопленная частота последнего интервала равна 1.00.
Рассчитать разность накопленных частот соответствующих интервалов двух распределений. Наибольшая по абсолютной величине (то есть без учета знака) из рассчитанных разностей используется для расчета эмпирического значения
где (f1/n1 - f2/n2)max - наибольшая разность накопленных частот, а n1 и n2 - объем выборок.
Сформулировать нулевую и альтернативную гипотезы:
Н0: Распределение 1 значимо не отличается от распределения 2.
Н1: Распределение 1 значимо отличается от распределения 2.
Сравнить эмпирическое значение с критическим. Критические значения составляют:
Таблица 19.
Доверительная вероятность |
0.80 |
0.90 |
0.95 |
0.99 |
0.999 |
Критическое значение |
1.07 |
1.22 |
1.36 |
1.63 |
1.95 |
Если эмпирическое значение больше критического, то принимается альтернативная гипотеза, если меньше, то нулевая.
Задача: Сопоставить профили распределения результатов ШТУР учениц 11 класса, показавших наилучший и наихудший результаты:
Таблица 20
Разделы ШТУР |
Баллы «лучшей» ученицы |
Относи-тельная частота |
Накопленная частота |
Баллы «худшей» ученицы |
Относи-тельная частота |
Накопленная частота |
Разность накопленных частот |
общая осведомленность |
20 |
0,1626 |
0,163 |
15 |
0,2727 |
0,273 |
0,110 |
частная осведомленность |
20 |
0,1626 |
0,325 |
9 |
0,1636 |
0,436 |
0,111 |
способности классификации |
22 |
0,1789 |
0,504 |
6 |
0,1091 |
0,545 |
0,041 |
способности поиска аналогии |
20 |
0,1626 |
0,666 |
8 |
0,1455 |
0,691 |
0,025 |
способности обобщения |
29 |
0,2358 |
0,902 |
16 |
0,2909 |
0,982 |
0,080 |
способности выполнения счетных операций |
12 |
0,0976 |
1,000 |
1 |
0,0182 |
1,000 |
0,000 |
Сумма |
123 |
|
|
55 |
|
|
|
Н0: Профили распределения результатов ШТУР лучшей и худшей учениц значимо не отличаются друг от друга.
Н1: Профили распределения результатов ШТУР лучшей и худшей учениц различаются значимо.
Максимальное значение разности накопленных частот 0,111.
эмп. = 0,1116,165 = 0.684. эмп.< кр.(при доверительной вероятности 0.95), следовательно, принимается нулевая гипотеза.
Ответ: Профили распределения результатов ШТУР «лучшей» и «худшей» учениц не различаются значимо.