Семинар2 Критерии согласия
.docxСеминар 2
Критерии согласия
Критерии согласия — это статистические инструменты, предназначенные для проверки гипотезы о том, что наблюдаемые данные следуют определённому теоретическому распределению или модели. Они позволяют оценить, насколько хорошо эмпирические данные (полученные из наблюдений) согласуются с ожидаемыми значениями, предсказанными теоретической моделью. Если расхождения между наблюдаемыми и ожидаемыми данными оказываются статистически незначимыми, гипотеза о согласии принимается; в противном случае она отвергается.
То есть, критерии согласия помогают потвердеть или опровергнуть гипотезу о наличии или отсутствии статистически значимых различиях между двумя и более выборками.
Критерий |
Тип выборки |
Количество выборок |
Распределение |
Описание |
Критерий Пирсона (χ²) |
Независимые |
Одна или более |
Ненормальное |
Проверка согласия наблюдаемых частот с ожидаемыми в категориальных данных. |
Критерий Колмогорова-Смирнова |
Независимые |
Одна |
Любое |
Сравнение эмпирической функции распределения с теоретической. |
Критерий Шапиро-Уилка |
Независимые |
Одна |
Нормальное |
Проверка нормальности распределения (особенно для малых выборок). |
Критерий Андерсона-Дарлинга |
Независимые |
Одна |
Любое |
Более чувствителен к отклонениям на "хвостах" распределения. |
Критерий Крамера-фон Мизеса |
Независимые |
Одна |
Любое |
Основан на интегрировании квадрата разности между распределениями. |
Критерий Лиллиефорса |
Независимые |
Одна |
Нормальное |
Модификация критерия Колмогорова-Смирнова для проверки нормальности. |
Критерий Стьюдента (t-тест) |
Зависимые/Независимые |
Две |
Нормальное |
Сравнение средних двух выборок (зависимых или независимых). |
F-критерий Фишера |
Независимые |
Две |
Нормальное |
Сравнение дисперсий двух выборок |
Критерий Уилкоксона |
Зависимые |
Две |
Ненормальное |
Проверка сдвига в распределении для парных (зависимых) выборок. |
Критерий Манна-Уитни |
Независимые |
Две |
Ненормальное |
Сравнение двух независимых выборок без предположения о нормальности. |
Критерий Фридмана |
Зависимые |
Три и более |
Ненормальное |
Проверка различий между несколькими зависимыми выборками. |
Критерий Крускала-Уоллиса |
Независимые |
Три и более |
Ненормальное |
Сравнение нескольких независимых выборок без предположения о нормальности. |
Тип выборки:
Независимые: Выборки, которые не связаны между собой (например, данные из разных групп).
Зависимые: Выборки, которые связаны между собой (например, измерения до и после эксперимента).
Количество выборок:
Одна: Проверка распределения одной выборки.
Две: Сравнение двух выборок.
Три и более: Сравнение нескольких выборок.
Распределение:
Нормальное: Критерии, которые предполагают или проверяют нормальность распределения.
Ненормальное: Критерии, которые не требуют предположения о нормальности.
Рассмотрим только несколько методов:
В Excel – t-критерий Стьюдента, F-критерий Фишера
В PSPP - t-критерий Стьюдента, критерий Краскала-Уоллиса
Разделим выборку на две группы мужчины и женщины и сравним новые две выборки.
Разделение выборок
Один из способов разделения выборки – это ранжирование выборки по возрастанию или убыванию.
Встаем на поле Пол и нажимаем на Главной – Сортировка и фильтр.
Выбираем способ сортировки – Сортировка по возрастанию или Сортировка по убыванию.
Соглашаемся с Дальнейшими действиями.
Нажимаем Сортировка. Ниже приведена отсортированная таблица.
№ п/п |
Пол |
Адаптация |
Самопринятие |
Принятие других |
Эмоциональная комфортность |
Интернальность |
Стремление к доминированию |
11 |
0 |
0,32 |
0,31 |
0,47 |
0,77 |
0,52 |
0,17 |
7 |
0 |
0,59 |
0,19 |
0,51 |
0,61 |
0,48 |
0,19 |
9 |
0 |
0,42 |
0,23 |
0,52 |
0,47 |
0,33 |
0,11 |
8 |
0 |
0,39 |
0,21 |
0,53 |
0,63 |
0,52 |
0,21 |
1 |
0 |
0,65 |
0,23 |
0,59 |
0,78 |
0,41 |
0,13 |
10 |
0 |
0,57 |
0,24 |
0,59 |
0,71 |
0,34 |
0,15 |
6 |
0 |
0,65 |
0,27 |
0,62 |
0,78 |
0,41 |
0,31 |
13 |
0 |
0,47 |
0,46 |
0,69 |
0,32 |
0,54 |
0,12 |
15 |
1 |
0,65 |
0,23 |
0,47 |
0,78 |
0,39 |
0,31 |
17 |
1 |
0,65 |
0,23 |
0,56 |
0,68 |
0,32 |
0,32 |
14 |
1 |
0,81 |
0,21 |
0,57 |
0,47 |
0,93 |
0,2 |
16 |
1 |
0,57 |
0,19 |
0,57 |
0,71 |
0,57 |
0,35 |
2 |
1 |
0,72 |
0,35 |
0,61 |
0,82 |
0,37 |
0,23 |
5 |
1 |
0,92 |
0,21 |
0,61 |
0,35 |
0,42 |
0,23 |
4 |
1 |
0,81 |
0,19 |
0,69 |
0,57 |
0,39 |
0,13 |
12 |
1 |
0,59 |
0,37 |
0,71 |
0,73 |
0,5 |
0,14 |
3 |
1 |
0,49 |
0,47 |
0,73 |
0,63 |
0,42 |
0,92 |
Как видим в столбце Пол сначала идут 0, затем идут 1.
Напомним, что
1 – женщины
0 – мужчины
Разделим таблицу на две таблицы. Можно разнести на два листа или вставить дополнительные строки.
Вычислим Среднее и Стандартное отклонение для мужчин и женщин отдельно
Сравним средние значения. Для этого можно сделать отдельную таблицу.
Чтобы копировать только значения без формулы воспользуйтесь специальной вставкой – Вставить значение и формат ячеек
Ниже таблица со средними значениями мужчин и женщин.
№ п/п |
Пол |
Адаптация |
Самопринятие |
Принятие других |
Эмоциональная комфортность |
Интернальность |
Стремление к доминированию |
Среднее мужчины |
0,00 |
0,51 |
0,27 |
0,57 |
0,63 |
0,44 |
0,17 |
Среднее женщины |
1,00 |
0,69 |
0,27 |
0,61 |
0,64 |
0,48 |
0,31 |
Можно нарисовать Диаграмму
Как видно, Адаптация и Стремление к доминированию у женщин выше, чем у мужчин. Среднее значение Адаптации у мужчин – 0,51, у женщин – 0,69.
Среднее значение Стремление к доминированию у мужчин – 0,17, у женщин – 0.31
Это может быть связано с различными причинами. Необходимо объяснить эти причины.
Теперь необходимо статистически подтвердить или опровергнуть гипотезу о том, что есть отличия между женщинами и мужчинами по характеристикам. Для этого воспользуемся Критериями согласия.
Проверить статистическую гипотезу о различии выборок мужчин и женщин
Нажмите Данные – Анализ данных
Выберите двухвыборочный t-тест с одинаковыми дисперсия – для одной генеральной выборки
Либо двухвыборочный t-тест с различными дисперсиями.
В интервал переменной 1 выделите столбец адаптация для женщин
В интервал переменной 2 выделите столбец адаптация для мужчин
Получите следующие данные
Двухвыборочный t-тест с различными дисперсиями |
||
|
|
|
|
Переменная 1 |
Переменная 2 |
Среднее |
0,5075 |
0,69 |
Дисперсия |
0,015621429 |
0,018775 |
Наблюдения |
8 |
9 |
Гипотетическая разность средних |
0 |
|
df |
15 |
|
t-статистика |
-2,871687976 |
|
P(T<=t) одностороннее |
0,005821977 |
|
t критическое одностороннее |
1,753050356 |
|
P(T<=t) двухстороннее |
0,011643954 |
|
t критическое двухстороннее |
2,131449546 |
|
t-статистика, должна быть больше, чем t-критическое двухстороннее, для значимости. То есть 2,13 больше, чем 0,01. Значит, что есть статистически значимые различия
F-критерий Фишера считается аналогично
Данные – Двухвыборочный F-тест для дисперсий.
Получим следующие значения для сравнения Адаптации и Самопринятия.
Двухвыборочный F-тест для дисперсии |
||
|
|
|
|
Переменная 1 |
Переменная 2 |
Среднее |
0,604118 |
0,27 |
Дисперсия |
0,025038 |
0,008212 |
Наблюдения |
17 |
17 |
df |
16 |
16 |
F |
3,048796 |
|
P(F<=f) одностороннее |
0,016071 |
|
F критическое одностороннее |
2,333484 |
|
Правило. Для статистически значимых различий между 2 группами F>F критическое одностороннее, а значение P одностороннее, должно быть меньше 0.05
Сравнение выборок в PSPP
Для нормального распределения. T-Критерий Стьюдента
В PSPP нажмите Анализ-Сравнение средних-T-проверка независимых выборок (для независимых выборок) и T-проверка парных выборок (для зависимых выборок)
В открывшемся оке в поле Переменные для проверки перенесите характеристик, которые будем сравнивать (подтверждать гипотезу о статистически значимых различиях)
В поле Группирующая переменная – Характеристика, по которой будем проводить сравнение. В исследовании сравнение будем проводить по полю Пол – мужчины и женщины. Перенесите поле Пол.
Нажмите определить группы.
И укажите значения для групп. Мужчины - 0, женщины – 1.
Нажмите Продолжить, затем ОК.
В полученной таблице проверяем столбец Значимость двухсторонняя, для обоих значений, если
Значимость меньше 0,05, то существует статистически значимое отличие для характеристики Адаптация для мужчин и женщин.
Если Значимость больше 0,05 то статистически значимое отличие отсутствует для характеристики Самопринятие для мужчин и женщин.
Сравнение зависимых выборок t-Критерий Стьюдента
Нажмите Анализ-Т-проверка парных выборок
В данном случае предполагается, что мы измеряли одни и те же характеристики у одинаковой выборки.
Поэтому необходимо переносить Переменные из левой колонки в правую попарно.
Затем нажимаем продолжить.
В полученной таблице проверяем значения Значение двухстороннее – оно должно быть меньше 0.05 для наличия статистически значимых различий.
Сравнение для ненормального распределения
Сравнение несвязанных выборок
Нажмите Анализ-Непараметрическая статистика – К независимых выборок для независимых выборок и К связанных выборок для зависимых выборок.
Перенесите в поле Список переменных для тестирования Характеристики, которые необходимо сравнить.
В поле группирующая переменная – переменная, по которой будем сравнивать. В переменной может быть две и более переменных.
Выберите Тип теста – Н-критерий Краскала-Уоллиса
Нажмите Определение групп. Укажите начальное значение в поле Нижний предел и максимальное значение в поле Верхний предел
Например, значения Переменной принимают значение 0,1, 2. Указываем в поле Нижний предел – 0, в Верхний предел 2.
Нажимаем Продолжить, а затем ОК.
В полученных результатах в таблице Критерии проверки проверяем Асимптотическая значимость.
Если Асимптотическая значимость <0,05, то для выборок есть статистически значимые различия. Например, для Адаптации есть статистические значимые различия для 3 выборок.
Если Асимптотическая значимость >0,05, то для выборок отсутствуют статистически значимые различия. Например, для Самопринятия есть статистические значимые различия для 3 выборок. Это значит, что мы не можем сравнивать средние для этих выборок.
Сравнение двух связанных выборок
Нажмите Анализ-Непараметрическая статистика – 2 связанные выборки для независимых выборок и К связанных выборок для зависимых выборок.
Данный метод работает по аналогии с t-критерием Стьюдента для зависимых выборок
Внесите попарно переменные для выборки
Поставьте галочку Тип теста Уилкоксон . Нажмите ОК.
В таблице Критерии проверки проверяем – значение Асимптотическая значимость. Чтобы были статистически значимые различия, значение должно быть меньше 0.05
Сравнение 3 и более связанных выборок
Нажмите Анализ-Непараметрическая статистика – K связанных выборок для независимых выборок и К связанных выборок для зависимых выборок.
В открывшемся поле Переносим из правого столбца одинаковые переменные для каждого раза измерений в поле Переменные для проверки
Например. Мы проводили исследование как повлияет мотивация на обучение студентов, но мотивирующие занятия будем проводить два или три раза.
Оценивать будем изменение среднего балла.
В поле переменные для проверки переносим переменную со средним баллом, до занятия, после первого занятия, после второго занятия, после третьего занятия. Другие переменные вносить не надо.
Выбираем Тип теста W – Кеделла
Проверяем таблицу Критерии проверки и смотрим значение Асимптотическая значимость.
Для наличия статистически значимых различий значение должно быть меньше 0.05
