Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Семинар2 Критерии согласия

.docx
Скачиваний:
0
Добавлен:
05.01.2026
Размер:
395.12 Кб
Скачать

Семинар 2

Критерии согласия

Критерии согласия — это статистические инструменты, предназначенные для проверки гипотезы о том, что наблюдаемые данные следуют определённому теоретическому распределению или модели. Они позволяют оценить, насколько хорошо эмпирические данные (полученные из наблюдений) согласуются с ожидаемыми значениями, предсказанными теоретической моделью. Если расхождения между наблюдаемыми и ожидаемыми данными оказываются статистически незначимыми, гипотеза о согласии принимается; в противном случае она отвергается.

То есть, критерии согласия помогают потвердеть или опровергнуть гипотезу о наличии или отсутствии статистически значимых различиях между двумя и более выборками.

Критерий

Тип выборки

Количество выборок

Распределение

Описание

Критерий Пирсона (χ²)

Независимые

Одна или более

Ненормальное

Проверка согласия наблюдаемых частот с ожидаемыми в категориальных данных.

Критерий Колмогорова-Смирнова

Независимые

Одна

Любое

Сравнение эмпирической функции распределения с теоретической.

Критерий Шапиро-Уилка

Независимые

Одна

Нормальное

Проверка нормальности распределения (особенно для малых выборок).

Критерий Андерсона-Дарлинга

Независимые

Одна

Любое

Более чувствителен к отклонениям на "хвостах" распределения.

Критерий Крамера-фон Мизеса

Независимые

Одна

Любое

Основан на интегрировании квадрата разности между распределениями.

Критерий Лиллиефорса

Независимые

Одна

Нормальное

Модификация критерия Колмогорова-Смирнова для проверки нормальности.

Критерий Стьюдента (t-тест)

Зависимые/Независимые

Две

Нормальное

Сравнение средних двух выборок (зависимых или независимых).

F-критерий Фишера

Независимые

Две

Нормальное

Сравнение дисперсий двух выборок

Критерий Уилкоксона

Зависимые

Две

Ненормальное

Проверка сдвига в распределении для парных (зависимых) выборок.

Критерий Манна-Уитни

Независимые

Две

Ненормальное

Сравнение двух независимых выборок без предположения о нормальности.

Критерий Фридмана

Зависимые

Три и более

Ненормальное

Проверка различий между несколькими зависимыми выборками.

Критерий Крускала-Уоллиса

Независимые

Три и более

Ненормальное

Сравнение нескольких независимых выборок без предположения о нормальности.

  1. Тип выборки:

    • Независимые: Выборки, которые не связаны между собой (например, данные из разных групп).

    • Зависимые: Выборки, которые связаны между собой (например, измерения до и после эксперимента).

  2. Количество выборок:

    • Одна: Проверка распределения одной выборки.

    • Две: Сравнение двух выборок.

    • Три и более: Сравнение нескольких выборок.

  3. Распределение:

    • Нормальное: Критерии, которые предполагают или проверяют нормальность распределения.

    • Ненормальное: Критерии, которые не требуют предположения о нормальности.

Рассмотрим только несколько методов:

В Excel – t-критерий Стьюдента, F-критерий Фишера

В PSPP - t-критерий Стьюдента, критерий Краскала-Уоллиса

Разделим выборку на две группы мужчины и женщины и сравним новые две выборки.

Разделение выборок

Один из способов разделения выборки – это ранжирование выборки по возрастанию или убыванию.

Встаем на поле Пол и нажимаем на Главной – Сортировка и фильтр.

Выбираем способ сортировки – Сортировка по возрастанию или Сортировка по убыванию.

Соглашаемся с Дальнейшими действиями.

Нажимаем Сортировка. Ниже приведена отсортированная таблица.

п/п

Пол

Адаптация

Самопринятие

Принятие других

Эмоциональная комфортность

Интернальность

Стремление к доминированию

11

0

0,32

0,31

0,47

0,77

0,52

0,17

7

0

0,59

0,19

0,51

0,61

0,48

0,19

9

0

0,42

0,23

0,52

0,47

0,33

0,11

8

0

0,39

0,21

0,53

0,63

0,52

0,21

1

0

0,65

0,23

0,59

0,78

0,41

0,13

10

0

0,57

0,24

0,59

0,71

0,34

0,15

6

0

0,65

0,27

0,62

0,78

0,41

0,31

13

0

0,47

0,46

0,69

0,32

0,54

0,12

15

1

0,65

0,23

0,47

0,78

0,39

0,31

17

1

0,65

0,23

0,56

0,68

0,32

0,32

14

1

0,81

0,21

0,57

0,47

0,93

0,2

16

1

0,57

0,19

0,57

0,71

0,57

0,35

2

1

0,72

0,35

0,61

0,82

0,37

0,23

5

1

0,92

0,21

0,61

0,35

0,42

0,23

4

1

0,81

0,19

0,69

0,57

0,39

0,13

12

1

0,59

0,37

0,71

0,73

0,5

0,14

3

1

0,49

0,47

0,73

0,63

0,42

0,92

Как видим в столбце Пол сначала идут 0, затем идут 1.

Напомним, что

1 – женщины

0 – мужчины

Разделим таблицу на две таблицы. Можно разнести на два листа или вставить дополнительные строки.

Вычислим Среднее и Стандартное отклонение для мужчин и женщин отдельно

Сравним средние значения. Для этого можно сделать отдельную таблицу.

Чтобы копировать только значения без формулы воспользуйтесь специальной вставкой – Вставить значение и формат ячеек

Ниже таблица со средними значениями мужчин и женщин.

п/п

Пол

Адаптация

Самопринятие

Принятие других

Эмоциональная комфортность

Интернальность

Стремление к доминированию

Среднее мужчины

0,00

0,51

0,27

0,57

0,63

0,44

0,17

Среднее женщины

1,00

0,69

0,27

0,61

0,64

0,48

0,31

Можно нарисовать Диаграмму

Как видно, Адаптация и Стремление к доминированию у женщин выше, чем у мужчин. Среднее значение Адаптации у мужчин – 0,51, у женщин – 0,69.

Среднее значение Стремление к доминированию у мужчин – 0,17, у женщин – 0.31

Это может быть связано с различными причинами. Необходимо объяснить эти причины.

Теперь необходимо статистически подтвердить или опровергнуть гипотезу о том, что есть отличия между женщинами и мужчинами по характеристикам. Для этого воспользуемся Критериями согласия.

Проверить статистическую гипотезу о различии выборок мужчин и женщин

Нажмите Данные – Анализ данных

Выберите двухвыборочный t-тест с одинаковыми дисперсия – для одной генеральной выборки

Либо двухвыборочный t-тест с различными дисперсиями.

В интервал переменной 1 выделите столбец адаптация для женщин

В интервал переменной 2 выделите столбец адаптация для мужчин

Получите следующие данные

Двухвыборочный t-тест с различными дисперсиями

 

Переменная 1

Переменная 2

Среднее

0,5075

0,69

Дисперсия

0,015621429

0,018775

Наблюдения

8

9

Гипотетическая разность средних

0

df

15

t-статистика

-2,871687976

P(T<=t) одностороннее

0,005821977

t критическое одностороннее

1,753050356

P(T<=t) двухстороннее

0,011643954

t критическое двухстороннее

2,131449546

 

t-статистика, должна быть больше, чем t-критическое двухстороннее, для значимости. То есть 2,13 больше, чем 0,01. Значит, что есть статистически значимые различия

F-критерий Фишера считается аналогично

Данные ­ ­– Двухвыборочный F-тест для дисперсий.

Получим следующие значения для сравнения Адаптации и Самопринятия.

Двухвыборочный F-тест для дисперсии

 

Переменная 1

Переменная 2

Среднее

0,604118

0,27

Дисперсия

0,025038

0,008212

Наблюдения

17

17

df

16

16

F

3,048796

P(F<=f) одностороннее

0,016071

F критическое одностороннее

2,333484

 

Правило. Для статистически значимых различий между 2 группами F>F критическое одностороннее, а значение P одностороннее, должно быть меньше 0.05

Сравнение выборок в PSPP

Для нормального распределения. T-Критерий Стьюдента

В PSPP нажмите Анализ-Сравнение средних-T-проверка независимых выборок (для независимых выборок) и T-проверка парных выборок (для зависимых выборок)

В открывшемся оке в поле Переменные для проверки перенесите характеристик, которые будем сравнивать (подтверждать гипотезу о статистически значимых различиях)

В поле Группирующая переменная – Характеристика, по которой будем проводить сравнение. В исследовании сравнение будем проводить по полю Пол – мужчины и женщины. Перенесите поле Пол.

Нажмите определить группы.

И укажите значения для групп. Мужчины - 0, женщины – 1.

Нажмите Продолжить, затем ОК.

В полученной таблице проверяем столбец Значимость двухсторонняя, для обоих значений, если

Значимость меньше 0,05, то существует статистически значимое отличие для характеристики Адаптация для мужчин и женщин.

Если Значимость больше 0,05 то статистически значимое отличие отсутствует для характеристики Самопринятие для мужчин и женщин.

Сравнение зависимых выборок t-Критерий Стьюдента

Нажмите Анализ-Т-проверка парных выборок

В данном случае предполагается, что мы измеряли одни и те же характеристики у одинаковой выборки.

Поэтому необходимо переносить Переменные из левой колонки в правую попарно.

Затем нажимаем продолжить.

В полученной таблице проверяем значения Значение двухстороннее – оно должно быть меньше 0.05 для наличия статистически значимых различий.

Сравнение для ненормального распределения

Сравнение несвязанных выборок

Нажмите Анализ-Непараметрическая статистика – К независимых выборок для независимых выборок и К связанных выборок для зависимых выборок.

Перенесите в поле Список переменных для тестирования Характеристики, которые необходимо сравнить.

В поле группирующая переменная – переменная, по которой будем сравнивать. В переменной может быть две и более переменных.

Выберите Тип теста – Н-критерий Краскала-Уоллиса

Нажмите Определение групп. Укажите начальное значение в поле Нижний предел и максимальное значение в поле Верхний предел

Например, значения Переменной принимают значение 0,1, 2. Указываем в поле Нижний предел – 0, в Верхний предел 2.

Нажимаем Продолжить, а затем ОК.

В полученных результатах в таблице Критерии проверки проверяем Асимптотическая значимость.

Если Асимптотическая значимость <0,05, то для выборок есть статистически значимые различия. Например, для Адаптации есть статистические значимые различия для 3 выборок.

Если Асимптотическая значимость >0,05, то для выборок отсутствуют статистически значимые различия. Например, для Самопринятия есть статистические значимые различия для 3 выборок. Это значит, что мы не можем сравнивать средние для этих выборок.

Сравнение двух связанных выборок

Нажмите Анализ-Непараметрическая статистика – 2 связанные выборки для независимых выборок и К связанных выборок для зависимых выборок.

Данный метод работает по аналогии с t-критерием Стьюдента для зависимых выборок

Внесите попарно переменные для выборки

Поставьте галочку Тип теста Уилкоксон . Нажмите ОК.

В таблице Критерии проверки проверяем – значение Асимптотическая значимость. Чтобы были статистически значимые различия, значение должно быть меньше 0.05

Сравнение 3 и более связанных выборок

Нажмите Анализ-Непараметрическая статистика – K связанных выборок для независимых выборок и К связанных выборок для зависимых выборок.

В открывшемся поле Переносим из правого столбца одинаковые переменные для каждого раза измерений в поле Переменные для проверки

Например. Мы проводили исследование как повлияет мотивация на обучение студентов, но мотивирующие занятия будем проводить два или три раза.

Оценивать будем изменение среднего балла.

В поле переменные для проверки переносим переменную со средним баллом, до занятия, после первого занятия, после второго занятия, после третьего занятия. Другие переменные вносить не надо.

Выбираем Тип теста W – Кеделла

Проверяем таблицу Критерии проверки и смотрим значение Асимптотическая значимость.

Для наличия статистически значимых различий значение должно быть меньше 0.05