Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
SPSS.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
89.22 Кб
Скачать

14 Февраля

Джентльменский набор для статей, курсовых и дипломных и ты

Словесное описание данных

На уровне описательной статистики средних разбросов

Статистический анализ

Обсуждения (интерпретации) результатов

Среднее, мода, медиана - это общее описание нашей выборки

А дальше это описание мы обосновываваем статистически

Это называется дискриптивный описательный анализ.

Как изменяется одна или несколько зависимых переменных (подытоженные в спсс).

Анализ - отчеты - OLAP кубы. Подытоженные переменные - ЗП. Группирующие переменные - независимые (которые группирирует по какому-либо критерию). В виде каких описательных статистик (статистические показатели - среднее, модуль, медиана, дисперсия)? Так показывается, что мы подобрались хорошую группу, адекватную нашему исследованию. В хороших журналах требуют еще и ошибку среднего. Мощное средство группировки данных по НП.

Анализ- описательные статистик - Частоты - Строит графики и диаграммы. Когда нужно быстро охарактерезовать выборку по возрасту или любому другому признаку. Здесь можно и описательные статистики (медиана, среднее, мода) - Важно при описании внешней валидности.

Мера среднего - медиана. Должен использоваться для оценки средних в не количественных данных (в порядковых). Середина ранжированного ряда. Что было в середине.

Мода - когда данные измерены по наминальной шкале. Самое частотное событие для этих данных.

Среднее арифметическое - что среднее

В нормальном распределении мода, медиана и среднее одно и тоже.

Анализ - описательные статистики - описательные (тоже самое, но в виде длинной таблице)

Анализ - описательные статистики - разведочный анализ. Посчитать групповых среднее. Разбить выборку. Хочу по уровню НП рассчитать и разбить ЗП. Разбить выборку на несколько групп и посчитать межгрупповые средние (маргинальные- группы, разбитых по уровню какой-либо НП). Разбив по несколько основаниям по группам, мы произвели эксплураторный анализ.

Н0 - различий нет

Н1 - различия есть

Парные выборки (связанные) - выборки данных, полученные на одной и той же группы испытуемых. Одни и ту же испытуемые и до того, и после. Например сравнить эффект от тренинга: сначала до тренинга, после, через 5 лет - все равно люди одни и те же.

Непарные выборки - полученные на разных выборках, например мужчины и женщины.

Два дизайна - мужгрупповой и внутригрупповой

Важные вопросы перед планированием и обработкой данных?

  1. Первый вопрос - какой уровень измерения (номинальный, порядковый...) -> параметрические или не параметрический метод

  2. Какой подход -мужгрупповой и внутригрупповой

Анализ - сравнение средних - Т-критерий для независимых выборок (работает только с количественными данными, нет порядковых и номинальных; работает по шкале интервалов). Ограничения - работает с распределения ми, похожими на нормальные. Два распределения - Т-критерий смотрит далеко ли средние друг от друга, сравнивает разницу между средними, деленную на общую дисперсию и кол-во испытуемых. А если распределение сложное (два горба и более)? Т-критерий работает, когда выражено одно среднее. Ярко выражена одна вершина - мономодальное, ровное, без перекосов (эксцессов). Чтобы решить, можно ли использовать Т-критерий, надо нарисовать распределение и посмотреть. Должно быть равно мерное распределение, симметричное относительно своей моды (верхушки).

В другом случае используем не параметрический критерий - но они имеют меньшую мощность(способность статистического критерия найти различие, Т-критерий более чувствителен к нахождению различий). На небольших выборках преимущественно используют не параметрические. Выборка > 30 уже большая.

!!!важно посмотреть график распределения своих данных! Сразу видны выбросы недочеты.

Анализ - сравнение средних - одновыборочный Т-критерий. Сравниваем свою выборку со средней литературной. В случае когда повторяем исследование кого-нибудь. Исследование тоже самое, но возраст ваших испытуемых отличается. Вот и проверяем ужасно ли это, сильно ли отличие от выборки изначального автора. 48 лет у русских отличается от среднего возраста по выборке американцев, которые мы нашли в литературе. проверяемое значение - которое теоретически мы нашли где-то в литературе, с которым сравниваемым. Сравнение возраста нашего с литературным источником.

Критерий Ливиня показывает насколько разный разброс. И соответственно показывает, насколько вариативна выборка и насколько возможно использовать Т-критерий. Значимость < 0,05 значит значимо различаются! Т-критерий > 0,05 достоверных значимых различий нет. Конвинциональный уровень значимости <0,05. Квазизначимая или тенденция 0,05-1 "очевидно тенденция есть/ ярко выражена тенденция, но достоверной значимости обнаружено не было"

Анализ - сравнение средних - одновыборочный Т-критерий. Проверка гипотез по сравнению парных выборок. Три повторных измерения на одних и тех же испытуемых. Зависимая выборка, так как это одна и та же группа испытуемых = Т-критерий для парных выборок. Раз они парные, то они конечно скоррелированы. т-критерий (0,6) при значимости (0,6) не достоверно. Нет значимости (Т=0,5; 15(кол-во респондентов); 0,5 (значимость))

Отличается одна из групп от остальных 5?

Уровень значимости - ошибка первого рода - вероятность, что есть ошибка, а ее на самом деле нет. Вероятность ошибки статистического вывода: сказали ДА, а на самом деле НЕТ. Но при таких множетых сравнений (1 со 2, 1 с 3 ...) уровень ошибки накапливается. Дисперсионный анализ решает задачу множественного сравнения средних.

Непараметрический критерий нужен, когда не работает Т-критерий или когда используем низкий уровень измерения - шкала порядка + ранжирование. Одновыборочные критерии - хи-квадрат и критерий Колмогорова -Смирнова (оценивает распределение на нормальность). Уровень распределения > 0.05 нет оснований говорить, что они отличаются от нормальной - Н0 отличия нет. Две независимые выборки - U Манна - Уитни(самый мощный)

Критерии для двух связанных выборок - критерий Уилкоксона самый сильный; Знаков работает с ответами "да"/ "нет".

Анализ - непараметрический критерий для сравнения двух выборок (средние они не сравнивают, работают с медианой)

Все критерии различия. Ребят группировки данных!!! Важно запланировать параметры группировки!

Дисперсионный анализ жестко параметрическая процедура!!

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]