- •IBM SPSS Statistics Base 20
- •Содержание
- •1. Информация о данных
- •Вкладка Информация о данных: Вывод
- •Вкладка Информация о данных: Статистики
- •2. Частоты
- •Статистики в процедуре Частоты
- •Диаграммы в процедуре Частоты
- •Частоты: Формат
- •3. Описательные
- •Параметры процедуры Описательные статистики
- •Команда DESCRIPTIVES: дополнительные возможности
- •4. Исследовать
- •Статистики процедуры Исследовать
- •Графики процедуры Исследовать
- •Степенные преобразования в процедуре Исследовать
- •Параметры процедуры Исследовать
- •Команда EXAMINE: дополнительные возможности
- •5. Таблицы сопряженности
- •Слои таблиц сопряженности
- •Кластеризованные столбиковые диаграммы в процедуре Таблицы сопряженности
- •Таблицы сопряженности, выводящие переменные слоев в слоях таблицы
- •Вывод в ячейках для таблиц сопряженности
- •Формат таблиц сопряженности
- •6. Подытожить
- •Параметры процедуры Подытожить наблюдения
- •Статистики процедуры Подытожить наблюдения
- •7. Средние
- •Параметры процедуры Средние
- •8. OLAP Кубы
- •Статистики в процедуре OLAP Кубы
- •OLAP Кубы: Разности
- •OLAP Кубы: Заголовок
- •9. T-критерии
- •T-критерий для независимых выборок
- •Параметры процедуры T-критерий для независимых выборок
- •T-критерий для парных выборок
- •Параметры процедуры Т-критерий для парных выборок
- •Одновыборочный T-критерий
- •Параметры процедуры Одновыборочный T-критерий
- •Команда T-TEST: дополнительные возможности
- •10. Однофакторный дисперсионный анализ
- •Контрасты для однофакторного дисперсионного анализа
- •Апостериорные критерии для однофакторного дисперсионного анализа
- •Параметры процедуры Однофакторный дисперсионный анализ
- •Команда ONEWAY: дополнительные возможности
- •11. Общая линейная модель: одномерный анализ
- •Общая линейная модель (ОЛМ)
- •Создать члены
- •Сумма квадратов
- •Контрасты ОЛМ
- •Типы контрастов
- •Графики профилей в ОЛМ
- •Апостериорные сравнения в ОЛМ
- •Сохранение новых переменных в ОЛМ
- •Параметры процедуры ОЛМ
- •Команда UNIANOVA: дополнительные возможности
- •12. Парные корреляции
- •Параметры процедуры Парные корреляции
- •13. Частные корреляции
- •Параметры процедуры Частные корреляции
- •Команда PARTIAL CORR: дополнительные возможности
- •14. Расстояния
- •Меры различия
- •Меры сходства
- •Команда PROXIMITIES: дополнительные возможности
- •15. Линейные модели
- •Как запустить процедуру построения линейной модели
- •Цели
- •Основные параметры
- •Подбор модели
- •Ансамбли
- •Дополнительные параметры
- •Параметры модели
- •Сводка для модели
- •Автоматическая подготовка данных
- •Важность предикторов
- •Предсказанные против наблюденных
- •Остатки
- •Выбросы
- •Эффекты
- •Коэффициенты
- •Оцененные средние
- •Сводка по построению модели
- •16. Линейная регрессия
- •Методы отбора переменных для линейной регрессии
- •Задание правила отбора наблюдений для линейной регрессии
- •Графики процедуры Линейная регрессия
- •Линейная регрессия: Сохранение новых переменных
- •Статистики процедуры Линейная регрессия
- •Параметры процедуры Линейная регрессия
- •Команда REGRESSION: дополнительные возможности
- •17. Порядковая регрессия
- •Порядковая регрессия: Параметры
- •Порядковая регрессия: Вывод
- •Порядковая регрессия: Модель положения
- •Создать члены
- •Порядковая регрессия: Модель масштаба
- •Команда PLUM: дополнительные возможности
- •18. Подгонка кривых
- •Модели подгонки кривых
- •Подгонка кривых: Сохранить
- •19. Регрессия частично наименьших квадратов
- •Модель
- •Параметры
- •20. Анализ методом ближайших соседей
- •Соседи
- •Показатели
- •Группы
- •Сохранить
- •Вывод
- •Параметры
- •Вид Модель
- •Пространство показателей
- •Важность переменных
- •Соседи
- •Расстояния до ближайших соседей
- •Диаграмма квадрантов
- •Значения ошибок при отборе показателей
- •Значения ошибок при выборе k
- •Значения ошибок при отборе показателей и выборе k
- •Таблица классификации
- •Сводка ошибок
- •21. Дискриминантный анализ
- •Задание диапазона в процедуре Дискриминантный анализ
- •Отбор наблюдений для процедуры дискриминантного анализа
- •Статистики в процедуре Дискриминантный анализ
- •Метод пошагового отбора процедуры Дискриминантный анализ
- •Дискриминантный анализ: Классификация
- •Дискриминантный анализ: Сохранить
- •Команда DISCRIMINANT: дополнительные возможности
- •22. Факторный анализ
- •Отбор наблюдений для факторного анализа
- •Описательные статистики факторного анализа
- •Выделение факторов в процедуре Факторный анализ
- •Вращение факторов для факторного анализа
- •Значения факторов в процедуре факторного анализа
- •Параметры процедуры Факторный анализ
- •Команда FACTOR: дополнительные возможности
- •23. Выбор процедуры кластеризации
- •24. Двухэтапный кластерный анализ
- •Параметры процедуры Двухэтапный кластерный анализ
- •Вывод процедуры Двухэтапный кластерный анализ
- •Средство просмотра кластеров
- •Закладка Средство просмотра кластеров
- •Перемещение по средству просмотра кластеров
- •Фильтрация записей
- •25. Иерархический кластерный анализ
- •Задание метода иерархического кластерного анализа
- •Статистики для процедуры Иерархический кластерный анализ
- •Графики для процедуры Иерархический кластерный анализ
- •Сохранение новых переменных в процедуре Иерархический кластерный анализ
- •Эффективность кластерного анализа методом k-средних
- •Итерации в кластерном анализе методом k-средних
- •Сохранение новых переменных в кластерном анализе методом k-средних
- •Параметры процедуры Кластерный анализ методом К-средних
- •Команда QUICK CLUSTER: дополнительные возможности
- •27. Непараметрические критерии
- •Одновыборочные непараметрические критерии
- •Чтобы получить одновыборочные непараметрические критерии
- •Вкладка Поля
- •Вкладка Параметры
- •Непараметрические критерии для независимых выборок
- •Чтобы получить непараметрические критерии для независимых выборок
- •Вкладка Поля
- •Вкладка Параметры
- •Непараметрические критерии для связанных выборок
- •Чтобы применить непараметрические критерии для связанных выборок
- •Вкладка Поля
- •Вкладка Параметры
- •Представление модель
- •Сводка по проверке гипотез
- •Сводка по доверительным интервалам
- •Одновыборочный критерий
- •Критерии для связанных выборок
- •Критерий для независимых выборок
- •Информация по категориальным полям
- •Информация по количественным полям
- •Парные сравнения
- •Однородные подмножества
- •Команда NPTESTS: дополнительные возможности
- •Устаревшие диалоговые окна
- •Критерий хи-квадрат
- •Биномиальный критерий
- •Критерий серий
- •Одновыборочный критерий Колмогорова-Смирнова
- •Критерии для двух независимых выборок
- •Критерии для двух связанных выборок
- •Критерии для нескольких независимых выборок
- •Критерии для нескольких связанных выборок
- •28. Анализ множественных ответов
- •Задание наборов множественных ответов
- •Частоты для множественных ответов
- •Таблицы сопряженности для множественных ответов
- •Задание диапазонов переменных в таблицах сопряженности для наборов множественных ответов
- •Параметры процедуры Таблицы сопряженности для множественных ответов
- •Команда MULT RESPONSE: дополнительные возможности
- •29. Создание отчетов
- •Итоги по строкам
- •Как запустить процедуру выдачи итожащего отчета: Итоги по строкам
- •Параметры группировки отчета
- •Параметры отчета
- •Компоновка отчета
- •Заголовки отчета
- •Итоги по столбцам
- •Как запустить процедуру выдачи итожащего отчета: Итоги по столбцам
- •Итожащие функции столбцов данных
- •Формат столбцов отчета
- •Параметры группировки отчета с итогами по столбцам
- •Параметры отчета для итогов по столбцам
- •Компоновка отчета с итогами по столбцам
- •Команда REPORT: дополнительные возможности
- •30. Анализ пригодности
- •Статистики процедуры Анализ пригодности
- •Команда RELIABILITY: дополнительные возможности
- •31. Многомерное шкалирование
- •Многомерное шкалирование: Форма данных
- •Создание меры для многомерного шкалирования
- •Модель многомерного шкалирования
- •Параметры процедуры Многомерное шкалирование
- •Команда ALSCAL: дополнительные возможности
- •32. Статистики отношений
- •Статистики отношений
- •33. Кривые ROC
- •Параметры процедуры ROC Кривые
- •Указатель
220
Глава 27
Непараметрические критерии для независимых выборок
Процедура Непараметрические критерии для независимых выборок выявляет различия междудвумя илибольшим числом групп, используяодинили несколько непараметрических критериев. Непараметрические критерии не предполагают, что данные соответствуют нормальному распределению.
Рисунок 27-10
Вкладка Непараметрические критерии для независимых выборок: Цель
Какова Ваша цель? Вкладка цели позволяет быстро задать параметры для решения различных и в то же время наиболее типичных задач.
Автоматически сравнить распределения для групп. Для этой цели применяется
U-критерий Манна-Уитни к данным с 2 группами или однофакторный дисперсионный анализ Краскала-Уоллиса к данным с k группами.
Сравнить медианы для групп. Для этой цели применяется медианный критерий, сравнивающий наблюденные медианы в группах.
Настроить анализ. Выберите этот вариант при желании вручную внести коррективы в параметры тестирования на вкладке Параметры. Обратите внимание на то, что этот выбор производится автоматически, если на вкладке Параметры сделать изменения, несовместимые с выбранной целью.
Чтобы получить непараметрические критерии для независимых выборок
Выберите в меню:
Анализ > Непараметрические критерии > Для независимых выборок...
EЩелкните по кнопке Запуск.
Дополнительно Вы можете:
Задать цель на вкладке Цель.
221
Непараметрические критерии
Задать назначение полей на вкладке Поля.
Самостоятельно выбрать параметры на вкладке Параметры.
Вкладка Поля
Рисунок 27-11
Вкладка Непараметрические критерии для независимых выборок: Поля
На вкладке Поля задается, какие поля сравниваются и какие поля задают группы.
Использовать заранее заданные роли. При этом варианте выбора используется имеющаяся информация о полях. Все непрерывные поля с предопределенными ролями, такими как Целевая или Двойного назначения, будут использованы как проверяемые поля. Если имеется единственное категориальное поле с предопределенной ролью Входная, то оно будет использовано в качестве группирующего поля. В противном случае по умолчанию не будут использоваться группирующие поля, и назначения полей необходимо задать самостоятельно. Требуется, по крайней мере, одно проверяемое поле и одно группирующее поле.
Настроить назначение полей. Этот вариант выбора позволяет не принимать во внимание роли, назначенные полям. После выбора этого варианта задайте поля:
Проверяемые поля. Выберите одно или несколько непрерывных полей.
Группы. Выберите категориальное поле.
222
Глава 27
Вкладка Параметры
Вкладка Параметры содержит несколько различных групп параметров, которые можно изменять, чтобы точно настроить то, как алгоритм будет обрабатывать имеющиеся данные. Если в настройку параметров по умолчанию внести изменения, которые несовместимы с выбранной целью, то выбор на вкладке Цели будет автоматически изменен на Настроить анализ.
Выберите критерии
Рисунок 27-12
Параметры группы Выберите критерии (Непараметрические критерии для независимых выборок)
Эти параметры определяют, какие критерии будут применяться к полям, заданным на вкладке Поля.
Автоматически выбрать критерии на основе данных. При выборе этого варианта применяется U-критерий Манна-Уитни к данным с 2 группами или однофакторный дисперсионный анализ Краскала-Уоллиса к данным с k группами.
Настроить критерии. Этот вариант дает возможность выбрать применяемые критерии.
Сравнить распределения для групп. Здесь представлены критерии для независимых выборок для проверки того, извлечены ли выборки из одной и той же генеральной совокупности.
U Манна-Уитни (для 2-х выборок) использует ранги всех наблюдений, чтобы проверить, извлечены ли группы из одной и той же генеральной совокупности. Первое в порядке по возрастанию значение группирующего поля задает первую группу, а второе задает вторую группу. Если группирующее поле имеет более двух значений, то этот тест не выполняется.
223
Непараметрические критерии
Колмогорова-Смирнова (для 2-х выборок) чувствителен к любым различиям двух распределений в медианах, разбросе, скошенности и т.д. Если группирующее поле имеет более двух значений, то этот тест не выполняется.
Проверить последовательность на случайность (Вальда-Вольфовица для 2-х выборок)
задает применение критерия серий с групповой принадлежностью в качестве признака. Если группирующее поле имеет более двух значений, то этот тест не выполняется.
Однофакторный дисперсионный анализ Краскала-Уоллиса (для k выборок) является обобщением U-критерия Манна-Уитни и непараметрическим аналогом одномерного дисперсионного анализа. Дополнительно можно запросить множественные сравнения k
выборок, выбрав либо Все попарно, либо Пошагово вниз.
Критерий для упорядоченных альтернатив (Джонкхира-Терпстры для k выборок) является более мощной альтернативой критерию Краскала-Уоллиса, когда k выборок имеют естественное упорядочение. Например, k совокупностей могут представлять собой k возрастающих температур. Проверяется гипотеза о том, что разные температуры дают одинаковое распределение откликов, против альтернативной гипотезы о том, что при увеличении температуры возрастает и величина отклика. Здесь альтернативная гипотеза упорядочена; следовательно, наиболее подходящим будет критерий Джонкхира-Терпстры. Задайте порядок следования альтернативных гипотез; От наименьшей к наибольшей предполагает в качестве альтернативной гипотезы, что параметр положения первой группы не равен параметру положения второй группы, который в свою очередь не равен параметру положения третьей группы и т.д.; От наибольшей к наименьшейпредполагает в качестве альтернативной гипотезы, что параметр положения последней группы не равен параметру положения предпоследней группы, который в свою очередь не равен параметру положения третьей группы от конца и т.д. Дополнительно можно запросить множественные сравнения k выборок,
выбрав либо Все попарно, либо Пошагово вниз.
Сравнить диапазоны для групп. Здесь представлены критерии для независимых выборок для проверки того, что группы имеют одинаковый разброс. Экстремальной
реакции Мозеса (для 2-х выборок) сравнивает контрольную группу с группой сравнения. Первое в порядке по возрастанию значение группирующего поля задает контрольную группу, а второе задает группу сравнения. Если группирующее поле имеет более двух значений, то этот тест не выполняется.
Сравнить медианы для групп. Здесь представлены критерии для независимых выборок для проверки того, что группы имеют одинаковые медианы. Медианный критерий (для k выборок) может использовать либо объединенную выборочную медиану (вычисленную
по всем записям в наборе данных), либо заданное в качестве гипотетического значение медианы. Дополнительно можно запросить множественные сравнения k выборок,
выбрав либо Все попарно, либо Пошагово вниз.
Оценить доверительный интервал для групп. Оценка Ходжеса-Лемана (для 2-х выборок)
вычисляет оценку по независимым выборкам и доверительный интервал для разности медиан двух групп. Если группирующее поле имеет более двух значений, то этот тест не выполняется.
224
Глава 27
Параметры критериев
Рисунок 27-13
Параметры группы Параметры критериев (Непараметрические критерии для независимых выборок)
Уровень значимости. Здесь задается уровень значимости (альфа) для всех критериев. Задайте числовое значение между 0 и 1. 0,05 является значением по умолчанию.
Доверительный интервал (%). Здесь задается доверительный уровень для всех рассчитываемых доверительных интервалов. Задайте числовое значение между 0 и 100. 95 является значением по умолчанию.
Исключенные наблюдения. Здесь задается, какие наблюдения используются при выполнении тестов. Исключать наблюдения целиком означает, что записи с пропущенными значениями в любых полях, указанных в любой подкоманде, исключаются из анализа. Исключать по отдельности означает, что записи с пропущенными значениями в поле, используемом при выполнении конкретного теста, не используются при выполнении этого теста. Когда задано одновременно несколько тестов, для каждого из них вопрос об использовании записей с пропущенными значениями решается независимо от других.
Пользовательские пропущенные значения
Рисунок 27-14
Параметры группы Пользовательские пропущенные значения (Непараметрические критерии для независимых выборок)
Пользовательские пропущенные значения для категориальных полей. Категориальные поля должны иметь допустимые значения, для того чтобы запись была включена в анализ. С помощью этих управляющих элементов можно определить, рассматривать ли пользовательские пропущенные значения в категориальных полях как допустимые. Системные пропущенные значения и пропущенные значения для непрерывных полей всегда рассматриваются как недопустимые.