- •IBM SPSS Statistics Base 20
- •Содержание
- •1. Информация о данных
- •Вкладка Информация о данных: Вывод
- •Вкладка Информация о данных: Статистики
- •2. Частоты
- •Статистики в процедуре Частоты
- •Диаграммы в процедуре Частоты
- •Частоты: Формат
- •3. Описательные
- •Параметры процедуры Описательные статистики
- •Команда DESCRIPTIVES: дополнительные возможности
- •4. Исследовать
- •Статистики процедуры Исследовать
- •Графики процедуры Исследовать
- •Степенные преобразования в процедуре Исследовать
- •Параметры процедуры Исследовать
- •Команда EXAMINE: дополнительные возможности
- •5. Таблицы сопряженности
- •Слои таблиц сопряженности
- •Кластеризованные столбиковые диаграммы в процедуре Таблицы сопряженности
- •Таблицы сопряженности, выводящие переменные слоев в слоях таблицы
- •Вывод в ячейках для таблиц сопряженности
- •Формат таблиц сопряженности
- •6. Подытожить
- •Параметры процедуры Подытожить наблюдения
- •Статистики процедуры Подытожить наблюдения
- •7. Средние
- •Параметры процедуры Средние
- •8. OLAP Кубы
- •Статистики в процедуре OLAP Кубы
- •OLAP Кубы: Разности
- •OLAP Кубы: Заголовок
- •9. T-критерии
- •T-критерий для независимых выборок
- •Параметры процедуры T-критерий для независимых выборок
- •T-критерий для парных выборок
- •Параметры процедуры Т-критерий для парных выборок
- •Одновыборочный T-критерий
- •Параметры процедуры Одновыборочный T-критерий
- •Команда T-TEST: дополнительные возможности
- •10. Однофакторный дисперсионный анализ
- •Контрасты для однофакторного дисперсионного анализа
- •Апостериорные критерии для однофакторного дисперсионного анализа
- •Параметры процедуры Однофакторный дисперсионный анализ
- •Команда ONEWAY: дополнительные возможности
- •11. Общая линейная модель: одномерный анализ
- •Общая линейная модель (ОЛМ)
- •Создать члены
- •Сумма квадратов
- •Контрасты ОЛМ
- •Типы контрастов
- •Графики профилей в ОЛМ
- •Апостериорные сравнения в ОЛМ
- •Сохранение новых переменных в ОЛМ
- •Параметры процедуры ОЛМ
- •Команда UNIANOVA: дополнительные возможности
- •12. Парные корреляции
- •Параметры процедуры Парные корреляции
- •13. Частные корреляции
- •Параметры процедуры Частные корреляции
- •Команда PARTIAL CORR: дополнительные возможности
- •14. Расстояния
- •Меры различия
- •Меры сходства
- •Команда PROXIMITIES: дополнительные возможности
- •15. Линейные модели
- •Как запустить процедуру построения линейной модели
- •Цели
- •Основные параметры
- •Подбор модели
- •Ансамбли
- •Дополнительные параметры
- •Параметры модели
- •Сводка для модели
- •Автоматическая подготовка данных
- •Важность предикторов
- •Предсказанные против наблюденных
- •Остатки
- •Выбросы
- •Эффекты
- •Коэффициенты
- •Оцененные средние
- •Сводка по построению модели
- •16. Линейная регрессия
- •Методы отбора переменных для линейной регрессии
- •Задание правила отбора наблюдений для линейной регрессии
- •Графики процедуры Линейная регрессия
- •Линейная регрессия: Сохранение новых переменных
- •Статистики процедуры Линейная регрессия
- •Параметры процедуры Линейная регрессия
- •Команда REGRESSION: дополнительные возможности
- •17. Порядковая регрессия
- •Порядковая регрессия: Параметры
- •Порядковая регрессия: Вывод
- •Порядковая регрессия: Модель положения
- •Создать члены
- •Порядковая регрессия: Модель масштаба
- •Команда PLUM: дополнительные возможности
- •18. Подгонка кривых
- •Модели подгонки кривых
- •Подгонка кривых: Сохранить
- •19. Регрессия частично наименьших квадратов
- •Модель
- •Параметры
- •20. Анализ методом ближайших соседей
- •Соседи
- •Показатели
- •Группы
- •Сохранить
- •Вывод
- •Параметры
- •Вид Модель
- •Пространство показателей
- •Важность переменных
- •Соседи
- •Расстояния до ближайших соседей
- •Диаграмма квадрантов
- •Значения ошибок при отборе показателей
- •Значения ошибок при выборе k
- •Значения ошибок при отборе показателей и выборе k
- •Таблица классификации
- •Сводка ошибок
- •21. Дискриминантный анализ
- •Задание диапазона в процедуре Дискриминантный анализ
- •Отбор наблюдений для процедуры дискриминантного анализа
- •Статистики в процедуре Дискриминантный анализ
- •Метод пошагового отбора процедуры Дискриминантный анализ
- •Дискриминантный анализ: Классификация
- •Дискриминантный анализ: Сохранить
- •Команда DISCRIMINANT: дополнительные возможности
- •22. Факторный анализ
- •Отбор наблюдений для факторного анализа
- •Описательные статистики факторного анализа
- •Выделение факторов в процедуре Факторный анализ
- •Вращение факторов для факторного анализа
- •Значения факторов в процедуре факторного анализа
- •Параметры процедуры Факторный анализ
- •Команда FACTOR: дополнительные возможности
- •23. Выбор процедуры кластеризации
- •24. Двухэтапный кластерный анализ
- •Параметры процедуры Двухэтапный кластерный анализ
- •Вывод процедуры Двухэтапный кластерный анализ
- •Средство просмотра кластеров
- •Закладка Средство просмотра кластеров
- •Перемещение по средству просмотра кластеров
- •Фильтрация записей
- •25. Иерархический кластерный анализ
- •Задание метода иерархического кластерного анализа
- •Статистики для процедуры Иерархический кластерный анализ
- •Графики для процедуры Иерархический кластерный анализ
- •Сохранение новых переменных в процедуре Иерархический кластерный анализ
- •Эффективность кластерного анализа методом k-средних
- •Итерации в кластерном анализе методом k-средних
- •Сохранение новых переменных в кластерном анализе методом k-средних
- •Параметры процедуры Кластерный анализ методом К-средних
- •Команда QUICK CLUSTER: дополнительные возможности
- •27. Непараметрические критерии
- •Одновыборочные непараметрические критерии
- •Чтобы получить одновыборочные непараметрические критерии
- •Вкладка Поля
- •Вкладка Параметры
- •Непараметрические критерии для независимых выборок
- •Чтобы получить непараметрические критерии для независимых выборок
- •Вкладка Поля
- •Вкладка Параметры
- •Непараметрические критерии для связанных выборок
- •Чтобы применить непараметрические критерии для связанных выборок
- •Вкладка Поля
- •Вкладка Параметры
- •Представление модель
- •Сводка по проверке гипотез
- •Сводка по доверительным интервалам
- •Одновыборочный критерий
- •Критерии для связанных выборок
- •Критерий для независимых выборок
- •Информация по категориальным полям
- •Информация по количественным полям
- •Парные сравнения
- •Однородные подмножества
- •Команда NPTESTS: дополнительные возможности
- •Устаревшие диалоговые окна
- •Критерий хи-квадрат
- •Биномиальный критерий
- •Критерий серий
- •Одновыборочный критерий Колмогорова-Смирнова
- •Критерии для двух независимых выборок
- •Критерии для двух связанных выборок
- •Критерии для нескольких независимых выборок
- •Критерии для нескольких связанных выборок
- •28. Анализ множественных ответов
- •Задание наборов множественных ответов
- •Частоты для множественных ответов
- •Таблицы сопряженности для множественных ответов
- •Задание диапазонов переменных в таблицах сопряженности для наборов множественных ответов
- •Параметры процедуры Таблицы сопряженности для множественных ответов
- •Команда MULT RESPONSE: дополнительные возможности
- •29. Создание отчетов
- •Итоги по строкам
- •Как запустить процедуру выдачи итожащего отчета: Итоги по строкам
- •Параметры группировки отчета
- •Параметры отчета
- •Компоновка отчета
- •Заголовки отчета
- •Итоги по столбцам
- •Как запустить процедуру выдачи итожащего отчета: Итоги по столбцам
- •Итожащие функции столбцов данных
- •Формат столбцов отчета
- •Параметры группировки отчета с итогами по столбцам
- •Параметры отчета для итогов по столбцам
- •Компоновка отчета с итогами по столбцам
- •Команда REPORT: дополнительные возможности
- •30. Анализ пригодности
- •Статистики процедуры Анализ пригодности
- •Команда RELIABILITY: дополнительные возможности
- •31. Многомерное шкалирование
- •Многомерное шкалирование: Форма данных
- •Создание меры для многомерного шкалирования
- •Модель многомерного шкалирования
- •Параметры процедуры Многомерное шкалирование
- •Команда ALSCAL: дополнительные возможности
- •32. Статистики отношений
- •Статистики отношений
- •33. Кривые ROC
- •Параметры процедуры ROC Кривые
- •Указатель
Глава
Многомерное шкалирование
31
Целью Многомерного шкалирования (МШ) является обнаружение структуры в наборе значений некоторой меры расстояния между объектами или наблюдениями. Это осуществляется путем приписывания наблюдениям положения в некотором многомерном пространстве (обычно размерности два или три) таким образом, чтобы расстояния между полученными точками в этом пространстве как можно более точно аппроксимировали исходные различия. Во многих случаях размерности (измерения) этого пространства могут быть интерпретированы и использованы для дальнейшего осмысления ваших данных.
Если Вы имеете переменные, полученные в результате реальных измерений, Вы можете использовать многомерное шкалирование для снижения размерности данных (если необходимо, процедура Многомерного шкалирования может вычислить расстояния по многомерным данным). Многомерное шкалирование может также применяться к данным, представляющим собой субъективные оценки различий между объектами или понятиями. Дополнительно процедура Многомерного шкалирования может манипулировать данными типа различий из нескольких источников, которые могут появиться в случае наличия нескольких индивидуумов, производящих оценку, или респондентов, отвечающих на вопросы анкеты.
Пример. Как люди воспринимают сходство между различными марками и моделями автомобилей? Если у вас есть данные от респондентов, представляющие рейтинги сходства между различными марками и моделями автомобилей, то многомерное шкалирование может быть использовано для идентификации размерностей (измерений), описывающих восприятие потребителей. Например, вам, возможно, удастся показать, что цена и размер автомобиля определяют двумерное пространство, которое объясняет сходства, определенные вашими респондентами.
Статистики. Для каждой модели: матрица данных, матрица данных, полученная в результате оптимального шкалирования, S – стресс (Юнга), стресс (Краскала), RSQ, координаты стимулов, средний стресс и RSQ для каждого стимула в модели Повторяемого МШ (Replicated MDS). Для моделей индивидуальных различий (INDSCAL): веса субъекта и индекс отклонения направления вектора весов от средней тенденции (weirdness index). Для каждой матрицы в моделях повторяемого многомерного шкалирования: стресс и RSQ для каждого стимула. Графики: координаты стимулов (двумерные или трехмерные), диаграммы рассеяния преобразованных исходных близостей (disparities) против расстояний.
Данные. Если ваши данные - различия, то все они должны быть количественными и измеренными в одной и той же метрике. Если у вас многомерные данные, то переменные могут быть количественными, бинарными или частотами. Масштаб переменных является важным моментом – различия в масштабах могут повлиять на решение. Если ваши данные имеют существенные различия в масштабах (например, одна переменная измерена в долларах, а другая в годах), то вам следует подумать об их стандартизации (это может быть выполнено автоматически процедурой Многомерного шкалирования).
© Copyright IBM Corporation 1989, 2011. |
320 |
321
Многомерное шкалирование
Предположения. Процедура Многомерного шкалирования не накладывает жестких ограничений на распределение вероятностей. Не забудьте выбрать подходящий уровень измерений (порядковый, интервальный или отношения) в диалоговом окне Многомерное шкалирование: Параметры, чтобы получить корректные результаты.
Родственные процедуры. Если вашей целью является снижение размерности, то альтернативным методом может быть факторный анализ, особенно в случае, когда ваши данные количественные. Если Вы хотите идентифицировать группы сходных наблюдений, то дополните многомерное шкалирование применением одного из методов кластерного анализа: иерархического или k-средних.
Как запустить процедуру многомерного шкалирования
E Выберите в меню:
Анализ > Шкалирование > Многомерное шкалирование...
Рисунок 31-1
Диалоговое окно Многомерное шкалирование
E Для анализа выберите по крайней мере четыре числовых значения.
E В группе Расстояния выберите пункты Данные содержат расстояния или Вычислить расстояния по данным.
EЕсли выбран пункт Вычислить расстояния по данным, можно также выбрать группирующую переменную для индивидуальных метрик. Группирующая переменная может быть как числовой, так и строковой.
Дополнительно можно выполнить следующие действия.
Указать форму матрицы расстояния, если даты являются расстояниями.
Укажите меру расстояния для использования при создании расстояний из данных.
322
Глава 31
Многомерное шкалирование: Форма данных
Рисунок 31-2
Диалоговое окно Многомерное шкалирование: Форма данных
Если ваш активный набор данных представляет расстояния между объектами для некоторого набора объектов или расстояния между двумя наборами объектов, задайте форму матрицы ваших данных, чтобы получить корректные результаты.
Примечание: Вы не можете выбрать Квадратная симметричная, если в диалоговом окне Модель задана построчная обусловленность.
Создание меры для многомерного шкалирования
Рисунок 31-3
Диалоговое окно Многомерное шкалирование: Создать меру по данным
Многомерное шкалирование использует данные типа различий для получения решения задачи шкалирования. Если Вы имеете многомерные данные (значения измеренных переменных), Вы должны сформировать данные типа различий для получения решения задачи шкалирования. Вы можете задать детали формирования мер различия по вашим данным.
323
Многомерное шкалирование
Мера. В этой группе Вы можете задать меру различия для предстоящего анализа. Выберите одну из альтернатив в группе Мера в соответствии с типом ваших данных и затем выберите одну из мер из выпадающего списка мер указанного типа. Доступны следующие альтернативы:
Интервальная. Расстояние Евклида, квадрат расстояния Евклида, Чебышев, Блок, Минковского или Настроенная.
Частоты. Мера хи-квадрат или мера фи-квадрат.
Двоичная. Расстояние Евклида, квадрат расстояния Евклида, Различие размеров, Различие структур, Дисперсия, Ланс и Виллиамс.
Создать матрицу расстояний. Позволяет выбрать элемент анализа. Альтернативами являются Между переменными и Между наблюдениями.
Преобразовать значения. В определенных случаях, когда масштабы значений переменных сильно различаются, Вы, возможно, захотите стандартизировать значения, перед тем как вычислять близости (неприменимо к двоичным данным). Выберите метод стандартизации из выпадающего списка Стандартизация. Если стандартизация не требуется, выберите Нет.
Модель многомерного шкалирования
Рисунок 31-4
Диалоговое окно Многомерное шкалирование: Модель
Корректность оценивания модели многомерного шкалирования зависит от данных и выбора модели.
Шкала измерения. Эта группа позволяет задать тип шкалы ваших данных. Альтернативами являются Порядковая, Интервальная и Отношений. Если ваши переменные измерены в порядковой шкале, то выбор Развязывать связанные позволит рассматривать переменные как непрерывные, так что проблема совпадений или связей (равных значений для разных наблюдений) будет решена оптимальным образом.
Обусловленность. Эта группа позволяет определить, какие сравнения осмысленны. Альтернативами являются Матричная, Построчная и Безусловно.