Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
IBM_SPSS_Statistics_Base.pdf
Скачиваний:
168
Добавлен:
19.05.2015
Размер:
5.37 Mб
Скачать

Глава

Расстояния

14

Эта процедура вычисляет любую статистику из широкого набора статистик, измеряющих либо сходства, либо различия (расстояния), причем либо между парами переменных, либо между парами наблюдений. Эти меры сходства или расстояния могут быть затем использованы в других процедурах, таких как факторный анализ, кластерный анализ или многомерное шкалирование, для того чтобы помочь анализировать сложные наборы данных.

Пример. Можно ли измерить сходство между парами автомобилей, основываясь на определенных характеристиках, таких как объем двигателя, расход топлива и мощность? Вычислив величины сходства между автомобилями, Вы можете получить представление о том, какие автомобили похожи, а какие различаются. Для более формального анализа к величинам сходства можно применить иерархический кластерный анализ или многомерное шкалирование для того, чтобы исследовать скрытую структуру данных.

Статистики. Меры различия (расстояния) для интервальных данных: расстояние Евклида, квадрат расстояния Евклида, метрики Чебышева, блок, Минковского, а также задаваемые пользователем. Для частот: хи-квадрат и фи-квадрат. Для бинарных данных: расстояние Евклида, квадрат расстояния Евклида, различие размеров, различие структур, дисперсия, форма, Ланс и Вильямс. Мерами сходства для интервальных данных являются: коэффициент корреляции Пирсона и косинус. Для бинарных данных: Рассел и Рао, простая мера совпадений, Жаккар, дайс, Роджерс и Танимото, Сокал и Сниат 1, Сокал и Сниат 2, Сокал и Сниат 3, Кульчинский 1, Кульчинский 2, Сокал и Сниат 4, Хаманн, Лямбда, D Андерберга, Y Юла, Q Юла, Очиай, Сокал и Сниат 5, четырехточечная корреляция фи, разброс.

Как получить матрицы расстояний

E Выберите в меню:

Анализ > Корреляции > Расстояния...

© Copyright IBM Corporation 1989, 2011.

86

87

Расстояния

Рисунок 14-1

Диалоговое окно Расстояния

EВыберите, по крайней мере, одну числовую переменную, чтобы вычислять расстояния между наблюдениями, или выберите, по крайней мере, две числовые переменные, чтобы вычислить расстояния между переменными.

EВыберите одну из двух альтернатив в группе Вычислить расстояния между, чтобы вычислить расстояния либо между наблюдениями, либо между переменными.

88

Глава 14

Меры различия

Рисунок 14-2

Диалоговое окно Расстояния: Меры различия

В группе Мера выберите альтернативу, соответствующую типу данных (интервальным, частотам или двоичным); затем в выпадающем списке выберите одну из мер, которая соответствует этому типу данных. Доступными мерами в зависимости от типа данных являются следующие:

Интервальные данные. Расстояние Евклида, квадрат расстояния Евклида, расстояние Чебышева, блок, Минковского или Настроенная (пользователем).

Частоты. Меры хи-квадрат или фи-квадрат.

Двоичные данные. Расстояние Евклида, квадрат расстояния Евклида, различие размеров, различие структур, дисперсия, форма, Ланс и Виллиамс. (Введите значения в поля Наличие и Отсутствие, чтобы указать, какие два значения используются; остальные значения будут игнорироваться процедурой.)

Группа Преобразовать значения позволяет перед вычислением близостей стандартизировать значения данных либо для наблюдений, либо для переменных. Эти преобразования неприменимы к бинарным данным. Возможные методы стандартизации: Z значения, Диапазон от –1 до 1, Диапазон от 0 до 1, Максимальная величина 1, Среднее 1 и Стд. отклонение 1

Группа Преобразовать меры позволяет преобразовать генерируемые значения меры расстояния. Преобразования выполняются после того, как вычислены значения меры расстояния. Доступные преобразования: взятие модуля, смена знака, приведение к диапазону 0–1.

89

Расстояния

Меры сходства

Рисунок 14-3

Диалоговое окно Расстояния: Меры сходства

В группе Мера выберите альтернативу, соответствующую типу данных (интервальная или двоичная); затем в выпадающем списке выберите одну из мер, которая соответствует этому типу данных. Доступными мерами в зависимости от типа данных являются следующие:

Интервальные данные. Коэффициент корреляции Пирсона или косинус.

Двоичные данные. Рассел и Рао, простая мера совпадений, Жаккар, дайс, Роджерс

иТанимото, Сокал и Сниат 1, Сокал и Сниат 2, Сокал и Сниат 3, Кульчинский 1, Кульчинский 2, Сокал и Сниат 4, Хаманн, Лямбда, D Андерберга, Y Юла, Q Юла, Очиай, Сокал и Сниат 5, четырехточечная корреляция фи, разброс. (Введите значения в поля Наличие и Отсутствие, чтобы указать, какие два значения используются; остальные значения будут игнорироваться процедурой.)

Группа Преобразовать значения позволяет перед вычислением расстояний стандартизировать значения данных либо для наблюдений, либо для переменных. Эти преобразования неприменимы к бинарным данным. Возможные методы стандартизации: Z значения, Диапазон от –1 до 1, Диапазон от 0 до 1, Максимальная величина 1, Среднее 1 и Стд. отклонение 1

Группа Преобразовать меры позволяет преобразовать генерируемые значения меры расстояния. Преобразования выполняются после того, как вычислены значения меры расстояния. Доступные преобразования: взятие модуля, смена знака, приведение к диапазону 0–1.

Команда PROXIMITIES: дополнительные возможности

Процедура Расстояния использует синтаксис команды PROXIMITIES. Язык синтаксиса команд также позволяет:

Задать любое целое число в качестве степени для меры расстояния Минковского.

Задать любое целое число в качестве корня для настраиваемой меры расстояния.

90

Глава 14

Полную информацию о синтаксисе языка команд можно найти в Руководстве по синтаксису.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]