Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
IBM_SPSS_Statistics_Base.pdf
Скачиваний:
168
Добавлен:
19.05.2015
Размер:
5.37 Mб
Скачать

Глава

23

Выбор процедуры кластеризации

Кластерный анализ можно выполнить, используя процедуры двухэтапного, иерархического кластерного анализа или метода k-средних. Каждая процедура использует разные алгоритмы для формирования кластеров, и каждая имеет параметры, недоступные для других.

Двухэтапный кластерный анализ. Для многих приложений процедура Двухэтапный кластерный анализ окажется подходящим выбором. Она дает следующие уникальные возможности:

Автоматический выбор наилучшего числа кластеров и мер для выбора моделей кластеров.

Модели кластеров можно создавать одновременно на основе и категориальных, и непрерывных переменных.

Сохранение модели кластеров во внешнем XML файле для дальнейшего считывания этого файла и обновления модели кластеров на основе новых данных.

Кроме того, процедура Двухэтапный кластерный анализ может анализировать большие файлы данных.

Иерархический кластерный анализ. Применение процедуры Иерархический кластерный анализ огранивается небольшими файлами данных (сотни объектов для кластеризации), однако она обладает следующими уникальными возможностями:

Способность разбивать на кластеры как наблюдения, так и переменные.

Способность формировать диапазон возможных решений и сохранять принадлежность к кластерам для каждого из этих решений.

Наличие нескольких методов формирования кластеров, преобразования переменных и измерения расстояний между кластерами.

Процедура Иерархический кластерный анализ может анализировать интервальные (непрерывные), двоичные переменные или частоты, если все переменные имеют один и тот же тип.

Кластерный анализ методом k-средних. Применение процедуры Кластерный анализ методом k-средних ограничивается непрерывными данными и требует задания числа классов заранее, но она имеет следующие уникальные возможности:

Способность сохранять расстояния от центра кластера до каждого объекта.

Способность считывать начальные центры кластеров из внешнего файла IBM® SPSS® Statistics и сохранять в нем окончательные центры кластеров.

Кроме того, процедура Кластерный анализ методом k-средних может анализировать большие файлы данных.

© Copyright IBM Corporation 1989, 2011.

179

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]