Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
088111_MI_Kornienko_(k_razmescheniyu).doc
Скачиваний:
2
Добавлен:
01.05.2025
Размер:
991.74 Кб
Скачать

Тема 20 Кластерный анализ

После изучения материала этой темы вы должны уметь ...

1. Описывать основную идею, область применения кластерного анализа и его важность в маркетинговых исследованиях.

2. Анализировать статистики, используемые в ходе кластерного анализа.

3. Объяснять ход выполнения кластерного анализа, включая формулирование проблемы, выбор способа измерения расстояния, выбор метода кластеризации, принятие решения о числе кластеров, интерпретацию и профилирование кластеров.

4. Описывать цель и методы оценивания качества результатов кластеризации.

5. Рассматривать надежность и достоверность результатов кластеризации.

6. Обсуждать применение неиерархической кластеризации и кластеризации переменных.

Краткий обзор

С помощью кластерного анализа, как и рассмотренного ранее факторного (Тема 19), маркетологи проверяют весь набор взаимозависимых связей. В кластерном анализе не проводят различия между зависимыми и независимыми переменными. Более того, проверяются взаимозависимые связи всего набора переменных. Цель кластерного анализа — классификация объектов на относительно гомогенные (однородные) группы, исходя из рассматриваемого набора переменных. Объекты в группе относительно схожи с точки зрения этих переменных и отличаются от объектов в других группах. Если кластерный анализ использовать именно таким образом, то он становится составной частью факторного анализа, так как снижает число объектов, а не число переменных, сгруппировывая их в меньшее число кластеров.

В этой главе описана основная идея кластерного анализа. Этапы кластерного анализа рассматриваются и иллюстрируются в контексте иерархической группировки с помощью статистического программного пакета. Далее представлено применение неиерархической кластеризации, которое следует за обсуждением разбиения переменных на кластеры. Начнем с двух примеров.

Резюме

Кластерный анализ используют для группирования (классификации) объектов (событиев, случаев), а иногда и переменных в относительно однородные группы. Образование кластер зависит от имеющихся данных, а не определяется заранее.

Переменные, которые являются основанием для кластеризации, следует выбирать, исходя из опыта предшествующих исследований, теоретических предпосылок, проверяемых гипотез, а также по усмотрению исследователя. Кроме того, следует выбрать соответствующую меру расстояния (сходства). Особенность иерархической кластеризации — разработка иерархической или древовидной структуры. Иерархические методы кластеризации могут быть агломеративными или дивизивными. Агломеративные методы включают: метод одиночной связи, метод полной связи и метод средней связи. Широко распространенным дисперсионным методом является метод Варда. Неиерархические методы кластеризации часто называют методами k - средних. Эти методы включают последовательный пороговый метод, параллельный пороговый метод и оптимизирующее распределение. Иерархические и неиерархические методы можно применять совместно. Выбор метода кластеризации и выбор меры расстояния взаимосвязаны.

Решение о числе кластеров принимают по теоретическим и практическим соображениям. В иерархической кластеризации важным критерием принятия решения о числе кластеров являются расстояния, при которых происходит объединение кластеров. Относительные размеры кластеров должны быть такими, чтобы имело смысл сохранить данный кластер, а не объединить его с другими. Кластеры интерпретируют с точки зрения кластерных центроидов. Часто интерпретировать кластеры помогает их профилирование через переменные, которые не лежали в основе кластеризации. Надежность и достоверность решений кластеризации оценивают разными способами.