Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Зуб М.Д. Тема 6. Анализ количественной маркетинговой информации.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
222.88 Кб
Скачать
  1. Кластерный анализ. Кластерный анализ - это совокупность методов, позволяющих классифицировать многомерные наблюдения, каждое из которых описывается неким набором переменных. Для чего это нужно?

  • Сегментация потребителей

  • Определение групп связанных признаков (при кластеризации переменных)

Применение методов кластеризации к сегментированию основано на следующих предположениях:

  • во-первых, считается, что по значениям переменных, которыми описываются свойства потребителей, можно выделить группы схожих потребителей.

  • во-вторых, считается, что на выделяемом сегменте можно достигнуть лучших маркетинговых результатов по продвижению продукции. полагается, что более значимо для маркетингового результата, объединение потребителей в группу с учетом мер близости друг к другу. Для обоснования данных предположений используется метод дисперсионного анализа.

Как это работает?

На входе анализа – набор переменных, описывающих совокупность респондентов. Метод работает с интервальными (например, возраст, доход, оценка степени согласия по 10-балльной шкале и т.д.) и дихотомическими переменными (например, пол, наличие/отсутствие руководящих функций) переменными.

Совокупность из n значений по всем n переменным определяет положение объекта в неком n-мерном пространстве. Исходя из этих координат определяются расстояния между объектами. Для расчёта расстояний чаще всего используется Евклидово расстояние, однако метод расчёта расстояний может варьироваться в зависимости от специфики данных.

Метод группирует схожие (расположенные близко друг к другу) объекты, в результате чего формируется набор из нескольких кластеров.

Число кластеров может определяться автоматически на основе выбранного критерия либо выбираться вручную исследователем с учётом теоретических предпосылок и понимания предмета исследования.

Существует несколько процедур кластеризации, но все они базируются на использовании мер или критериев близости. Наиболее распространенным критерием близости является среднеквадратическая разность.

Евклидово расстояние - расстояние между объектами

d (Xi; Xj) = [å (Xik - Xjk)2 ]2

 

Суть в том, что последовательно объединяются объекты сначала более близкие, а затем все более отдаленные друг от друга. Работа алгоритма заканчивается, когда все объекты будут объединены в один класс. Результатом обычно является графическое изображение, иллюстрирующее вид иерархического дерева (дендрограмма).

 Описанный алгоритм не имеет четких правил остановки на каком-то этапе кластеризации. Обычно исследователи принимают во внимание устойчивость групп на протяжении нескольких шагов алгоритма. В кластерном анализе не рекомендуется использовать большое количество факторов.

Что получаем в итоге?

На выходе – набор кластеров/сегментов.

Каждый сегмент описывается средними по кластеру значениями переменных. С помощью этих данных можно выделить характерные особенности сегментов, их отличительные черты.

При хорошем кластерном решении дисперсия значений переменных внутри кластера должна быть минимальной (т.е. респонденты внутри кластера однородны), а дисперсия между кластерами максимальна (т.е. респонденты из одного кластера не похожи на респондентов из другого).