Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
маркетинг / МИ_Книга2006.doc
Скачиваний:
45
Добавлен:
23.05.2015
Размер:
4.47 Mб
Скачать

Классификация методами сравнения с образцом192

Эта группа методов классификации полезна для работы с сегментами.

Метод сравнения с прототипом

Метод хорош, если в пространстве признаков есть компактные группы элементов исследования. Это можно увидеть при визуализации собранных данных. Для снижения размерности задачи можно применить метод главных компонент.

Сущность метода заключается в том, что каждый элемент исследуемого множества, относящийся к некоторой группе, заменяется своим прототипом.

Шкалы измерения атрибутов должны быть порядковыми, интервальными или относительными.

Это означает, например, что каждый представитель сегмента заменяется некоторым «средним покупателем», типовым представителем данного сегмента.

Для определения характеристик прототипа можно

  • выбрать центр группы по каждой i-й измеренной характеристике:

ХПi=(X1i+X2i+…+Xni)/N,

где ХПi– координаты прототипа по i-й характеристике,Xni– координаты элементов исследования, входящих в группу,n=1…N, N– число элементов в группе;

  • взять в качестве пототипа реальный элемент, координаты которого наиболее близки к вычисленному центру.

При исследовании нового неизвестного элемента находится ближайший к нему прототип. Им и заменяется исходный элемент.

При использовании метода возникает проблема оценки расстояний между элементами в системе разнородных координат. Эта проблема обсуждалась в разделе «Кластерный анализ».

Методkближайших соседей

Этот метод также может быть полезен при сегментировании.

Для нового элемента исследования находятся kближайших соседей с известной классификацией. Решение об отнесении элемента к той или иной группе (сегменту) делается, например, с помощью «подсчета голосов». Это означает, что элемент относится к той группе, представителей которой больше поблизости.

***

В целом методы сравнения с образцом не дают нового знания, хотя и позволяют систематизировать имеющийся опыт.

DataMining

Определение

Теперь, после того, как принципы DataMiningбыли проиллюстрированы на примерах, можно обобщить сведения об этой идее, которая получила распространение с 1990-х годов.

К этому времени сложилась следующая ситуация [13]:

  • данные, накопленные в компьютерных системах, имеют практически неограниченный объем;

  • накопленные данные разнородны: в виде баз данных, текста, электронных таблиц содержится как количественная, так и качественная информация;

  • требуется простой и понятный инструмент для работы с этими данными;

  • получаемые результаты также должны быть конкретными, полезными и понятными.

Таким образом, имеется большое количество «руды», из которой можно выбрать «самородки» [13].

Data mining [13] – процесс обнаружения в «сырых» данных

ранее неизвестных;

нетривиальных;

практически полезных;

доступных интерпретации

знаний, используемых для принятия решений в различных сферах человеческой деятельности.

Область применения

К числу популярных применений Data mining относятся (на основе [13]):

  1. Торговля.

    1. Анализ совместных покупок. Узнав, какие товары часто покупаются вместе, можно улучшить рекламу, более эффективно управлять запасами, улучшить раскладку товаров в торговых залах.

    2. Анализ последовательности покупок. После покупки квартиры новоселам необходимо купить обои, краску, линолеум. Чуть позже они придут за мебелью, бытовой техникой. Знание типового поведения новоселов поможет разработать рекламу, эффективно использовать скидки, уточнить ассортимент, лучше управлять запасами.

    3. Построение прогнозирующих моделей. Зная, кто ходит на распродажи, кто ищет товары определенных категорий, можно разработать хорошую программу продвижения.

    4. Определение параметров, влияющих на цену объектов недвижимости, поможет более точно устанавливать эту цену и прогнозировать ее изменение.

  2. Сфера услуг.

    1. Сегментация клиентов поможет предложить различным сегментам наиболее подходящие для них пакеты услуг различных ценовых категорий.

    2. Выявление клиентов, которые могут стать лояльными, позволит сконцентрировать на них маркетинговые усилия.

  3. Промышленность.

    1. Точное определение требований к товарам, которые предъявляют потребители различных сегментов; прогноз изменений этих требований.

    2. Определение причин возникновения дефектов в изделиях, обусловленных технологией их изготовления, позволит снизить потери от брака.

  4. Страхование. Определяется, какие параметры следует учитывать при страховании. На условия страхования жизни влияет профессия. Исследуется, какие еще параметры следует учитывать, чтобы сделать эту услугу, с одной стороны, привлекательной для клиентов, а с другой – прибыльной для компании.

  5. Безопасность. Анализируется типология мошенничества с кредитными картами, договорами страхования, кредитованием и т.д.

Таким образом, Data Mining применяется в различных областях маркетинга для поиска новых закономерностей.

Типы закономерностей обобщены в [13]:

Ассоциацииобозначают связанные друг с другом события65% купивших чипсы берут и кока-колу. Если продавать комплект со скидкой, таких покупателей будет уже85%.

Последовательность– это цепочка событий, связанных во времени. За покупкой фотоаппарата последует покупка пленки к нему.

Классификацияпредставляет собой группировку по одинаковым значениям признака или признаков и разделение – по различным значениям этих признаков.

При кластеризациипроисходит группировка по сходству на основе признаков. Но она не привязывается к определенным признакам.

Прогнозирование будущих значений переменной.

Прогнозирование значений одной переменной по значениям других переменных.