1.1.2. Задача кластеризации

Задача кластеризации состоит в разделении исследуемого множества объектов на группы «похожих» объектов, называемых кластерами (cluster (англ.) - сгусток, пучок, группа). Часто решение задачи разбиения множества элементов на кластеры называют кластерным анализом.

Кластеризация может применяться практически в любой области, где необходимо исследование экспериментальных или статистических данных. Рассмотрим пример из области маркетинга, в котором данная задача называется сегментацией.

Концептуально сегментирование основано на предпосылке, что все потребители разные. У них разные потребности, разные требования к товару, они ведут себя по-разному (в процессе выбора товара, в процессе приобретения товара, в процессе использования товара, в процессе формирования реакции на товар). В связи с этим необходимо подходить к работе с потребителями: предлагать им различные по своим характеристикам товары, по-разному продвигать и продавать товары. Для того чтобы определить, чем отличаются потребители друг от друга и как эти отличия отражаются на требованиях к товару, и производится сегментирование потребителей.

В маркетинге критериями (характеристиками) сегментации являются: географическое местоположение, социально-демографические характеристики, мотивы совершения покупки и так далее.

На основании результатов сегментации маркетолог может определить, например, такие характеристики сегментов рынка, как реальная и потенциальная емкость сегмента, группы пользователей, чьи потребности не удовлетворяют в полной мере ни одним производителям, работающим на данном сегменте рынка, и так далее. На основании этих параметров маркетолог может сделать вывод о привлекательности работы фирмы в каждом из выделенных сегментов рынка.

Кластеризация отличается от классификации тем, что для проведения анализа не требуется иметь выделенную зависимую переменную, поэтому она относится к классу задач, решаемых с обучением без учителя. Эта задача решается, как правило, на начальных этапах исследования, когда о данных мало что известно. Ее решение помогает лучше понять данные, и с этой точки зрения задача кластеризации является описательной.

Для задачи кластеризации характерно отсутствие каких-либо различий как между переменными, так и между объектами. Напротив, ищутся группы наиболее близких, похожих объектов. Методы автоматического разбиения на кластеры редко используются сами по себе, а только для получения групп схожих объектов. После определения кластеров используются другие методы Data Mining, чтобы попытаться установить, что означает такое разбиение и чем оно вызвано.

Кластерный анализ позволяет рассматривать достаточно большой объем данных и резко сокращать, сжимать массивы информации, делать их компактными и наглядными.

Следует отметить, что решение задачи кластеризации сильно зависит от природы объектов данных (и их атрибутов). Так, с одной стороны, это могут быть однозначно определенные, количественно очерченные объекты, а с другой – объекты, имеющие вероятностное или нечеткое описание.

Другая особенность данной задачи состоит в том, что ее решение в значительной степени зависит от представления кластеров и предполагаемых отношений объектов данных и кластеров. Так, необходимо учитывать такие свойства, как возможность/невозможность принадлежности объектов к нескольким кластерам. Необходимо определение самого понятия принадлежности кластеру: однозначная (принадлежит/не принадлежит), вероятностная (вероятность принадлежности), нечеткая (степень принадлежности).

<<< < Предыдущая 1 2 34 / 304 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.07.20251.09 Mб2Материал по ЛР№456.docx
#
16.12.201830.66 Mб41Материалы к лекции.docx
#
16.12.20181.11 Mб38Материалы к лекции1.docx
#
19.11.2019344.61 Кб2Материалы по курсу Инст.Эк. - юристы.docx
#
26.03.2016371 Кб22Материалы по курсу Теория организации15 экз.docx
#
01.07.20253 Mб1МГ_Кузнецов_ABCN2_final.docx
#
01.07.2025622.59 Кб1Медицинские приложения цифрового ТВ.doc
#
26.03.2016163.33 Кб13Международное Право.doc
#
26.03.201664.3 Кб7Международное Право.docx
#
26.03.20161.38 Mб40Международные отношения и дипломатия.pdf
#
01.07.202567.19 Кб2мен рисков.docx