Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Lections 2007.doc
Скачиваний:
3
Добавлен:
01.03.2025
Размер:
841.22 Кб
Скачать
  1. Некоторые бизнес-приложения Data Mining

Data Mining представляют большую ценность для руководителей и анали­тиков в их повседневной деятельности. Деловые люди осознали, что с помо­щью методов Data Mining они могут получить ощутимые преимущества в конкурентной борьбе. Кратко охарактеризуем некоторые возможные бизнес- приложения Data Mining.

Предприятия розничной торговли сегодня собирают подробную инфор­мацию о каждой отдельной покупке, используя кредитные карточки с мар­кой магазина и компьютеризованные системы контроля. Вот типичные за­дачи, которые можно решать с помощью Data Mining в сфере розничной торговли:

  • анализ покупательской корзины;

  • исследование временных шаблонов;

  • создание прогнозирующих моделей.

Достижения технологии Data Mining используются в банковском деле для решения следующих распространенных задач:

  • выявление мошенничества с кредитными карточками;

  • сегментация клиентов;

  • прогнозирование изменений клиентуры.

В области телекоммуникаций характерен растущий уровень конкурен­ции. Здесь методы Data Mining помогают компаниям более энергично про­двигать свои программы маркетинга и ценообразования, чтобы удержать существующих клиентов и привлечь новых.

Страховые компании в течение многих лет накапливают большие объемы данных. Здесь большое поле деятельности для методов Data Mining, при этом можно решать такие задачи, как выявление мошенничества, разработка продуктов, анализ риска.

Можно привести еще много примеров различных областей знания, где методы Data Mining играют ведущую роль. Особенность этих областей за­ключается в их сложной системной организации. Они относятся главным об­разом к надкибернетическому уровню организации систем, закономерности которого не могут быть достаточно точно описаны на языке статистических или иных аналитических математических моделей. Данные в указанных об­ластях неоднородны, гетерогенны, нестационарны и часто отличаются высо­кой размерностью.

  1. Типы закономерностей

Выделяют шесть стандартных типов закономерностей, которые позволяют выявлять методы Data Mining:

  • классификация,

  • регрессия,

  • прогнозирование временных последовательностей (рядов),

  • кластеризация,

  • ассоциация,

  • последовательность.

Первые три используются главным образом для предсказания, в то вре­мя как последние удобны для описания существующих закономерностей в данных.

Классификация, вероятно, наиболее распространенная сегодня операция интеллектуального анализа данных. С ее помощью выявляются признаки, характеризующие группу, к которой принадлежит тот или иной объект. Это делается посредством анализа уже классифицированных объектов и форму­лирования некоторого набора правил. Однажды определенный эффектив­ный классификатор используется для классификации новых записей в базе данных в уже существующие классы и в этом случае он приобретает харак­тер прогноза. Например, классификатор, который умеет идентифицировать риск выдачи займа, может быть использован для целей принятия решения, велик ли риск предоставления займа определенному клиенту.

Регрессионный анализ используется в том случае, если отношения между переменными могут быть выражены количественно в виде некоторой ком­бинации этих переменных. Полученная комбинация далее используется для предсказания значения, которое может принимать целевая (зависимая) пере­менная, вычисляемая на заданном наборе значений входных (независимых) переменных. В простейшем случае для этого используются стандартные ста­тистические методы, такие как линейная регрессия. К сожалению, большин­ство реальных моделей не укладывается в рамки линейной регрессии. Напри­мер, размеры продаж или фондовые цены очень сложны для предсказания, потому что могут зависеть от комплекса взаимоотношений множества пере­менных. Таким образом, необходимы комплексные методы для предсказания будущих значений.

Прогнозирование временных последовательностей позволяет на основе анализа поведения временных рядов оценить будущие значения прогнози­руемых переменных. Конечно, эти модели должны включать в себя особые свойства времени: иерархию периодов (декада — месяц — год или месяц — квартал — год), особые отрезки времени (пяти — шести — или семидневная рабочая неделя, тринадцатый месяц), сезонность, праздники и др.

Кластеризация относится к проблеме сегментации. Этот подход распре­деляет записи в различные группы или сегменты. Кластеризация в чем-то аналогична классификации, но отличается от нее тем, что для проведения анализа не требуется иметь выделенную целевую переменную.

Ассоциация имеет место в том случае, если несколько событий связаны друг с другом, и адресована, главным образом, к классу проблем, типич­ным примером которых является анализ структуры покупок. Классический анализ структуры покупок относится к представлению приобретения какого- либо количества товаров как одиночной экономической операции (транзак­ции). Так как большое количество покупок совершается в супермаркетах, а покупатели для удобства используют корзины или тележки, куда и склады­вается весь товар, то наиболее известным примером нахождения ассоциаций является анализ структуры покупки (market-basket analysis). Целью являет­ся нахождение трендов среди большого числа транзакций, которые можно использовать для объяснения поведения покупателей, регулирования запа­сов, изменения размещения товаров на территории магазина и принятия ре­шения по проведению рекламной кампании для увеличения всех продаж или для продвижения определенного вида продукции. Хотя этот подход пришел исключительно из розничной торговли, он может также хорошо применять­ся в финансовой сфере для анализа портфеля ценных бумаг и нахождения наборов финансовых услуг, которые клиенты часто приобретают вместе. На­пример, данный подход можно использовать для создания некоторого набора услуг, как части кампании по стимулированию продаж.

Последовательность. Если существует цепочка связанных во времени со­бытий, то говорят о последовательности. Традиционный анализ структуры покупок имеет дело с набором товаров, представляющим одну транзакцию. Вариант такого анализа встречается, когда существует дополнительная ин­формация (номер кредитной карты клиента или номер его банковского сче­та) для связи различных покупок в единую временную серию. В такой ситу­ации важно не только сосуществование данных внутри одной транзакции, но и порядок, в котором данные появляются в различных транзакциях и время между этими транзакциями. Полученные правила могут быть использова­ны для определения типичного набора предшествующих продаж, которые могут повести за собой последующие продажи определенного товара.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]