- •Анализ ассоциаций
- •Анализ рыночной корзины
- •Ассоциативные правила
- •Цели и задачи анализа ассоциаций
- •Обобщенные ассоциативные правила
- •Другие виды ассоциативных правил
- •Применение анализа ассоциаций
- •Модель данных
- •Модель ассоциативных правил
- •Алгоритм Apriori
- •Алгоритмы для больших объемов выборок
- •Алгоритм Partition
- •Список использованных источников
Другие виды ассоциативных правил
Среди булевых асссоциативных правил, которые сообщают только о наличии или отсутствии ассоциации, следует обратить внимание на использование моделей для поиска негативных ассоциативных правил [8]. Негативное (отрицательное) правило – это такое правило, которое предсказывает отсутствие набора Y: X => не Y. Использование таких правил увеличивает количество ассоциативных правил. Правда, на практике такие правила не всегда применимы. Например, правило: "если (вода, масло), то не (молоко)" мало полезно, т.к. слабо выражает поведение покупателя.
Более сложным типом правил являются количественные ассоциативные правила (Quantitative Association Rules). Этот тип правил ищется с применением количественных или категориальных атрибутов. Например, "покупатели, чей возраст находится между 30 и 35 годами с доходом более 75000 долларов в год покупают машины стоимостью более 20000 долларов".
Если взять любую базу данных, каждая транзакция состоит из различных типов данных: числовых, категориальных и т.д. Для обработки таких записей и извлечения численных ассоциативных правил был предложен алгоритм поиска [9].
Применение анализа ассоциаций
Как было сказано, задача поиска ассоциативных правил впервые была представлена для анализа рыночной корзины. Ассоциативные правила эффективно используются в сегментации покупателей по поведению при покупках, анализе предпочтений клиентов, планировании расположения товаров в супермаркетах, кросс-маркетинге, адресной рассылке. Однако, сфера применения этих алгоритмов не ограничивается лишь одной торговлей. Другими областями анализа данных, где используются методы поиска ассоциативных правил, являются: выявление мошеннических операций по кредитным картам, страховым случаям; определение причин сбоев в телекоммуникационных системах; анализ ДНК живых организмов; обработка данных социологических исследований. и т.д.
Web Mining можно перевести как "добыча данных в Web" [1]. Web Intelligence или Web Интеллект готов "открыть новую главу" в стремительном развитии электронного бизнеса. Способность определять интересы и предпочтения каждого посетителя, наблюдая за его поведением, является серьезным и критичным преимуществом конкурентной борьбы на рынке электронной коммерции. В системах Web Mining ассоциативные правила используются для анализа поисковых запросов и предпочтений пользователя, а также для для анализа посещений веб-страниц.
Поиск ассоциативных правил также успешно применяют для анализа текста (Text Mining). Задача выделения терминов (term extraction) из текстов, решаемая перед задачей рубрикации, может быть сведена к поиску ассоциаций. Терминами считаются отдельные слова или устойчивые словосочетания, которые часто встречаются в небольшом подмножестве документов, и редко во всех остальных. Множество часто совместно встречающихся терминов образует тему, скорее всего, соответствующую некоторой рубрике.
Поиск ассоциативных правил в XML-документах [10] отличается от поиска правил в простых документах, потому что в XML-формате информация может быть структурирована по-разному. Как правило, поиск ассоциативных правил XML означает поиск отношения между составными частями одного или нескольких XML-документов, для чего обычно применяются обобщенные ассоциативные правила.
