- •8.05010103, 7.05010103“Системне проектування”
- •1. Мета роботи
- •2.Короткі теоретичні відомості
- •2.1. Введення в аналіз асоціативних правил
- •2.2. Асоціативні правила (association rules)
- •2.3. Узагальнені асоціативні правила (generalized association rules)
- •2.4. Чисельні асоціативні правила (quantitative association rules)
- •3.Лабораторне завдання
- •Мета роботи;
- •Короткі теоретичні відомості;
- •5.Список рекомендованої літератури
2.3. Узагальнені асоціативні правила (generalized association rules)
При пошуку асоціативних правил ми припускали, що всі аналізовані елементи є однорідними. Повертаючись до аналізу ринкової корзини, це товари, що мають абсолютно однакові атрибути за винятком назви. Проте не складе великих труднощів доповнити транзакцію інформацією про те, до якої товарної групи входить товар і побудувати ієрархію товарів. Приведемо приклад такого угрупування (таксономии) у вигляді ієрархічної моделі.
Нехай дана база транзакцій D і відомо в які групи (таксоны) входять елементи. Тоді можна витягувати з даних правила, що пов'язують групи з групами, окремі елементи з групами і т.д.
Наприклад, якщо Покупець купив товар з групи 'Безалкогольні напої', то він купить і товар з групи 'Молочні продукти' або 'Сік' 'Молочні продукти'. Ці правила носять назву узагальнених асоціативних правил.
Визначення 2. Узагальненим асоціативним правилом називається імплікація X Y, де X I, Y I і X Y= і де жоден з елементів, що входять в набір Y, не є предком жодного елементу, що входить в X. Підтримка і достовірність підраховуються так само, як і у разі асоціативних правил.
Введення додаткової інформації про угрупування елементів у вигляді ієрархії надає наступні переваги:
Це допомагає встановити асоціативні правила не тільки між окремими елементами, але і між різними рівнями ієрархії (групами).
Окремі елементи можуть мати недостатню підтримку, але в цілому група може задовольняти порогу minsupport.
Для знаходження таких правил можна використовувати будь-який з вищеназваних алгоритмів. Для цього кожну транзакцію потрібно доповнити всіма предками кожного елементу, що входить в транзакцію. Проте, застосування 'в лоб' цих алгоритмів неминуче приведе до наступних проблем:
Елементи на верхніх рівнях ієрархії прагнуть до значно великих значень підтримки у порівнянні з елементами на нижніх рівнях.
З додаванням до транзакції груп збільшується кількість атрибутів і відповідно розмірність вхідного простору. Це ускладнює завдання, а також призводить до генерації більшої кількості правил.
Поява надмірних правил, що є суперечними щодо визначення узагальненого асоціативного правила, наприклад, 'Сок' 'Прохолодні напої'. Очевидно, що практична цінність такого 'відкриття' є нульовою при 100% достовірності. Отже, потрібні спеціальні оператори, що видаляють подібні надмірні правила.
Для знаходження узагальнених асоціативних правил бажано використання спеціалізованого алгоритму, який усуває вищеописані проблеми і до того ж працює в 2-5 разів швидше, ніж стандартний APriori.
Групувати елементи можна не тільки по входу до певної товарної групи, але і по інших характеристиках, наприклад за ціною (дешево, дорого), брендом тощо.
2.4. Чисельні асоціативні правила (quantitative association rules)
При пошуку асоціативних правил завдання було істотно спрощене. По суті все зводилося до того, чи присутній в транзакції елемент чи ні. Тобто якщо розглядати випадок ринкової корзини, то розглядаємо два стани: куплено товар або ні, проігнорувавши, наприклад, інформацію про те, скільки було куплено, хто купив, характеристики покупця і т.д. Тобто було розглянуто "булеві" асоціативні правила. Якщо узяти будь-яку базу даних, кожна транзакція складається з різних типів даних: числових, категоріальних і т.д. Для обробки таких записів і витягання чисельних асоціативних правил був запропонований алгоритм пошуку.
Приклад чисельного асоціативного правила:
[Вік: 30-35] і [Сімейний стан: одружений] [Місячний дохід: 1000-1500 гривень].
Крім описаних вище асоціативних правил існують непрямі асоціативні правила, асоціативні правила із запереченням, тимчасові асоціативні правила для подій зв'язаних в часі та інші.
Як було сказано, завдання пошуку асоціативних правил вперше було представлене для аналізу ринкової корзини. Асоціативні правила ефективно використовуються в сегментації покупців по поведінці при покупках, аналізі переваг клієнтів, плануванні розташування товарів в супермаркетах, крос-маркетингу, адресній розсилці. Проте, сфера застосування цих алгоритмів не обмежується лише однією торгівлею. Їх також успішно застосовують і в інших областях: медицині, для аналізу відвування веб-сторінок (Web Mining), для аналізу тексту (Text Mining), для аналізу даних по перепису населення, в аналізі та прогнозуванні збоїв телекомунікаційного устаткування і т.д.
