
- •Поиск ап(Ассоциативные правила)
- •Формальная модель.
- •Определение конструкция вычисления точности и важности.
- •Алгоритмы выявления ассоциативных правил.
- •Ассоциативные правила в реляционной базе данных.
- •Нечеткие транзакции и нечеткие ассоциативные правила.
- •Нечеткие транзакции и нечеткие ассоциативные правила. Наш путь
- •Поддержка и доверие в нечетких ассоциативных правилах.
Нечеткие транзакции и нечеткие ассоциативные правила.
Интеллектуальная обработка данных в общем и выявление ассоциативных правил особенно являются молодыми темами, но число статей посвященных данной тематике довольно большое и во многих статьях рассматривается интеллектуальная обработка АП, содержащих количественные атрибуты в реляционной базе данных используя нечеткие множество и лингвистические переменные, чтобы уменьшить неравномерность (глубину детализации) и перевести проблему в более естественный и понимаемый вид.
Нечеткие транзакции и нечеткие ассоциативные правила. Наш путь
Определение 5.
Нечеткая
транзакция - это непустое нечеткое
подмножество
Для каждого
отметим
степень
принадлежности
в нечеткой транзакции
.
Заметим, что
степень включения множества элементов
,
определим его как
.
Согласно определению
5, транзакция является частным случаем
нечеткой транзакции. Мы представим
множество нечетких транзакций как
посредством таблицы. Колонки и строки
обозначаются идентификаторами элементов
и транзакций соответственно. Ячейка
для элемента
и транзакции
содержит значение, принадлежащее
отрезку [0;1]. Степень принадлежности для
в
имеет вид
.
Пример 1. Пусть
набор элементов. Таблица 2 демонстрирует
6 нечетких транзакций определенных в
.
Здесь
,
и так далее. В частности,
жесткая (четкая) транзакция,
.
Пример расчета
степени включения
,
,
Таблица 2.
|
|
|
|
|
|
0 |
0.6 |
0.7 |
0.9 |
|
0 |
1 |
0 |
1 |
|
1 |
0.5 |
0.75 |
1 |
|
1 |
0 |
0.1 |
1 |
|
0.5 |
1 |
0 |
1 |
|
1 |
0 |
0.75 |
1 |
Определение 6.
Пусть
множество элементов,
-
множество и
-
два четких подмножества, где
и
.
Ассоциативное правило
содержится в
,
если
,
То есть степень
включения для
больше чем для
для каждой транзакции
.
Это определение сохраняет смысл
ассоциативного правила, потому как мы
принимаем
в некотором смысле, мы должны предполагать,
что
дает, что
.
Поскольку транзакция является частным
случаем нечеткой транзакции, то
ассоциативное правило – частный случай
нечеткого АП.
Заметим, что основной характерной чертой нашего подхода является моделирование нечетких транзакций с четкими элементами. Это достаточно обще, потому что в случае наличия актуальных нечеткие элементов: лейблы, нечеткие числа, и т.д. они будут производить предыдущую таблицу.
Поддержка и доверие в нечетких ассоциативных правилах.
Чтобы
оценить значения правила, мы используем
семантический путь, основанный на
эволюции количественных предложений.
Количественное предложение – это
выражение вида «»,
где
и
нечеткие
подмножества ограниченного множества
и
относительный (сравнительный) нечеткий
квантификатор. Сравнительный квантификатор
это лингвистическая метка для нечеткого
процентного отношения, которое может
быть представлено в виде значений
нечеткого множества в диапазоне [0;1],
такие как «самый», «почти все», «многие».
Семейство сравнительных квантификаторов, зовущихся связанными квантификаторами особенно важны для нас. Связанные квантификаторы, это те, которые удовлетворяют заданным свойствам:
-
и
-
Если
, тогда
Например,
«многие молодые люди высокие», где
=
«многие» и
и
возможные распределения порожденные
в множестве
=
«люди» неточными термами «молодые» и
«высокие» соответственно. Частный
случай количественного предложения
открывается, когда
,
«многочисленные термы». Оценка
количественного предложения значением
[0;1] дает оценку степени выполнения
предложения.
Определение
7. Пусть
.
Поддержкой
в
это оценка количественного предложения
,
Где
нечеткое
множество на
определенное как
Определение 8.
Поддержкой
ассоциативного правила
в множестве нечетких транзакций
это
,
т.е. оценка количественного предложения
Определение 9.
Доверием
нечеткого ассоциативного правила
в множестве нечетких транзакций
- это оценка количественного предложения
Заметим, что эти определения измерений поддержки и доверия, зависят от выбора метода оценки и квантификатор. Единственным ограничением по нашему мнению, являются следующие 4 интуитивно понятные свойства измерений для обычных ассоциативных правил:
-
Если
, то
-
Если
, тогда
и
-
Если
(в частности, когда
), тогда
-
Если
(в частности, когда
), тогда
Мы выбрали метод GD
для вычисления предложения, был показано
как хорош он для проверки свойства с
более высокой производительностью чем
другие. Вычисление
с помощью GD
Где
,
-
уровень множества
и
с
для всех
.
Множество
предполагается нормированным. Если
нет, то
нормализуется и нормализирующий фактор
применяется к
Оценка квантификатора
предложения
с помощью метода GD
может быть интерпретировано как:
- доказательство того, что процент объектов в F, которые также в G (относительно мощности G по отношению к F)
- квантификатор-руководства
агрегации [52, 82] относительной мощности
G по отношению к F для каждого
-срезом
одинаковым для обоих множеств.
Таким образом
интерпретируется как свидетельство
(доказательство) того, что процент
транзакций в
есть Q.и
можно рассматривать как свидетельство
того, что процент транзакций в
,
такой же и в
есть Q.