Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Ульяновский государственный университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Лекции по СППР / Лекции по СППР! / Лек4-7.doc

Скачиваний:

188

Добавлен:

23.03.2016

Размер:

2.2 Mб

Скачать

☆

<<< < Предыдущая 3 4 5 6 7 8 9 10 11 12 13 1415 / 2915 16 17 18 19 20 21 22 23 24 25 26 27 > Следующая >>>

Поиск ассоциативных правил.

1. Постановка задачи 6.1.1. Формальная постановка задачи

•Одной из наиболее распространенных задач анализа данных является определение часто встречающихся наборов объектов в большом множестве наборов.

Опишем эту задачу в обобщенном виде. Для этого обозначим объекты, составляющие исследуемые наборы (itemsets), следующим множеством:

I= {i₁, i₂...,i_j, ...,i_n},

i_j — объекты, входящие в анализируемые наборы; п — общее количество объектов.

В сфере торговли, например, такими объектами являются товары, представнные в прайс-листе (табл. 6.1).

Таблица 6.1

Идентификатор	Наименование товара	Цена
0	Шоколад	30.00
1	Чипсы	12.00
2	Кокосы	10.00
3	Вода	4.00
4	Пиво	14.00
5	Орехи	15.00

Они соответствуют следующему множеству объектов:

I= {шоколад, чипсы, кокосы, вода, пиво, орехи}.

Наборы объектов из множества I, хранящиеся в БД и подвергаемые анализу, называются транзакциями. Опишем транзакцию как подмножество множества I:

T = {i_j| i_j принадлежит I}.

Такие транзакции в магазине соответствуют наборам товаров, покупаемых потребителем и сохраняемых в БД в виде товарного чека или накладной. В них перечисляются приобретаемые покупателем товары, их цена, количество и др. Например, следующие транзакции соответствуют покупкам, совершаемым потребителями в супермаркете:

Т₁ = {чипсы, вода, пиво};

Т₂ = {кокосы, вода, орехи}.

Набор транзакций, информация о которых доступна для анализа, обозначим следующим множеством:

где m — количество доступных для анализа транзакций.

Например, в магазине таким множеством будет:

D= {{чипсы, вода, пиво},

{кокосы, вода, орехи},

{орехи, кокосы, чипсы, кокосы, вода},

{кокосы,орехи, кокосы}}.

Для использования методов Data Mining множество D может быть представлено в виде табл. 6.2.

Таблица 6.2

Номер транзакции

Номер товара

Наименование товара

Цена

Чипсы

12.00

Вода

4.00

Пиво

14.00

1	5	Орехи	15.00
2	2	Кокосы	10.00
2	1	Чипсы	12.00
2	2	Кокосы	10.00
2	3	Вода	4.00
3	2	Кокосы	10.00
3	5	Орехи	15.00
3	2	Кокосы	10.00

Кокосы

10.00

Вода

4.00

Орехи

15.00

2	5	Орехи	15.00
2	2	Кокосы	10.00
2	1	Чипсы	12.00
2	2	Кокосы	10.00
2	3	Вода	4.00
3	2	Кокосы	10.00
3	5	Орехи	15.00
3	2	Кокосы	10.00

Множество транзакций, в которые входит объект i_j,обозначим следующим образом:

В данном примере множеством транзакций, содержащих объект вода, является следующее множество:

D_вода={{чипсы, вода, пиво},

{кокосы, вода, орехи},

{орехи, кокосы, чипсы, кокосы, вода}}.

Некоторый произвольный набор объектов (itemset) обозначим следующим образом:

Например,

F = {кокосы, вода}.

Набор, состоящий из к объектов, называется k-элементным набором (в данном примере это 2-элементный набор).

Множество транзакций, в которые входит набор F, обозначим следующим образом:

В данном примере:

D_{{кокосы,
вода}} = { {кокосы, вода, орехи},

{орехи, кокосы, чипсы, кокосы, вода}}.

Отношение количества транзакций, в которое входит набор F, к общему количеству транзакций называется поддержкой (support) набора F и обозначается Supp(F):

Для набора {кокосы, вода} поддержка будет равна 0,5, т. к. данный набор входит в две транзакции (с номерами 1 и 2), а всего транзакций 4.

При поиске аналитик может указать минимальное значение поддержки интересующих его наборов Supp_min. Набор называется частым (large itemset), если значение его поддержки больше минимального значения поддержки, заданного пользователем:

Supp(F)>Supp_min.

Таким образом, при поиске ассоциативных правил требуется найти множество всех частых наборов:

В данном примере частыми наборами при Supp_min = 0,5 являются следующие:

{чипсы} Supp_mm= 0,5;

{чипсы, вода} Supp_min= 0,5;

{кокосы} Supp_min=0,75;

{кокосы, вода} Supp_min= 0,5;

{кокосы, вода, орехи} Supp_min = 0,5;

{кокосы, орехи} Supp_min = 0,75;

{вода} Supp_mi„=0,75;

{вода, орехи} Supp_min=0,5;

{орехи} Supp_min=0,75.

<<< < Предыдущая 3 4 5 6 7 8 9 10 11 12 13 1415 / 2915 16 17 18 19 20 21 22 23 24 25 26 27 > Следующая >>>

Соседние файлы в папке Лекции по СППР!

#
23.03.201689.6 Кб75Карта_Кохонена.doc
#
23.03.2016952.83 Кб116Лек1,2.doc
#
23.03.20162.2 Mб188Лек4-7.doc
#
23.03.2016315.9 Кб130Лекция 3.doc
#
23.03.20163.38 Mб106Приложение.doc
#
23.03.201663.2 Кб62Системы_поддержки_принятия_решений.htm