- •Анализ ассоциаций
- •Анализ рыночной корзины
- •Ассоциативные правила
- •Цели и задачи анализа ассоциаций
- •Обобщенные ассоциативные правила
- •Другие виды ассоциативных правил
- •Применение анализа ассоциаций
- •Модель данных
- •Модель ассоциативных правил
- •Алгоритм Apriori
- •Алгоритмы для больших объемов выборок
- •Алгоритм Partition
- •Список использованных источников
Алгоритм Partition
Для уменьшения количества операций
чтения данных в методе Partition было
предложено разбивать исходную
транзакционную базу данных D на
части, помещающиеся в оперативной памяти
(
).
Затем для каждой части rj,
таким же образом, как и в Apriori, выполняется
поиск «локальных» часто встречающихся
наборов. Если набор часто встречается
в D, то он будет часто встречающимся
хотя бы в одной из частей
.
Таким образом, на первом этапе определяется
множество всех потенциально встречающихся
наборов данных.
Далее для всех наборов найденных для {r1, r2, ..., rv} за один проход по D производится проверка, является ли он часто встречающимся в D. Таким образом, количество проходов сокращается до двух.
Список использованных источников
И. А. Чубукова. Data mining. Учебный курс. http://lnfm1.sai.msu.ru/~rastor/Books/Chubukova-Data_Mining.pdf
Р.Г. Степанов. Технология Data Mining: Интеллектуальный Анализ Данных. Учебное пособие. ГОУ ВПО «Казанский Государственный Университет им. В.И.Ульянова-Ленина», Казань, 2008.
Raymond Lam "Discovering Association Rules in Data Mining" http://www.raymond-lam.com/CS411.doc
А. Павленко. Лекции по анализу данных. 2012 http://share.auditory.ru/2012/Artem.Pavlenko/%D0%BB%D0%B5%D0%BA%D1%86%D0%B8%D0%B8_%D0%B0%D0%B4.pdf
http://www.basegroup.ru/library/analysis/association_rules/intro/
R. Srikant, R. Agrawal. "Mining Generalized Association Rules", In Proc. of the 21th International Conference on VLDB, Zurich, Switzerland, 1995.
R. Agrawal, R. Srikant. "Fast Discovery of Association Rules", In Proc. of the 20th International Conference on VLDB, Santiago, Chile, September 1994.
В. И. Городецкий, В. В. Самойлов, “Ассоциативный и причинный анализ и ассоциативные байесовские сети”, Тр. СПИИРАН, 9 (2009), 13–65.
R. Srikant, R. Agrawal. "Mining quantitative association rules in large relational tables". In Proceedings of the ACM SIGMOD Conference on Management of Data, Montreal, Canada, June 1996.
Лаура Ирина Русу. Интеллектуальный анализ XML-данных: Часть 2. Поиск ассоциативных правил в XML-данных. http://www.ibm.com/developerworks/ru/library/x-datamine2/index.html
R. Agrawal, T. Imielinski, A. Swami. Mining Associations between Sets of Items in Massive Databases. Proc. of the ACM-SIGMOD 1993 Int'l Conference on Management of Data, Washington D.C., May 1993
J.S. Park, M.-S. Chen, and S.Y. Philip, "An Effective HashBased Algorithm for Mining Association Rules", In Proc. ACM SIGMOD Int’l Conf. Management of Data, ACM Press, New York, 1995.
A. Savasere, E. Omiecinski, and S. Navathe, "An Efficient Algorithm for Mining Association Rules in Large Databases", In Proc. 21st Int’l Conf. Very Large Data Bases, Morgan Kaufmann, San Francisco, 1995.
S. Brin et al., "Dynamic Itemset Counting and Implication Rules for Market Basket Data", In Proc. ACM SIGMOD Int’l Conf. Management of Data, ACM Press, New York, 1997.
Zaki, Mohammed J.; Scalable algorithms for association mining, IEEE Transactions on Knowledge and Data Engineering, 12(3):372-390, May/June 2000.
Han, Jiawei; Pei, Jian; Yin, Yiwen; and Mao, Runying; Mining frequent patterns without candidate generation, Data Mining and Knowledge Discovery 8:53-87, 2004.
Webb, Geoffrey I. (2000); Efficient Search for Association Rules, in Ramakrishnan, Raghu; and Stolfo, Sal; eds.; Proceedings of the Sixth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD-2000), Boston, MA, New York, NY: The Association for Computing Machinery, pp. 99-107.
J. Mata, J. L. Alvarez, J. C. Riquelme: Evolutionary computing and optimization: An evolutionary algorithm to discover numeric association rules Proceedings of the 2002 ACM symposium on Applied computing. March 2002.
M. J. Zaki, M. Ogihara, S. Parthasarathy, W. Li: Parallel data mining for association rules on shared-memory multi-processors Proceedings of the 1996 ACM/IEEE conference on Supercomputing (CDROM) Supercomputing '96. November 1996.
Eui-Hong (Sam) Han, George Karypis, V. Kumar: Scalable Parallel Data Mining for Association Rules. Transaction on Knowledge and Data Engineering, 12(3): P. 728-737. 2000.
http://www.basegroup.ru/library/analysis/association_rules/fpg/
H. Toivonen, «Sampling Large Databases for Association Rules», Proc. 22nd Int?l Conf. Very Large Data Bases, Morgan Kaufmann, San Francisco, 1996, pp. 134-145.
Ming-Syan Chen, Jiawei Han, Philip S. Yu: Data Mining: An Overview from a Database Perspective. IEEE Trans. On Knowledge And Data Engineering. 1996
http://www.kdnuggets.com/polls/2012/analytics-data-mining-big-data-software.html
KNIME Beginner's Luck : A Guide to KNIME Data Mining Software for Beginners. KNIME-Press, http://www.knime.org/knimepress/beginners-luck.
The KNIME Cookbook : Recipes for the Advanced User. KNIME-Press, http://www.knime.org/knimepress/the-knime-cookbook.
Guide to Intelligent Data Analysis: How to Intelligently Make Sense of Real Data, by Berthold, M.R., Borgelt, C., Höppner, F., Klawonn, F. Series: Texts in Computer Science Springer Verlag, 1st Edition., 2010.
Christian Hidber, Online Association Rule Mining, SIGMOD 1999, Proceedings. ACM SIGMOD International Conference on Management of Data, June 1-3, 1999, Philadephia, Pennsylvania, pp.145-156.
