
- •Магистерская диссертация
- •230400.68 Информационные системы и технологии
- •230400.68.01 Информационно-управляющие системы
- •Глава 1. Информационно-аналитические технологии анализа данных……………………………………………………………………………...7 1.1 Роль и место информационно-аналитических систем…………7
- •Глава 2. Символьный анализ данных…………………………………..19
- •Глава 3. Применение символьного анализа в информационно аналитических системах......................................................................................57
- •Реферат
- •Введение
- •Глава 1. Информационно-аналитические технологии анализа данных
- •1.1 Роль и место информационно-аналитических систем
- •1.2 Технологии извлечения данных
- •Глава 2. Символьный анализ данных
- •Типы символьных данных
- •2.2 Гистограммы как символическое представление данных
- •2.2.1 Распределение данных
- •2.2.2 Обоснование гистограмм
- •2.2.3 Аппроксимация значений внутри каждого бакета
- •2.2.4 Анализ бинарных данных
- •2.2.5 Построение гистограмм
- •2.2.6 Гистограммы символьных последовательностей
- •2.4 Визуально интерактивные методы анализа данных
- •2.4.1 Теория Доу
- •2.4.2 Волновая теория Эллиотта
- •2.4.3 Метод японских свечей.
- •Глава 3. Применение символьного анализа в информационно аналитических системах
- •3.1.1 Одна зависимая переменная.
- •3.1.2 Многозначные переменная
- •3.1.3 Интервальные переменные
- •3.1.4 Гистограммные переменные
- •3.2 Кластерный анализ
- •3.2.1 Многозначные переменные
- •3.2.2 Интервальные переменные
- •3.3 Кластерный анализ в распознавании изображений
- •Заключение
- •Список использованных источников
- •Приложение а Исходный код программы распознавания изображений
Заключение
В ходе диссертационной работы был произведен анализ публикаций, изучены различные способы представления символьных данных, и рассмотрены задачи связанные с применением символьного анализа в информационно-управляющих системах, а именно в задачах регрессии и кластеризации. Была разработана компьютерная программа демонстрирующая, практическое применение символьного анализа, а именно анализ изображений.
Символьный анализ это перспективное направление для технологий извлечения знаний из данных сложной структуры, которое может использоваться в областях связанных с базами данных, хранилищами данных, для сжатия информации без потери полезных знаний. Рассмотренный в работе пример показывает эффективность использования процедур символьного анализа и определяет основные направления применения данных методов для решения практических задач.
На основании анализа источников можно сделать вывод, что в России данное направление только начинает развиваться. Символьный подход является довольно новым и хорошим инструментом для анализа данных. Набор методов анализа символических данных увеличивается со временем, затрагивая новые области и предлагая более новые подходы. Так же символьные методы успешно применяются в различных областях, таких как статистика, маркетинг, промышленность, финансы, и др.
Список использованных источников
[1] Акулов В.В Символьный подход к анализу данных. Специальное инженерное, тезисы региональной научно-технической конференции магистрантов. (стр. 130-132) 2013.
[2] From the Statistics of Data to the Statistics of Knowledge: Symbolic Data Analysis L. BILLARD and E. DIDAY 2002.
[3] Попова О. А. Технология извлечения и визуализации знаний на основе численного вероятностного анализа неопределенных данных
[4] Добронец Б.С. Интервальная математика: Учеб. пособие. Красноярский гос. ун-т. - Красноярск, 2004.
[5] Bock H.H., Diday E. (2000) “Analysis of Symbolic Data”. Study in Classification, Data Analysis and Knowledge Organization. Springer Verlag.
[6] Diday E. (1987) “The symbolic approach in clustering and related methods of Data Analysis”, Proc. IFCS, Aachen, Germany.
[7] Bock H.H., Diday E. (2000) “Analysis of Symbolic Data”. Study in Classification, Data Analysis and Knowledge Organization. Springer Verlag.
[8] Edwin Diday ,An Introduction to Symbolic Data Analysis and the Sodas Software,
[9] Symbolic Data Analysis: Conceptual Statistics and Data Mining L. Billard and E. Diday 2006 John Wiley & Sons, Ltd. ISBN: 978-0-470-09016-9
[10] Андерсон Т. Статистический анализ временных рядов. — М.: «Вильямс», 2003
[11] Кендалл М.Дж., Стъюарт А. Многомерный статистический анализ и временные ряды. - М.: Наука, 1976
[12] Белов В.С. ИНФОРМАЦИОННО-АНАЛИТИЧЕСКИЕ СИСТЕМЫ. Основы проектирования и применения: учебное пособие, руководство, практикум / Московский государственный университет экономики, статистики и информатики. — М., 2005.
[13] Billard, L. and Diday, E. (2000). Regression Analysis for Interval-Valued Data. Data analysis, Classi_caiton, and Related Methods
[14] Барсегян, А. А. Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP / А. А. Барсегян, M. С. Куприянов, В. В. Степаненко, И. И. Холод. — 2-е изд., перераб. и доп. — СПб.: БХВ-Петербург, 2008.
[15] Le-Rademacher, J. and Billard, L. (2010). Likelihood Functions and Some Maximum
[16] Likelihood Estimators for Symbolic Data. Journal of Statistical Planning and Inference, submitted.
[17] Lima Neto, E.A. and de Carvalho F.A.T. (2010). Constrained Linear Regression Models for Symbolic Interval-valued Variables. Computational Statistics & Data Analysis
[18] P. BERTRAND, F. GOUPIL, Descriptive statistics for symbolic data. In: Analysis of Symbolic Data: Exploratory Methods for Extracting Statistical Information from Complex Data (eds. H.-H. Bock and E. Diday). Springer-Verlag, Berlin, (2000), 103–124
[19] Böhm B. (1996), “Dynamic Econometric Specification and the Analysis of Structural Change”, Dynamis, Quaderno 2/96, IDSE, Milano.
[20] Billard L., Diday E. (2005): Histograms in symbolic data analysis 2005. Intern Stat. Inst. 55.
[21] Lima Neto, E.A. and de Carvalho F.A.T. (2010). Constrained Linear Regression Models for Symbolic Interval-valued Variables. Computational Statistics & Data Analysis
[22] Diday, E., Emilion, R. and Hillali, Y. (1996). Symbolic Data Analysis of Probabilistic Objects by Capacities and Credibilities. Societea' Italianadi Statistica
[23] Lima Neto, E.A., de Carvalho F.A.T. and Tenorio, C.P. (2004). Univariate and Multi-variate Linear Regression Methods to Predict Interval-valued Features.
[24]Bertrand, P. and Goupil, F. (2000): Descriptive Statistics for Symbolic Data. Analysis of Symbolic Data: Exploratory Methods for Extracting Statistical Information from Complex Data
[25] Billard, L. and Diday, E. (2006). Descriptive Statistics for Interval-valued Observationsin the Presence of Rules. Computational Statistics,
[26] Дюран Б., Оделл П. Кластерный анализ. М.: Статистика, 1977.
[27] Жамбю М. Иерархический кластер-анализ и соответствия. М.: Финансы и статистика, 1988
[28] Мандель И.Д. Кластерный анализ. М.: Финансы и статистика, 1988
[29] Кендалл М. Дж., Стьюарт А., Статистические выводы и связи, пер. с англ., М., 1973
[30] Линейные статистические методы и их применения, пер. с англ., М., 1968;
[31] Дрейпер Н., Смит Г., Прикладной регрессионный анализ, пер. с англ., М., 1973. А. В. Прохоров.
[32] Шашков В.Б. Прикладной регрессионный анализ. Многофакторная регрессия: Учебное пособие. - Оренбург: ГОУ ВПО ОГУ, 2003.
[33] Microsoft. C#. Спецификация языка Версия 3.0. 2007
[34] Павловская. C# Программироване на языке высокого уровня. 2009
[35] Шилдт Герберт- C# Учебный Курс. 2003 [36] Шилдт Герберт. Полный справочник по C#. 2004
[37] Паклин Н. Б., Орешков В. И. Бизнес-аналитика: от данных к знаниям СПб.: Изд. Питер, 2009.
[38] Дюк В., Самойленко А. Data Mining: учебный курс (+CD). — СПб.: Изд. Питер, 2001.
[39] Чубукова И. А. Data Mining: учебное пособие. — М.: Интернет-университет информационных технологий: БИНОМ: Лаборатория знаний, 2006
[40] Разработка специальных запросов и анализ данных Майкл Армстронг-Смит, Дарлен Армстронг-Смит 2002г.
[41] Мишулина О. А. Статистический анализ и обработка временных рядов. — М.: МИФИ, 2004.
[42] Krzysztof J. Cios, Data Mining: A Knowledge Discovery Approach, Springer 2007
[43] C.S. Daw, C.E.A. Finney and J.B.Green (1998), “Symbolic Time-Series Analysis of Engine Combustion measurements”, SAE Paper No. 980624.
[44] X.Z. Tang, E.R. Tracy and R. Brown (1997), “Symbol Statistics and Spatio-Temporal Systems”, Physica D
[45] J.S. Armfield, C.S. Daw, J.A. Dralimeier, P. Durbetaki, C.E.A. Finney, J.B.Green, M.B. Kennel
[46] Lima Neto, E., de Carvalho F.A.T. (2010). Constrained Linear Regression Models for Symbolic Interval-valued Variables. Computational Statistics & Data Analysis
[47] Lima Neto, E.A., de Carvalho F.A.T. and Tenorio, C.P. (2004). Univariate and Multivariate Linear Regression Methods to Predict Interval-valued Features. Lecture Notes in Computer Science, AI 2004
[48] Lindstrom, M. and Bates, D. (1988). Newton-Raphson and EM algorithms for linear mixed e_ects models for repeated measures data. Journal of the American Statistical Association,
[49] R.M. Wagner (1998), “Time Irreversibility and Comparison of Cyclic-Variability Models”, To appear at the 1999 SAE International Congress & Exposition.
[50] Lynne Billard Some Analyses of Interval Data Journal of Computing and Information Technology - CIT 16, 2008