
- •Магистерская диссертация
- •230400.68 Информационные системы и технологии
- •230400.68.01 Информационно-управляющие системы
- •Глава 1. Информационно-аналитические технологии анализа данных……………………………………………………………………………...7 1.1 Роль и место информационно-аналитических систем…………7
- •Глава 2. Символьный анализ данных…………………………………..19
- •Глава 3. Применение символьного анализа в информационно аналитических системах......................................................................................57
- •Реферат
- •Введение
- •Глава 1. Информационно-аналитические технологии анализа данных
- •1.1 Роль и место информационно-аналитических систем
- •1.2 Технологии извлечения данных
- •Глава 2. Символьный анализ данных
- •Типы символьных данных
- •2.2 Гистограммы как символическое представление данных
- •2.2.1 Распределение данных
- •2.2.2 Обоснование гистограмм
- •2.2.3 Аппроксимация значений внутри каждого бакета
- •2.2.4 Анализ бинарных данных
- •2.2.5 Построение гистограмм
- •2.2.6 Гистограммы символьных последовательностей
- •2.4 Визуально интерактивные методы анализа данных
- •2.4.1 Теория Доу
- •2.4.2 Волновая теория Эллиотта
- •2.4.3 Метод японских свечей.
- •Глава 3. Применение символьного анализа в информационно аналитических системах
- •3.1.1 Одна зависимая переменная.
- •3.1.2 Многозначные переменная
- •3.1.3 Интервальные переменные
- •3.1.4 Гистограммные переменные
- •3.2 Кластерный анализ
- •3.2.1 Многозначные переменные
- •3.2.2 Интервальные переменные
- •3.3 Кластерный анализ в распознавании изображений
- •Заключение
- •Список использованных источников
- •Приложение а Исходный код программы распознавания изображений
Федеральное государственное автономное образовательное учреждение высшего профессионального образования «СИБИРСКИЙ ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ»
Институт Космических и Информационных Технологий институт
_____________ Информационные системы___________ кафедра
УТВЕРЖДАЮ Заведующий кафедрой ИС _______ ___Виденин С.А._ подпись инициалы, фамилия
« _____» __________2014 г.
Магистерская диссертация
Применение символьного анализа в информационно-аналитических системах
230400.68 Информационные системы и технологии
230400.68.01 Информационно-управляющие системы
Научный руководитель __________ д. ф.- м. н., профессор Б.С. Добронец__ подпись, дата должность, ученая степень инициалы, фамилия Выпускник __________ В.В. Акулов____ подпись, дата инициалы, фамилия Рецензент __________ д. ф.- м. н., профессор О.Ю. Воробьев__ подпись, дата должность, ученая степень инициалы, фамилия Нормоконтролер __________ Ю.В. Шмагрис__ подпись, дата инициалы, фамилия
Красноярск 2014
ВВЕДЕНИЕ……………………………………………………………....…5
Глава 1. Информационно-аналитические технологии анализа данных……………………………………………………………………………...7 1.1 Роль и место информационно-аналитических систем…………7
1.2 Технологии извлечения знаний………………………………….8
1.2.1 Data mining……………………………………………….10
1.2.2 KDD……………………………………………………....12
1.2.3 OLAP………………………………………………..……16
Глава 2. Символьный анализ данных…………………………………..19
2.1 Типы символьных данных……………………………………….21
2.2 Гистограммы как символическое представление данных……………………………………………………………………………...35
2.2.1 Распределение данных…………………………………..35
2.2.2 Обоснование гистограмм………………………………36
2.2.3 Аппроксимация значений внутри каждого баcкета…...39
2.2.4 Анализ бинарных данных………………..………...…....40
2.2.5 Построение гистограмм...................................................43
2.2.6 Гистограммы символьных последовательностей...........44
2.3 Визуально интерактивные методы анализа данных....................51
2.3.1 Теория Доу..........................................................................51
2.3.2 Волновая теория Эллиотта................................................52
2.3.3 Метод японских свечей.....................................................54
Глава 3. Применение символьного анализа в информационно аналитических системах......................................................................................57
3.1 Множественная линейная регрессия...........................................57
3.1.1 Одна зависимая переменная............................................60
3.1.2 Многозначные переменные.............................................63
3.1.3 Интервальные переменные..............................................67
3.1.4 Гистограммные переменные............................................70
3.2 Кластерный анализ.........................................................................82
3.2.1 Многозначные переменные..............................................76
3.2.2 Интервальные переменные...............................................78
3.3 Кластерный анализ в распознавании изображений………….....80
ЗАКЛЮЧЕНИЕ............................................................................................83
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ................................84
Приложение А. Исходный код программы распознавания изображений.89