
- •Кафедра вычислительной техники
- •1 Проблема обработки данных
- •2 Интеллектуальный анализ данных (data mining)
- •2.1 Введение в Data Mining
- •2.2 Понятие Data Mining
- •2.3 Методы анализа данных
- •2.4 Классификация методов анализа данных
- •2.5 Проблемы и ограничения Data Mining
- •2.6 Перспективы технологии Data Mining
- •2.7 Внедрение Data Mining в сппр
- •3 Системы поддержки принятия решений
- •3.1 Понятие и основные компоненты сппр
- •3.2 Классификация сппр
- •3.3 Архитектура сппр
- •Список использованных источников
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ
Филиал ФЕДЕРАЛЬНОГО ГОСУДАРСТВЕННОГО БЮДЖЕТНОГО
ОБРАЗОВАТЕЛЬНОГО УЧРЕЖДЕНИЯ ВЫСШЕГО
ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ «НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ «МЭИ» в г. Смоленске
Кафедра вычислительной техники
Доклад
по курсу Компьютерные технологии в науке и производстве
«Компьютерные методы анализа и интерпретации данных. Компьютерные системы поддержки принятия решений»
Студент: |
Ковалева М.Ю. |
Группа: |
ВМ-12(маг) |
Преподаватель: |
Семенова О.В. |
Смоленск
2012
Содержание
Кафедра вычислительной техники 1
1 ПРОБЛЕМА ОБРАБОТКИ ДАННЫХ 3
2 ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ (DATA MINING) 5
2.1 Введение в Data Mining 5
2.2 Понятие Data Mining 6
2.3 Методы анализа данных 7
2.4 Классификация методов анализа данных 9
2.5 Проблемы и ограничения Data Mining 10
2.6 Перспективы технологии Data Mining 11
2.7 Внедрение Data Mining В СППР 12
3 СИСТЕМЫ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ 14
3.1 Понятие и основные компоненты СППР 14
3.2 Классификация СППР 16
3.3 Архитектура СППР 17
Список использованных источников 22
1 Проблема обработки данных
Современное состояние человеческого общества характеризуется высоким развитием уровня техники, сложностью используемых технологических процессов, эффективностью различных видов связи и коммуникаций. Поэтому в целом состояние человеческого общества характеризуется наличием интенсивных потоков информации, которые воздействуют на составные части и элементы структуры человеческой цивилизации, и связывают их в единое целое. В 60-х годах XX века появился термин «информационный взрыв», смысл которого состоит в том, что бурное развитие техники, технологии и связи привело к необходимости обрабатывать данные такого большого объема и в такие ограниченные сроки по времени, что требуемая скорость переработки информации и принятия решений в ряде случаев оказалась на пределе человеческих возможностей.
С другой стороны, научный прогресс достиг стадии развития, когда фундаментальные естественнонаучные закономерности были открыты и исследованы, а новые взгляды на природу оказались столь сложны, что организация исследований и разработка теории стали решаться лишь на уровне больших исследовательских коллективов.
С практическим применением ЭВМ возникла возможность в первую очередь резко ускорить процесс переработки информации. Это сразу перевело в разряд практических многие теоретические задачи, исследование которых ранее было просто невозможно из-за большого объема вычислений. Ориентация на вычисления с помощью ЭВМ дала толчок новому этапу в развитии различных разделов научной теории и, прежде всего, вычислительной математики. Использование ЭВМ позволило справиться не только с большим объемом вычислений, но и с большим объемом поступающих на простую обработку данных. Тем самым снималась угроза «информационного взрыва» и в обычной, ненаучной жизни человеческого общества.
В свою очередь, совершенствование математических методов обработки экспериментальных данных в направлении увеличения их объема и скорости их обработки с одной стороны, и все более сильная интеграция и взаимосвязь различных составных частей структуры человеческого общества с другой стороны, привели к использованию математических методов обработки данных не только в технических областях, но и в нетрадиционных сферах – медицине, биологии, экономике, экологии, социологии.
Возросшая сложность процессов в технике и технологии, сложность научных теорий и большая интенсивность информационных потоков в современном обществе привели к необходимости учитывать как можно больше информации об изучаемом явлении для того, чтобы адекватно описать его с учетом всей совокупности взаимосвязей и мешающих воздействий. Такая необходимость приводит к тому, что в ходе экспериментов приходится накапливать большие объемы информации или, другими словами, большие массивы данных, а также применять специальные методы их обработки. В связи с необходимостью обработки больших массивов экспериментальных данных исследователи обратили внимание на следующие обстоятельства, которым раньше просто не придавали значения.
Во-первых, экспериментальные данные, как правило, не содержат в явном виде информации о наиболее существенных свойствах изучаемого явления. Как правило, экспериментальные данные накапливаются при измерении некоторых величин на объекте исследования. В то же время наиболее существенные свойства изучаемого явления оказываются, как правило, его внутренними, глубинными характеристиками, недоступными для непосредственного измерения.
Во-вторых, возникает вопрос о том, что является полезной информацией в большом массиве данных. Поэтому возникает необходимость в специальных процедурах формирования массива данных и его обработке с целью выделения полезной информации.
В-третьих, экспериментальные данные и результат их обработки могут иметь самое разное представление. Например, массив данных может иметь традиционный вид матрицы, или может быть представлен в виде графа или кривой. Тогда возникает необходимость либо преобразования в более традиционную форму, либо разработки специфических методов обработки. Часто результат исследования выражается не в виде численных значений существенных свойств изучаемого явления, а в виде информации о типах его возможных состояний. Таким образом, целью обработки является получение типологии. Необходимость решения задач построения и анализа типологий самого разного вида привела к появлению, в отличие от традиционных методов обработки количественных данных, новых методов обработки качественных данных [1].
Большое распространение, начиная с 90-х годов XX века, получил интеллектуальный анализ данных (Data Mining).