Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
шпоры по СТОЭИ.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
222.72 Кб
Скачать

28. Типовая структура и особенности аналитических информационных систем.

Data Mining - совокупности методов обнаружения в данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности.

Выделяют следующие задачи Data Mining:

Классификация -В результате решения задачи классификации обнаруживаются признаки, которые характеризуют группы объектов исследуемого набора данных - классы; по этим признакам новый объект можно отнести к тому или иному классу.

Кластеризация - логическое продолжение идеи классификации.. Результатом кластеризации является разбиение объектов на группы

Ассоциация – нахождение закономерности между связанными событиями в наборе данных в процессе решения задачи поиска ассоциативных правил.

Последовательность позволяет найти временные закономерности между транзакциями. Задача последовательности подобна ассоциации, но ее целью является установление закономерностей не между одновременно наступающими событиями, а между событиями, связанными во времени (т.е. происходящими с некоторым определенным интервалом во времени).

Основой для всевозможных систем прогнозирования служит историческая информация, хранящаяся в БД в виде временных рядов.

Определение отклонений или выбросов - обнаружение и анализ данных, наиболее отличающихся от общего множества данных, выявление так называемых нехарактерных шаблонов.

Оценивание - предсказание непрерывных значений признака.

Анализ связей - задача нахождения зависимостей в наборе данных.

Визуализация – создание графического образа анализируемых данных. Для решения задачи визуализации используются графические методы, показывающие наличие закономерностей в данных.

Основная особенность Data Mining - это сочетание широкого математического и последних достижений в сфере информационных технологий.

Считается, что Data Mining состоит из трёх стадий:

Стадия 1. Выявление закономерностей (свободный поиск) + валидация (проверка достоверности найденных закономерностей).

Стадия 2. Использование выявленных закономерностей для предсказания неизвестных значений (прогностическое моделирование).

Стадия 3. Анализ исключений - стадия предназначена для выявления и объяснения аномалий, найденных в закономерностях.

29. Понятие и концепция хранилищ данных.

Хранилище данных (Data Warehouse) - это предметно-ориентированный, интегрированный, неизменчивый, поддерживающий хронологию набор данных, организованный для целей поддержки управления.

Концепция хранилищ данных по С.Кузнецову:

· Интеграция ранее разъединенных детализированных данных в едином DW, их согласование и агрегация

· Разделение наборов данных для операционной обработки и наборов данных для решения задач анализа

Свойства хранилищ данных:

· Предметная ориентация хранилища данных означает, что данные объединены в категории и сохраняются соответственно областям, которые они описывают, а не применениям, их использующим.

· Интегрированность данных означает, что данные удовлетворяют требованиям всего предприятия, а не одной функции бизнеса. Этим хранилище данных гарантирует, что одинаковые отчеты, сгенерированные для разных аналитиков, будут содержать одинаковые результаты.

· Инвариантность во времени хранилище можно рассматривать как совокупность "исторических" данных: возможно восстановление данных на любой момент времени. Атрибут времени явно присутствует в структурах хранилища данных.

·Стабильность информации означает, что, попав один раз в хранилище, данные там сохраняются и не изменяются. Данные в хранилище могут лишь добавляться.

·Минимизация избыточности информации.

Таким образом, хранилище данных представляет собой своеобразный накопитель информации о деятельности предприятия.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]