- •1.Система поддержки принятия решений (сппр), ее основные задачи. Классификация сппр. Схема типичной сппр.
- •2.Сравнительный анализ аналитической и oltp систем.
- •3.Хранилище данных. История возникновения понятия, определение, основные свойства.
- •4.Основные подходы к реализации хранилищ данных.
- •Реализация хранилищ и витрин данных
- •Понятие и суть etl-процесса, основные преобразования данных.
- •Определение качества данных. Методика оценки качества, основанная на 4-х основных показателях.
- •8.Определение качества данных.Уровневая методика оценки качества.
- •11.Повышение качества данных: предварительная замена, классификация, структуризация.
- •12.Повышение качества данных: верификация, нормализация.
- •14.Понятия запроса и объекта запроса. Основные этапы поиска информации. Классификация задачи поиска.
- •15.Особенности решение задачи поиска в структурированных источниках на всех этапах.
- •Методы поиска Адресный поиск
- •Семантический поиск
- •Документальный поиск
- •Фактографический поиск
- •16.Оценка эффективности поисковых инструментов.
- •17. Суть многомерного анализа данных, основные понятия. Возможные операции над гиперкубом. Понятие olap.
- •18. 12 Правил Кодда.
- •19. 6 Дополнительных правил Кодда. Группы правил.
- •20.Определение olap через 5 ключевых понятий теста fasmi.
- •21.Основные подходы к реализации olap, их преимущества и недостатки.
- •23.Единая система нси. Требования идентифицируемости и уникальности, принципы построения.
- •Принципы построения единой системы нси.
- •24. Система нси: 1-3 типовые ошибки.
- •25.Система нси: 4-6 типовые ошибки.
- •26. Система нси: 7-10 типовые ошибки.
- •27.Понятие Data Mining. Дисциплины, использованные при создании Data Mining. Основные действия выполняемые Data Mining. Основные ограничения использования.
- •28.Основные задачи Data Mining. Классификация и кластеризация: суть, сравнительный анализ.
- •29.Основные задачи Data Mining. Поиск ассоциативных правил, прогнозирование, анализ отклонений.
- •30.Определение метода и алгоритма. Классификация стадий Data Mining. Свободный поиск.
- •31.Определение метода и алгоритма. Классификация стадий Data Mining. Прогностическое моделирование.
- •32.Определение метода и алгоритма. Классификация стадий Data Mining. Анализ исключений.
- •33.Основные этапы процесса подготовки к Data Mining. Анализ предметной области, постановка задачи, подготовка данных.
- •34.Понятие Text Mining. Основные этапы.
- •35.Понятие Text Mining. Основные задачи.
- •36. Предварительная обработка данных, основные приемы.
- •38.Oracle Data Mining (odm). Возможности, архитектура, характеристики. Используемые алгоритмы.
- •39.Функциональные возможности odm. Алгоритм Naïve Bayes.
- •40.Функциональные возможности odm. Алгоритм Support Vector Machine.
- •41.Функциональные возможности odm. Алгоритм k-means. Проверка качества кластеризации.
- •Алгоритм k-means.
- •42.Функциональные возможности odm. Алгоритмы Apriori.
- •43.Workflow.(поток работы) Суть, базовые понятия и их взаимосвязь.
- •44.Workflow. Структура системы, основные компоненты и их взаимосвязь.
- •45.Workflow. Условия представления бизнес-процесса как процесса Workflow. Порядок представления бизнес процесса в графическом виде (idef0).
- •49.Категории операций бизнес-процесса. Типовые параметры описания бизнес-процесса. Условия перехода между операциями.
- •46.Типовые цели внедрения проекта Workflow. Цикл управления эксплуатацией и развитием системы.
- •47.Понятие агентов. Типы агентов. Способности обучающихся агентов.
- •48.Понятие субагентов, типы субагентов. Свойства автономного агента
- •49.Мультиагентная система (мас). Определение, основные характеристики, классификация мас.
- •50.Методы организации работы в мас. Условия размещения агента на сервере. Операции над агентами. Примеры использования мас.
1.Система поддержки принятия решений (сппр), ее основные задачи. Классификация сппр. Схема типичной сппр.
Ее задачи: ввод данных, хранение(система помогает принимать решения, гипотезы),анализ.
Анализ- по степени интеллектуальности:1.Информационно-поисковые системы, форма запроса заранее известна.,2.Оперативно-аналитическая, работа с информацией произвольная, вводить данные по произвольным интересам.,3.Интеллектуальные,показывают данные в нужном виде, стараются сами анализировать, заключать.
Схема:
Оператор--> подсистема ввода данных(СУБД)OLTP(система оперативной обработки данных)---- подсистема хранения данных(СУБД)ХД(хранилище данных) - подсистема анализа, информационно-поисковый блок, блок оперативного анализа, интеллектуальные инструменты,-- аналитик.
2.Сравнительный анализ аналитической и oltp систем.
Характеристика :1.степень детализации хранилищ данных.2.Качество данных.3.Допущение избыточных данных.4.Требования управления данными.5.Требования по кол-ву данных.6.Характер запроса данных.7.Время обработки обращения к данным.8.Характер вычисления нагрузок.9.Приоритетность хар-к систем.10.Формат хранения
Требования OLTP систем:1.детализированные.2.неверные данные допускаются.3.максимальная нормализация.4.в любое время.5.оперативные данные, нужные в данный момент.6.заранее составленные запросы.7.время отклика секунды.8.постоянная, равномерная.9.высокая производительность, доступность.10.допускается содержание одних и тех же данных в разных форматах.
Требования аналитических систем.1.детализированные+агрегированные.2.ошибки не допускаются.3.допускается денормализация.4.периодически добавлять данные.5необходимы все хранимые данные.6.произвольные запросы.7.несколько минут- это нормально.8.скачкообразная, при выполнении запроса на 100%.9.максимальная гибкость+независимость работы.10.один формат, унификация.
3.Хранилище данных. История возникновения понятия, определение, основные свойства.
1992г.Инмон.-поставление хранилищ данных .ОХ- оперативное хранилище. ХД- хранилище данных.
Определение. ХД- предметно-ориентированный, интегрированный, неизменчивый, поддерживающий хронологию набор данных, организованный для целей поддержки принятия решений.
4 св-ва ХД:1.предметная ориентация(унификация описания предметов).2.интеграция(в одном месте)3.поддержка хронологии(даты в одинаковом формате)4.неизменяемость(только периодически добавлять новые)
ОИД- оперативный источник данных. ВД- витрина данных- содержит тематически объединенные данные, необходимые для данного вида анализа. Каждая витрина ориентирована на конкретную область.
4.Основные подходы к реализации хранилищ данных.
Хранилище данных - предметно-ориентированный, интегрированный, неизменчивый, поддерживающий хронологию набор данных, организованный для целей поддержки управления.
Подход построения хранилища данных для интеграции неоднородных источников данных принципиально отличается от подхода динамической интеграции разнородных БД. Реально строится новое крупномасштабное хранилище, управление данными в котором происходит по другим правилам, чем в исходных оперативных БД.
В основе концепции хранилища данных лежат две основные идеи:
(1) Интеграция разъединенных детализированных данных (детализированных в том смысле, что они описывают некоторые конкретные факты, свойства, события и т.д.) в едином хранилище. В процессе интеграции должно выполняться согласование рассогласованных детализированных данных и, возможно, их агрегация. Данные могут поступать из исторических архивов корпорации, оперативных баз данных, внешних источников.
(2) Разделение наборов данных и приложений, используемых для оперативной обработки и применяемых для решения задач анализа.