
- •1.Система поддержки принятия решений (сппр), ее основные задачи. Классификация сппр. Схема типичной сппр.
- •2.Сравнительный анализ аналитической и oltp систем.
- •3.Хранилище данных. История возникновения понятия, определение, основные свойства.
- •4.Основные подходы к реализации хранилищ данных.
- •Реализация хранилищ и витрин данных
- •Понятие и суть etl-процесса, основные преобразования данных.
- •Определение качества данных. Методика оценки качества, основанная на 4-х основных показателях.
- •8.Определение качества данных.Уровневая методика оценки качества.
- •11.Повышение качества данных: предварительная замена, классификация, структуризация.
- •12.Повышение качества данных: верификация, нормализация.
- •14.Понятия запроса и объекта запроса. Основные этапы поиска информации. Классификация задачи поиска.
- •15.Особенности решение задачи поиска в структурированных источниках на всех этапах.
- •Методы поиска Адресный поиск
- •Семантический поиск
- •Документальный поиск
- •Фактографический поиск
- •16.Оценка эффективности поисковых инструментов.
- •17. Суть многомерного анализа данных, основные понятия. Возможные операции над гиперкубом. Понятие olap.
- •18. 12 Правил Кодда.
- •19. 6 Дополнительных правил Кодда. Группы правил.
- •20.Определение olap через 5 ключевых понятий теста fasmi.
- •21.Основные подходы к реализации olap, их преимущества и недостатки.
- •23.Единая система нси. Требования идентифицируемости и уникальности, принципы построения.
- •Принципы построения единой системы нси.
- •24. Система нси: 1-3 типовые ошибки.
- •25.Система нси: 4-6 типовые ошибки.
- •26. Система нси: 7-10 типовые ошибки.
- •27.Понятие Data Mining. Дисциплины, использованные при создании Data Mining. Основные действия выполняемые Data Mining. Основные ограничения использования.
- •28.Основные задачи Data Mining. Классификация и кластеризация: суть, сравнительный анализ.
- •29.Основные задачи Data Mining. Поиск ассоциативных правил, прогнозирование, анализ отклонений.
- •30.Определение метода и алгоритма. Классификация стадий Data Mining. Свободный поиск.
- •31.Определение метода и алгоритма. Классификация стадий Data Mining. Прогностическое моделирование.
- •32.Определение метода и алгоритма. Классификация стадий Data Mining. Анализ исключений.
- •33.Основные этапы процесса подготовки к Data Mining. Анализ предметной области, постановка задачи, подготовка данных.
- •34.Понятие Text Mining. Основные этапы.
- •35.Понятие Text Mining. Основные задачи.
- •36. Предварительная обработка данных, основные приемы.
- •38.Oracle Data Mining (odm). Возможности, архитектура, характеристики. Используемые алгоритмы.
- •39.Функциональные возможности odm. Алгоритм Naïve Bayes.
- •40.Функциональные возможности odm. Алгоритм Support Vector Machine.
- •41.Функциональные возможности odm. Алгоритм k-means. Проверка качества кластеризации.
- •Алгоритм k-means.
- •42.Функциональные возможности odm. Алгоритмы Apriori.
- •43.Workflow.(поток работы) Суть, базовые понятия и их взаимосвязь.
- •44.Workflow. Структура системы, основные компоненты и их взаимосвязь.
- •45.Workflow. Условия представления бизнес-процесса как процесса Workflow. Порядок представления бизнес процесса в графическом виде (idef0).
- •49.Категории операций бизнес-процесса. Типовые параметры описания бизнес-процесса. Условия перехода между операциями.
- •46.Типовые цели внедрения проекта Workflow. Цикл управления эксплуатацией и развитием системы.
- •47.Понятие агентов. Типы агентов. Способности обучающихся агентов.
- •48.Понятие субагентов, типы субагентов. Свойства автономного агента
- •49.Мультиагентная система (мас). Определение, основные характеристики, классификация мас.
- •50.Методы организации работы в мас. Условия размещения агента на сервере. Операции над агентами. Примеры использования мас.
19. 6 Дополнительных правил Кодда. Группы правил.
1.Многомерность
2.Прозрачность.
3.Доступность.
4.Постоянная производительность при разработке отчета
5.клиент- серверная архитектура
6.равноправие измерений.
7.динамическое управление разряженными матрицами
8.поддержка многопользовательского режима.
9.неограниченные перекрестные операции
10.интуитивная модуляция данными
11.гибкая возможность получения отчета
12.неограниченная размерность и число уровней агрегации
+6
13.пакетное извлечение против интерпретации
14.поддержка всех моделей OLAP анализа
15.обработка ненормализованных данных
16.Сохранение результатов OLAP
17.исключение отсутствующих значений.
18.обработка отсутствующих значений
4 особенности на основе 18 правил
1.группа основных особенностей, к ней относят правило 1,3,10,14,13,,5,2,8
2.специальные особенности:15,16,17,18
3.особенности предст. Отчетов:11,4,7
4.управление измерений:6,12,9
20.Определение olap через 5 ключевых понятий теста fasmi.
Перевод: тест FASMI (Fast Analysis of Shared Multidimensional Information, быстрый анализ разделяемой многомерной информации))
Описание: Определение понятия OLAP в виде пяти критериев (Fast, Analysis, Shared, Multidimensional, Information), которым должны удовлетворять продукты, попадающие в эту категорию. Тест FASMI был разработан в качестве альтернативы известным 18 правилам Кодда (см. OLAP rules), определяющим OLAP-систему. Тест FASMI содержит следующие требования к приложениям для многомерного анализа: предоставление пользователю результатов анализа за приемлемое время (обычно не более 5 с), пусть даже ценой менее детального анализа; возможность осуществления любого логического и статистического анализа, характерного для данного приложения, и его сохранения в доступном для конечного пользователя виде; многопользовательский доступ к данным с поддержкой соответствующих механизмов блокировок и средств авторизованного доступа; многомерное концептуальное представление данных, включая полную поддержку для иерархий и множественных иерархий (это ? ключевое требование OLAP); возможность обращаться к любой нужной информации независимо от ее объема и места хранения.
С лекций!!!!5 ключевых понятий Пендсена и Критом. Был создан тест …..:1.быстрый 5 сек.2.анализ.3.распределенное.4.многомерный.5.информация.
21.Основные подходы к реализации olap, их преимущества и недостатки.
Выделяют 3 подхода реализации:1.MOLAP.2.ROLAP.3.HOLAP
Преимущества MOLAP:1.скорость поиска.2.включение встроенных функций.3.легкое(под вопросом?)минусы:1большой объем данных.2.сложное удаление.3есть еще и третье,но не написал(
Преимущества ROLAP :1.простая реализация.2.легкая изменяемость.3.защищенность
Вместе с базовой концепцией существуют три типа OLAP — OLAP со многими измерениями (Multidimensional OLAP — MOLAP), реляционный OLAP (Relational OLAP — ROLAP) и гибридный OLAP (Hybrid OLAP — HOLAP). MOLAP — это классическая форма OLAP, так что её часто называют просто OLAP. Она использует суммирующую БД, специальный вариант процессора пространственных БД и создаёт требуемую пространственную схему данных с сохранением как базовых данных, так и агрегатов. ROLAP работает напрямую с реляционным хранилищем, факты и таблицы с измерениями хранятся в реляционных таблицах, и для хранения агрегатов создаются дополнительные реляционные таблицы. HOLAP использует реляционные таблицы для хранения базовых данных и многомерные таблицы для агрегатов. Особым случаем ROLAP является ROLAP реального времени (Real-time ROLAP — R-ROLAP). В отличие от ROLAP в R-ROLAP для хранения агрегатов не создаются дополнительные реляционные таблицы, а агрегаты рассчитываются в момент запроса. При этом многомерный запрос к OLAP-системе автоматически преобразуется в SQL-запрос к реляционным данным.
Каждый тип хранения имеет определённые преимущества, хотя есть разногласия в их оценке у разных производителей. MOLAP лучше всего подходит для небольших наборов данных, он быстро рассчитывает агрегаты и возвращает ответы, но при этом генерируются огромные объёмы данных. ROLAP оценивается как более масштабируемое решение, использующее к тому же наименьшее возможное пространство. При этом скорость обработки значительно снижается. HOLAP находится посреди этих двух подходов, он достаточно хорошо масштабируется и быстро обрабатывается. Архитектура R-ROLAP позволяет производить многомерный анализ OLTP-данных в режиме реального времени.
Сложность в применении OLAP состоит в создании запросов, выборе базовых данных и разработке схемы, в результате чего большинство современных продуктов OLAP поставляются вместе с огромным количеством предварительно настроенных запросов. Другая проблема — в базовых данных. Они должны быть полными и непротиворечивыми.
22.Понятие НСИ. Единая система НСИ. 4 группы требований.
НСИ(нормативно-справочная инф-ция) — не элемент ERP-системы, а часть общекорпоративной ИТ-инфраструктуры. От качества и надежности основных данных (т. е. НСИ) во многом зависит и качество собственно управленческой информации. система НСИ предоставляет необходимый сервис всем бизнес- приложениям.
Единая система НСИ – основа сервисно-ориентированной архитектуры.
Требования и принципы построения единой системы НСИ(нормативно справочной информации)
С целью обеспечения использования всеми службами и подразделениями компании унифицированной системы НСИ следует учесть четыре группы требований.
• Методологические — к разработке и внедрению эффективной методологии ведения справочников и классификаторов в рамках единой системы НСИ, к поддержанию данных в актуальном состоянии, обеспечению полноты, устранению ошибок, контролю целостности и непротиворечивости данных.
• Организационные — к единому регламенту использования справочников системы НСИ всеми службами и подразделениями компании и его сопровождения на основе уточненных требований к составу и структуре информации в справочниках.
• Информационные — к составу и структуре информации в системе НСИ, а также к технологии ее ведения (вычистке, пополнению, корректировке).
• Технические — к среде доступа пользователей к НСИ и работы экспертов службы ведения НСИ, к требуемому набору функций и информационных возможностей.