
- •1.Система поддержки принятия решений (сппр), ее основные задачи. Классификация сппр. Схема типичной сппр.
- •2.Сравнительный анализ аналитической и oltp систем.
- •3.Хранилище данных. История возникновения понятия, определение, основные свойства.
- •4.Основные подходы к реализации хранилищ данных.
- •Реализация хранилищ и витрин данных
- •Понятие и суть etl-процесса, основные преобразования данных.
- •Определение качества данных. Методика оценки качества, основанная на 4-х основных показателях.
- •8.Определение качества данных.Уровневая методика оценки качества.
- •11.Повышение качества данных: предварительная замена, классификация, структуризация.
- •12.Повышение качества данных: верификация, нормализация.
- •14.Понятия запроса и объекта запроса. Основные этапы поиска информации. Классификация задачи поиска.
- •15.Особенности решение задачи поиска в структурированных источниках на всех этапах.
- •Методы поиска Адресный поиск
- •Семантический поиск
- •Документальный поиск
- •Фактографический поиск
- •16.Оценка эффективности поисковых инструментов.
- •17. Суть многомерного анализа данных, основные понятия. Возможные операции над гиперкубом. Понятие olap.
- •18. 12 Правил Кодда.
- •19. 6 Дополнительных правил Кодда. Группы правил.
- •20.Определение olap через 5 ключевых понятий теста fasmi.
- •21.Основные подходы к реализации olap, их преимущества и недостатки.
- •23.Единая система нси. Требования идентифицируемости и уникальности, принципы построения.
- •Принципы построения единой системы нси.
- •24. Система нси: 1-3 типовые ошибки.
- •25.Система нси: 4-6 типовые ошибки.
- •26. Система нси: 7-10 типовые ошибки.
- •27.Понятие Data Mining. Дисциплины, использованные при создании Data Mining. Основные действия выполняемые Data Mining. Основные ограничения использования.
- •28.Основные задачи Data Mining. Классификация и кластеризация: суть, сравнительный анализ.
- •29.Основные задачи Data Mining. Поиск ассоциативных правил, прогнозирование, анализ отклонений.
- •30.Определение метода и алгоритма. Классификация стадий Data Mining. Свободный поиск.
- •31.Определение метода и алгоритма. Классификация стадий Data Mining. Прогностическое моделирование.
- •32.Определение метода и алгоритма. Классификация стадий Data Mining. Анализ исключений.
- •33.Основные этапы процесса подготовки к Data Mining. Анализ предметной области, постановка задачи, подготовка данных.
- •34.Понятие Text Mining. Основные этапы.
- •35.Понятие Text Mining. Основные задачи.
- •36. Предварительная обработка данных, основные приемы.
- •38.Oracle Data Mining (odm). Возможности, архитектура, характеристики. Используемые алгоритмы.
- •39.Функциональные возможности odm. Алгоритм Naïve Bayes.
- •40.Функциональные возможности odm. Алгоритм Support Vector Machine.
- •41.Функциональные возможности odm. Алгоритм k-means. Проверка качества кластеризации.
- •Алгоритм k-means.
- •42.Функциональные возможности odm. Алгоритмы Apriori.
- •43.Workflow.(поток работы) Суть, базовые понятия и их взаимосвязь.
- •44.Workflow. Структура системы, основные компоненты и их взаимосвязь.
- •45.Workflow. Условия представления бизнес-процесса как процесса Workflow. Порядок представления бизнес процесса в графическом виде (idef0).
- •49.Категории операций бизнес-процесса. Типовые параметры описания бизнес-процесса. Условия перехода между операциями.
- •46.Типовые цели внедрения проекта Workflow. Цикл управления эксплуатацией и развитием системы.
- •47.Понятие агентов. Типы агентов. Способности обучающихся агентов.
- •48.Понятие субагентов, типы субагентов. Свойства автономного агента
- •49.Мультиагентная система (мас). Определение, основные характеристики, классификация мас.
- •50.Методы организации работы в мас. Условия размещения агента на сервере. Операции над агентами. Примеры использования мас.
27.Понятие Data Mining. Дисциплины, использованные при создании Data Mining. Основные действия выполняемые Data Mining. Основные ограничения использования.
-это процесс обнаружения знаний в сырых данных , ранее неизвестных, нетривиальных, практически полезных и доступных для интерпретации данных, необходимых для принятия решений в различных сферах человеческой деятельности.
-это процесс выделения из данных неявной и неструктурированной инф-ции и представления ее в виде, пригодном для использования.
Дисциплины: алгоритмизация, машинное обучение, теория баз данных, визуализация, распознавание образов, искусственный интеллект
Data miningалгоритм:1.поиск закономерностей.2построение моделей и правил.3прогнозирование.
28.Основные задачи Data Mining. Классификация и кластеризация: суть, сравнительный анализ.
-это процесс обнаружения знаний в сырых данных , ранее неизвестных, нетривиальных, практически полезных и доступных для интерпретации данных, необходимых для принятия решений в различных сферах человеческой деятельности.
Задачи:1.классификация.2класстеризация.3.ассоциации(поиск).4.прогнозирование.5.анализ отклонений.
1.- решает задачи обнаружения признаков, которые образуют группы объектов исследуемого набора данных- классы; по этим признакам любой новый объект можно отнести к тому или иному классу.
2- логическое продолжение идеи классификации. Особенно – классы объектов изначально неопределенны.
Характеристика |
Классификация |
Кластеризация |
Контролируемость обучения |
контролируемо |
неконтролируемо |
Стратегия обучения |
Обучение с учителем |
Обучение без учителя |
Наличие метки класса |
В обучающем множестве у объектов есть метки классов |
Нет меток класса |
Основание для классификации |
Новые данные классифицируются на основании обучающего мн-ва |
Дано мн-во данных с целью установления сущ-я классов или класстеров |
29.Основные задачи Data Mining. Поиск ассоциативных правил, прогнозирование, анализ отклонений.
Задачи:1.классификация.2класстеризация.3.ассоциации(поиск).4.прогнозирование.5.анализ отклонений.
3.- в ходе решения задач поиска ассоциативных правил отыскиваются закономерности между связанными событиями в наборе данных. Поиск закономерностей осуществляется не на основе свойств анализируемого объекта, а между несколькими событиями , которые происходят одновременно. Пример: Банк выпускает кредитные карточки только если они будут максимально востребованы среди определенных клиентов.
4- возможность на основе особенности исторических данных оценить пропущенные или будущие значения целевых численных показателей
5.- цель: обнаружение , анализ данных, наиболее отличающихся от общего мн-ва данных, выявление «нехарактерных шаблонов»
30.Определение метода и алгоритма. Классификация стадий Data Mining. Свободный поиск.
Метод- норма или правило, определенный путь, способ, прием решений задачи теоретического, практического, познавательного, управленческого характера.
Алгоритм- это точное предписание относительно последовательности действий(шагов), преобразующих исходные данные в исполненный результат.
Классификация стадий:1. Выявление закономерностей, их свободный поиск.2.Использование выявленных закономерностей для предсказания неизвестных значений.Валидация- проверка закономерностей.3.Анализ исключений